引用计数是指在value中增加一个字段refcount
记录指向当前value的数量,变量复制、函数传参时并不直接硬拷贝一份value数据,而是将refcount++
,变量销毁时将refcount--
,等到refcount
减为0时表示已经没有变量引用这个value,将它销毁即可。
$a = "time:" . time(); //$a -> zend_string_1(refcount=1)
$b = $a; //$a,$b -> zend_string_1(refcount=2)
$c = $b; //$a,$b,$c -> zend_string_1(refcount=3)
unset($b); //$b = IS_UNDEF $a,$c -> zend_string_1(refcount=2)
引用计数的信息位于给具体value结构的gc中:
typedef struct _zend_refcounted_h {
uint32_t refcount; /* reference counter 32-bit */
union {
struct {
ZEND_ENDIAN_LOHI_3(
zend_uchar type,
zend_uchar flags, /* used for strings & objects */
uint16_t gc_info) /* keeps GC root number (or 0) and color */
} v;
uint32_t type_info;
} u;
} zend_refcounted_h;
从上面的zend_value结构可以看出并不是所有的数据类型都会用到引用计数,long
、double
直接都是硬拷贝,只有value是指针的那几种类型才可能会用到引用计数。
下面再看一个例子:
$a = "hi~";
$b = $a;
猜测一下变量$a/$b
的引用情况。
这个不跟上面的例子一样吗?字符串"hi~"
有$a/$b
两个引用,所以zend_string1(refcount=2)
。但是这是错的,gdb调试发现上面例子zend_string的引用计数为0。这是为什么呢?
$a,$b -> zend_string_1(refcount=0,val="hi~")
事实上并不是所有的PHP变量都会用到引用计数,标量:true/false/double/long/null是硬拷贝自然不需要这种机制,但是除了这几个还有两个特殊的类型也不会用到:interned string(内部字符串,就是上面提到的字符串flag:IS_STR_INTERNED)、immutable array,它们的type是IS_STRING
、IS_ARRAY
,与普通string、array类型相同,那怎么区分一个value是否支持引用计数呢?还记得zval.u1
中那个类型掩码type_flag
吗?正是通过这个字段标识的,这个字段除了标识value是否支持引用计数外还有其它几个标识位,按位分割,注意:type_flag
与zval.value->gc.u.flag
不是一个值。
支持引用计数的value类型其zval.u1.type_flag
包含 (注意是&,不是等于)IS_TYPE_REFCOUNTED
:
#define IS_TYPE_REFCOUNTED (1<<2)
下面具体列下哪些类型会有这个标识:
| type | refcounted |
+----------------+------------+
|simple types | |
|string | Y |
|interned string | |
|array | Y |
|immutable array | |
|object | Y |
|resource | Y |
|reference | Y |
simple types很显然用不到,不再解释,string、array、object、resource、reference有引用计数机制也很容易理解,下面具体解释下另外两个特殊的类型:
$a = "hi~;"
后面的字符串内容是唯一不变的,这些字符串等同于C语言中定义在静态变量区的字符串:char *a = "hi~";
,这些字符串的生命周期为request期间,request完成后会统一销毁释放,自然也就无需在运行期间通过引用计数管理内存。