以下為 PHP 數組的基礎結構,插入,查找和 rehash 過程。
基礎結構:struct _zend_array { zend_refcounted_h gc; union { struct { ZEND_ENDIAN_LOHI_4( zend_uchar flags, zend_uchar nApplyCount, zend_uchar nIteratorsCount, zend_uchar consistency) } v; uint32_t flags; } u; uint32_t nTableMask; // 哈希值計算掩碼,等于nTableSize的負值(nTableMask = -nTableSize) Bucket *arData; // 存儲元素數組,指向第一個Bucket uint32_t nNumUsed; // 已用Bucket數 uint32_t nNumOfElements; // 哈希表有效元素數 = nNumUsed - num(is_undef) uint32_t nTableSize; // 哈希表總大小,為2的n次方, 最小為8 uint32_t nInternalPointer; // 懷疑是內部指針 zend_long nNextFreeElement; // 下一個可用的數值索引 arr[] = 1;arr[ a ] = 2;arr[] = 3; 則nNextFreeElement = 2; dtor_func_t pDestructor;typedef struct _Bucket { zval val; // 存儲的具體html' target='_blank'>value zend_ulong h; // hash value (or numeric index) zend_string *key; // string key or NULL for numerics} Bucket;
說明:
數組存放的時候先按照順序保存 value,再保存 value 的位置。
存放記錄的數組稱做散列表,這個數組用來存儲 value,而 value 按順序保存,其存儲位置會保存在由 key 計算 hash 取模 nTableMask 得到的 idx 中。
數組初始化的時候最小大小為 8,以此為16,32,64。。。
數組初始化的時候邊做的 idx 區會全部初始化為 -1,rehash 的時候也會初始化為 -1。
數組中刪除一個元素的時候,是把該刪除的元素的 type 標記為 is_undef, 并且 nNumOfEmelment - 1,如果該元素為最后一個元素,那么 nNumUsed - 1。
插入:
以 $arr = [ a = 1, b = 2] 為例:
首先把 1 放到數組中,其 val.u2.next = -1, 根據其下標 a 計算 hash, 然后 hash 取模 nTableMask 得到一個 idx, 在該 idx 的位置保存前邊保存 1 的索引 nindex。
再存放 2, 其 val.u2.next = -1, 如果根據其下標 b 計算hash 取模 nTableMask 得到的 idx 中已經有值,那么說明出現了哈希碰撞,這個時候把當前 idx 中的值取出來保存到當前 val.u2.next,把保存 2 的索引 nindex 保存在當前 idx,以此類推。
查找:
根據下標 a 計算 hash 取模 nTableMask 得到一個 idx ,拿到該 idx 中的值 nindex 去 arData 中查找,如果找到的位置中的 key != a, 那么找不到;如果找到的位置中的 key == a,那么檢查其 u2.next, 如果為 -1, 那么找到了;如果不為-1,說明插入的過程中出現了哈希沖突,那么根據 u2.next 繼續在 arData 中查找,直到找到為止。
rehash:
rehash 的時候,首先把 nindex 區的所有記錄全部重置為 -1,然后從第一個元素開始挪動指針 *p,如果元素沒有被標記為 is_undef,那么重新計算該元素的 key hash 并放到 nindex,然后循環, p++。如果元素被標記為 is_undef, 那么繼續挪動指針 p++,并設置一個新的指針 j 指向該位置,繼續循環,把后邊不為 is_undef 的元素一個一個挪到前邊來,p 每次移動,j 遇到 is_undef 就不移動,直到被賦值。一直挪動到最后的 nNunUsed ,那么把 j 賦值給 nNunUsed,之后再插入元素的時候就從這個位置開始插入,以前的元素直接被覆蓋就是了。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。
新聞熱點
疑難解答