Lua語言可研究的東西真是多,各種機制原理:與宿主語言(下文均指C/C++)的交互、內存管理(垃圾回收)、虛擬機實現、協程、閉包、異常捕獲機制等。如取其一進行研究,要吃透還是需要點時間和精力。相信只要一點點慢慢啃,終究還是會將其吸收。
以下的相關原理介紹是基于Lua-5.1.5版本的源碼,不排除與之后版本的源碼中有少部分差異存在,但基本原理應該相同。
lua_State是Lua語言中的一種基本類型,類似TString,Table等,主要用來管理一個lua虛擬機的執行環境,一個lua虛擬機可以有多個執行環境,lua_State最主要的功能就是用于函數調用以及和C/C++的交互。
主要功能包括:
1. 數據棧管理,包括交互過程中參數壓棧和出棧、函數注冊的臨時數據存儲等。
2. 調用棧管理,其中CallInfo結構表示一次調用,包括指向數據棧中數據邊界指針top和base、被調用函數指針func。
3. 全局表l_gt管理,注意:它其實只是在當前lua_State范圍內是全局唯一的,和global_State的l_registry注冊表不同,l_registry是lua虛擬機范圍內是全局唯一的。
4. gc的一些管理和當前棧中upvalue的管理(出現閉包應用場景時)。
5. hook相關的,包括hookmask,hookcount,hook函數等(暫未了解)。
以上1、2點是Lua與C/C++交互時操作最頻繁的步驟,因此整理數據棧和調用棧的操作流程是理解交互的重中之重。
Lua 虛擬機全局狀態的存儲的地方,管理lua虛擬機的全局環境,所有的lua_State共享這個全局狀態,由于Lua被設計為單線程的,所以global_State上的狀態控制沒有考慮多線程問題。主要功能可分為:內存分配策略、全局字符串hashtable管理、注冊表、gc管理、lua_State集合管理、元表管理(暫時尚未知用來干嘛)等。
最后記住一條:一個Lua虛擬機有且只有一個global_State對象,一個進程中允許多個Lua虛擬機同時運行。運行形態例如下圖所示:
Lua的API中提供了宏lua_open()用于啟動一個Lua虛擬機,之所以起了這個名,估計是為了與lua_close()對應,open、close看著就知道明顯是一對。
啟動Lua虛擬機的過程總結成一句話就是:構造global_State、lua_State對象,并初始化。具體包括以下幾個步驟:
1、通過內存分配策略(l_alloc)分配兩個對象(global_State、lua_State)大小的內存空間。
2、初始化lua_State對象,例如:類型設置、數據棧空間分配(45*TValue)、調用??臻g分配(8*CallInfo)等。
3、初始化global_State對象,例如:主lua_State設置、內存分配方法、全局字符串表等。
4、加載所有標準庫到Lua虛擬機執行環境中,實際操作就是將各種庫提供庫函數通過現有的注冊機制注冊到當前lua_State的l_gt中,之后Lua腳本中就可以直接調用注冊過的庫函數。
Lua現在支持的庫有:協程庫、表操作庫、io庫、系統庫、string庫、math庫、debug庫、包處理庫,以string庫為例:
static const luaL_Reg strlib[] =
{
{"byte", str_byte},
{"char", str_char},
{"dump", str_dump},
{"find", str_find},
{"format", str_format},
{"gmatch", gmatch},
{"gsub", str_gsub},
{"len", str_len},
{"lower", str_lower},
{"match", str_match},
{"rep", str_rep},
{"reverse", str_reverse},
{"sub", str_sub},
{"upper", str_upper},
{"pack", str_pack},
{"packsize", str_packsize},
{"unpack", str_unpack},
{NULL, NULL}
};
luaL_register(L, LUA_STRLIBNAME, strlib); //注冊函數
經過以上若干步驟后,lua虛擬機執行環境已準備就緒,宿主語言就可以和lua腳本進行相互調用。
與宿主語言交互時的棧主要涉及兩個,為了方便理解,暫且將它歸納為:DataStack和CallStack,其中棧操作指針變量均是lua_State的成員,DataStack可以理解為交互數據的實際存儲地,而CallStack中記錄著每次調用需要的數據在DataStack中的地址范圍,具體如下:
// DataStack
typedef Tvalue*StkId;
StkId top; /* first free slot in the stack (棧頂指針) */
StkId base; /* base of current function (當前調用幀所在DataStack中的棧底) */
StkIdstack_last; /* last free slot in thestack (??臻g的上邊界) */
StkIdstack; /* stack base (??臻g的下邊界,即棧底)*/
// CallStack
CallInfo*ci; /* call info for current function (當前調用幀)*/
CallInfo *end_ci; /* points after end of ci array (調用??臻g的上邊界)*/
CallInfo*base_ci; /* array of CallInfo's (調用??臻g的下邊界,即棧底)*/
根據以上分類,清楚可知:在Lua和宿主語言交互時,實際就是這些指向棧的指針不停被更新的過程。下圖描述了Lua虛擬機啟動后,兩個棧原始狀態的直觀感覺:
在了解完以上所有前提知識點后,從一次C++調用Lua方法的示例入手理解,逐步深入其中的棧操作過程,調用示例如下:
lua_settop(L,0);
lua_getglobal(L,“lua_Function”); //假設lua腳本中有一個名為lua_Function的方法
if( lua_pcall(L, 0, LUA_MULTERT, 0) )
{
/* 調用錯誤,從(L->top) + index的棧中取出錯誤信息,然后pop掉該棧幀*/
}
else
{
/* 調用正確,從(L->base) +(index – 1)的棧中取出返回信息,然后pop掉該棧幀 */
}
分解步驟:
(1)、lua_settop(L,0): 調整DataStack中top、base兩個指向棧的指針值,使L->top== L->base,指向統一棧幀位置,屬于調用的前期準備。
(2)、lua_getglobal(L,“lua_Function”):獲取lua腳本中被調用方法“lua_Function”,并將其壓入DataStack,此時L->base指向剛入棧棧幀,L->top + 1。檢索“lua_Function”的步驟:
1). 計算“lua_Function”字符串的哈希值,然后與global_state的stringtable中匹配出該哈希值下的所有字符串對象所在的沖突鏈表,遍歷鏈表查詢是否存在“lua_Function”,存在則直接返回值,否則臨時構造TString對象并返回;
2).根據返回的字符串對象從lua_State的l_gt(所有函數的注冊地)中匹配出該函數名對
應的函數對象;
3). 將以上檢索出來的函數對象壓入DataStack。
(3)、如果調用的lua_Function方法有參數,則繼續向DataStack壓棧,L->top+ nArgs,nArgs為參數個數,L->base則繼續指向被調用方法lua_Function所在的棧位置。
(4)、lua_pcall(L,nArgs, LUA_MULTERT, nRets):開始調用lua方法,在到達真正調用那一步前,需要有以下子操作:
1). 計算此前入棧的lua_Function所在棧位置:func=L->top–(nArgs+1),為何不直接
用L->base?
2). 更新L->base的值,L->base = func+ 1;
3). 更新CallStack中指向當前調用棧幀的L->ci,包括: ++ci、ci->base= L->base、
ci->top=L->base+nArgs、ci->func=func、ci->nresults=nresults等;
4). 解釋執行lua_Fucntion函數腳本,該部分涉及Lua虛擬機具體如何實現解釋執
行相關機制,此處暫不作過多說明。只需記住一點,執行過程中會將DataStack之前壓
入的參數逐一彈出。
(5)、步驟(4)中如果出現遞歸調用非C函數(lua腳本函數),則重復步驟(4);如果遞歸調用已注冊的C函數,則會觸發更新L->ci值操作(類似步驟(4)的第二步子操作),然后重復進入步驟(1)開始新的交互流程。
(6)、最后將返回值壓入DataStack中,根據返回值個數逐一將其取出,然后pop掉。
下圖表示Lua和宿主語言進行多層調用時的DataStack和CallStack的狀態圖:
新聞熱點
疑難解答
圖片精選