在javascript中,我們應該盡可能的用局部變量來代替全局變量,這句話所有人都知道,可是這句話是誰先說的?為什么要這么做?有什么根據么?不這么做,對性能到底能帶來多大的損失?本文就來探討這些問題的答案,從根本上了解變量的讀寫性能都和哪些因素有關。
著作權聲明
本文譯自 nicholas c. zakas 于2009年2月10日在個人網站上發表的《javascript variable performance》。原文是唯一的正式版,本文是經過原作者(nicholas c. zakas)授權的簡體中文翻譯版(simplified chinese translation)。譯者(明達)在翻譯的準確性上做了大量的努力,并承諾譯文的內容完全忠于原文,但可能還是包含疏漏和不妥之處,歡迎大家指正。譯注的內容是非正式的,僅代表譯者個人觀點。
以下是對原文的翻譯:
在如何提高javascript性能這個問題上,大家最常聽到的建議應該就是盡量使用局部變量(local variables)來代替全局變量(global variables)。在我從事web開發工作的九年時間里,這條建議始終縈繞在我的耳邊,并且從來沒有質疑過,而這條建議的基礎,則來自于 javascript處理作用域(scoping)和標識符解析(identifier resolution)的方法。
首先我們要明確,函數在javascript中具體表現為對象,創建一個函數的過程,其實也就是創建一個對象的過程。每個函數對象都有一個叫做 [[scope]]的內部屬性,這個內部屬性包含創建函數時的作用域信息。實際上,[[scope]]屬性對應的是一個對象(variable objects)列表,列表中的對象是可以從函數內部訪問的。比如說我們建立一個全局函數a,那么a的[[scope]]內部屬性中只包含一個全局對象(global object),而如果我們在a中創建一個新的函數b,那么b的[[scope]]屬性中就包含兩個對象,函數a的activation object對象在前面,全局對象(global object)排在后面。
當一個函數被執行的時候,會自動創建一個可以執行的對象(execution object),并同時綁定一個作用域鏈(scope chain)。作用域鏈會通過下面兩個步驟來建立,用于進行標識符解析。
在執行javascript代碼的過程中,當遇到一個標識符,就會根據標識符的名稱,在執行上下文(execution context)的作用域鏈中進行搜索。從作用域鏈的第一個對象(該函數的activation object對象)開始,如果沒有找到,就搜索作用域鏈中的下一個對象,如此往復,直到找到了標識符的定義。如果在搜索完作用域中的最后一個對象,也就是全局對象(global object)以后也沒有找到,則會拋出一個錯誤,提示用戶該變量未定義(undefined)。這是在ecma-262標準中描述的函數執行模型和標識符解析(identifier resolution)的過程,事實證明,大部分的javascript引擎確實也是這樣實現的。需要注意的是,ecma-262并沒有強制要求采用這種結構,只是對這部分功能加以描述而已。
了解標識符解析(identifier resolution)的過程以后,我們就能明白為什么局部變量的解析速度要比其他作用域的變量快,主要是由于搜索過程被大幅縮短了。但是,具體會快多少呢?為了回答這個問題,我模擬了一系列的測試,來測試不同作用域深度中變量的性能。
第一個測試是向一個變量中寫入一個最簡單的值(這里使用字面量的數值1),結果如下圖顯示,很有趣:
從結果中不難看出,當標識符解析的過程需要進行深度搜索時,會伴隨性能損失,而且性能損失的程度會隨著標識符深度的增加而遞增。意料之中的是,internet explorer表現的是最差的(但公平的說,ie 8還是有一些改善的)。值得注意的是,這里有一些例外情況,google chrome和最新的webkit午夜版在訪問變量的時間保持得很穩定,不會隨著作用域深度的遞增而增長。當然,這應該歸功于它們所使用的下一代 javascript引擎,v8和squirrelfish。這些引擎在執行代碼時進行了優化,而且很明顯,這些優化使訪問變量的速度比以往更快。 opera表現的也很不錯,比ie、firefox和當前版本的safari要快的多,但比基于v8和squirrelfish的瀏覽器要慢。 firefox 3.1 beta 2的表現有點出人意料,對于局部變量執行的效率非常高,但隨著作用域層數的增加,效率便大打折扣。需要注意的是,我這里使用的都是默認設置,也就是說 firefox是沒有開啟trace功能的。
上面的結果是通過對變量執行寫操作而得出的,其實我很好奇,讀取變量時的情況會不會有什么不同,于是接著做了下面的測試。結果發現,讀的速度要比寫的速度快一些,但是性能變化的趨勢是一致的。
和上個測試一樣,internet explorer和firefox還是最慢的,opera表現了非常搶眼的性能,而同樣的,chrome和最新版本的webkit午夜版顯示了和作用域深度無關的性能趨勢,同樣需要注意的是,firefox 3.1 beta 2的變量訪問時間還是會伴隨著深度出現一個奇怪的跳躍。
在測試的過程中,我發現一個有趣的現象,就是chrome在訪問全局變量的時候會有額外的性能損失。訪問全局變量的時間和作用域層數沒有關系,但是會比訪問同樣層數的局部變量的時間多出50%。
這兩個測試可以給我們帶來什么啟示呢?首先是驗證了那個古老的觀點,就是要盡可能的使用局部變量。在所有的瀏覽器下,訪問局部變量都比訪問跨作用域的變量要快,當然也包括全局變量。下面這幾點應該是通過這個測試得出的經驗吧:
如果你想圍繞這個話題展開更多的討論,我在上個月的 mountain view javascript meetup 中曾經發表了一個小演講??梢栽趕lideshare上下載 幻燈片,或者觀看聚會的 完整視頻,我的演講大概從11分鐘左右時開始。
譯者筆記
大家如果在閱讀本文的過程中,有什么疑惑,建議延伸閱讀以下兩篇文章:
新聞熱點
疑難解答