亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > C++ > 正文

標準C++類string的Copy-On-Write技術

2020-01-26 15:42:46
字體:
來源:轉載
供稿:網友

標準C++類std::string的內存共享和Copy-On-Write技術 陳皓

1、概念
 
Scott Meyers在《More Effective C++》中舉了個例子,不知你是否還記得?在你還在上學的時候,你的父母要你不要看電視,而去復習功課,于是你把自己關在房間里,做出一副正在復習功課的樣子,其實你在干著別的諸如給班上的某位女生寫情書之類的事,而一旦你的父母出來在你房間要檢查你是否在復習時,你才真正撿起課本看書。這就是“拖延戰術”,直到你非要做的時候才去做。

當然,這種事情在現實生活中時往往會出事,但其在編程世界中搖身一變,就成為了最有用的技術,正如C++中的可以隨處聲明變量的特點一樣,Scott Meyers推薦我們,在真正需要一個存儲空間時才去聲明變量(分配內存),這樣會得到程序在運行時最小的內存花銷。執行到那才會去做分配內存這種比較耗時的工作,這會給我們的程序在運行時有比較好的性能。必竟,20%的程序運行了80%的時間。

當然,拖延戰術還并不只是這樣一種類型,這種技術被我們廣泛地應用著,特別是在操作系統當中,當一個程序運行結束時,操作系統并不會急著把其清除出內存,原因是有可能程序還會馬上再運行一次(從磁盤把程序裝入到內存是個很慢的過程),而只有當內存不夠用了,才會把這些還駐留內存的程序清出。

寫時才拷貝(Copy-On-Write)技術,就是編程界“懶惰行為”――拖延戰術的產物。舉個例子,比如我們有個程序要寫文件,不斷地根據網絡傳來的數據寫,如果每一次fwrite或是fprintf都要進行一個磁盤的I/O操作的話,都簡直就是性能上巨大的損失,因此通常的做法是,每次寫文件操作都寫在特定大小的一塊內存中(磁盤緩存),只有當我們關閉文件時,才寫到磁盤上(這就是為什么如果文件不關閉,所寫的東西會丟失的原因)。更有甚者是文件關閉時都不寫磁盤,而一直等到關機或是內存不夠時才寫磁盤,Unix就是這樣一個系統,如果非正常退出,那么數據就會丟失,文件就會損壞。

呵呵,為了性能我們需要冒這樣大的風險,還好我們的程序是不會忙得忘了還有一塊數據需要寫到磁盤上的,所以這種做法,還是很有必要的。

2、標準C++類std::string的Copy-On-Write
 
在我們經常使用的STL標準模板庫中的string類,也是一個具有寫時才拷貝技術的類。C++曾在性能問題上被廣泛地質疑和指責過,為了提高性能,STL中的許多類都采用了Copy-On-Write技術。這種偷懶的行為的確使使用STL的程序有著比較高要性能。

這里,我想從C++類或是設計模式的角度為各位揭開Copy-On-Write技術在string中實現的面紗,以供各位在用C++進行類庫設計時做一點參考。

在講述這項技術之前,我想簡單地說明一下string類內存分配的概念。通過常,string類中必有一個私有成員,其是一個char*,用戶記錄從堆上分配內存的地址,其在構造時分配內存,在析構時釋放內存。因為是從堆上分配內存,所以string類在維護這塊內存上是格外小心的,string類在返回這塊內存地址時,只返回const char*,也就是只讀的,如果你要寫,你只能通過string提供的方法進行數據的改寫。

2.1、特性

由表及里,由感性到理性,我們先來看一看string類的Copy-On-Write的表面特征。讓我們寫下下面的一段程序:

復制代碼 代碼如下:

#include
#include
using namespace std;

main()
{
       string str1 = "hello world";
       string str2 = str1;

       printf ("Sharing the memory:/n");
       printf ("/tstr1's address: %x/n", str1.c_str() );
       printf ("/tstr2's address: %x/n", str2.c_str() );

    str1[1]='q';
       str2[1]='w';

       printf ("After Copy-On-Write:/n");
       printf ("/tstr1's address: %x/n", str1.c_str() );
       printf ("/tstr2's address: %x/n", str2.c_str() );

       return 0;
}


這個程序的意圖就是讓第二個string通過第一個string構造,然后打印出其存放數據的內存地址,然后分別修改str1和str2的內容,再查一下其存放內存的地址。程序的輸出是這樣的(我在VC6.0和g++ 2.95都得到了同樣的結果):
復制代碼 代碼如下:

> g++ -o stringTest stringTest.cpp
> ./stringTest
Sharing the memory:
        str1's address: 343be9
        str2's address: 343be9
After Copy-On-Write:
        str1's address: 3407a9
        str2's address: 343be9


從結果中我們可以看到,在開始的兩個語句后,str1和str2存放數據的地址是一樣的,而在修改內容后,str1的地址發生了變化,而str2的地址還是原來的。從這個例子,我們可以看到string類的Copy-On-Write技術。

2.2、深入

在深入這前,通過上述的演示,我們應該知道在string類中,要實現寫時才拷貝,需要解決兩個問題,一個是內存共享,一個是Copy-On-Wirte,這兩個主題會讓我們產生許多疑問,還是讓我們帶著這樣幾個問題來學習吧:
1、  Copy-On-Write的原理是什么?
2、  string類在什么情況下才共享內存的?
3、  string類在什么情況下觸發寫時才拷貝(Copy-On-Write)?
4、  Copy-On-Write時,發生了什么?
5、  Copy-On-Write的具體實現是怎么樣的?

喔,你說只要看一看STL中stirng的源碼你就可以找到答案了。當然,當然,我也是參考了string的父模板類basic_string的源碼。但是,如果你感到看STL的源碼就好像看機器碼,并嚴重打擊你對C++自信心,乃至產生了自己是否懂C++的疑問,如果你有這樣的感覺,那么還是繼續往下看我的這篇文章吧。

OK,讓我們一個問題一個問題地探討吧,慢慢地所有的技術細節都會浮出水面的。

2.3、Copy-On-Write的原理是什么?

有一定經驗的程序員一定知道,Copy-On-Write一定使用了“引用計數”,是的,必然有一個變量類似于RefCnt。當第一個類構造時,string的構造函數會根據傳入的參數從堆上分配內存,當有其它類需要這塊內存時,這個計數為自動累加,當有類析構時,這個計數會減一,直到最后一個類析構時,此時的RefCnt為1或是0,此時,程序才會真正的Free這塊從堆上分配的內存。

是的,引用計數就是string類中寫時才拷貝的原理!

不過,問題又來了,這個RefCnt該存在在哪里呢?如果存放在string類中,那么每個string的實例都有各自的一套,根本不能共有一個RefCnt,如果是聲明成全局變量,或是靜態成員,那就是所有的string類共享一個了,這也不行,我們需要的是一個“民主和集中”的一個解決方法。這是如何做到的呢?呵呵,人生就是一個糊涂后去探知,知道后和又糊涂的循環過程。別急別急,在后面我會給你一一道來的。

2.3.1、      string類在什么情況下才共享內存的?

這個問題的答案應該是明顯的,根據常理和邏輯,如果一個類要用另一個類的數據,那就可以共享被使用類的內存了。這是很合理的,如果你不用我的,那就不用共享,只有你使用我的,才發生共享。

使用別的類的數據時,無非有兩種情況,1)以別的類構造自己,2)以別的類賦值。第一種情況時會觸發拷貝構造函數,第二種情況會觸發賦值操作符。這兩種情況我們都可以在類中實現其對應的方法。對于第一種情況,只需要在string類的拷貝構造函數中做點處理,讓其引用計數累加;同樣,對于第二種情況,只需要重載string類的賦值操作符,同樣在其中加上一點處理。

 
嘮叨幾句:

1)構造和賦值的差別

對于前面那個例程中的這兩句:
       string str1 = "hello world";
       string str2 = str1;

不要以為有“=”就是賦值操作,其實,這兩條語句等價于:

       string str1 ("hello world");   //調用的是構造函數
       string str2 (str1);   //調用的是拷貝構造函數

如果str2是下面的這樣情況:

string str2;      //調用參數默認為空串的構造函數:string str2(“”);
str2 = str1;     //調用str2的賦值操作:str2.operator=(str1);

2) 另一種情況
       char tmp[]=”hello world”;
     string str1 = tmp;
       string str2 = tmp;
    這種情況下會觸發內存的共享嗎?想當然的,應該要共享。可是根據我們前面所說的共享內存的情況,兩個string類的聲明和初始語句并不符合我前述的兩種情況,所以其并不發生內存共享。而且,C++現有特性也無法讓我們做到對這種情況進行類的內存共享。

 

2.3.2、      string類在什么情況下觸發寫時才拷貝(Copy-On-Write)?

哦,什么時候會發現寫時才拷貝?很顯然,當然是在共享同一塊內存的類發生內容改變時,才會發生Copy-On-Write。比如string類的[]、=、+=、+、操作符賦值,還有一些string類中諸如insert、replace、append等成員函數,包括類的析構時。

修改數據才會觸發Copy-On-Write,不修改當然就不會改啦。這就是托延戰術的真諦,非到要做的時候才去做。

2.3.3、Copy-On-Write時,發生了什么?

我們可能根據那個訪問計數來決定是否需要拷貝,參看下面的代碼:

復制代碼 代碼如下:

If  ( RefCnt>0 ) {
    char* tmp =  (char*) malloc(strlen(_Ptr)+1);
    strcpy(tmp, _Ptr);
    _Ptr = tmp;
}


上面的代碼是一個假想的拷貝方法,如果有別的類在引用(檢查引用計數來獲知)這塊內存,那么就需要把更改類進行“拷貝”這個動作。

我們可以把這個拷的運行封裝成一個函數,供那些改變內容的成員函數使用。

2.3.4、      Copy-On-Write的具體實現是怎么樣的?

最后的這個問題,我們主要解決的是那個“民主集中”的難題。請先看下面的代碼:

復制代碼 代碼如下:

string h1 = “hello”;
string h2= h1;
string h3;
h3 = h2;

string w1 = “world”;
string w2(“”);
w2=w1;


很明顯,我們要讓h1、h2、h3共享同一塊內存,讓w1、w2共享同一塊內存。因為,在h1、h2、h3中,我們要維護一個引用計數,在w1、w2中我們又要維護一個引用計數。

如何使用一個巧妙的方法產生這兩個引用計數呢?我們想到了string類的內存是在堆上動態分配的,既然共享內存的各個類指向的是同一個內存區,我們為什么不在這塊區上多分配一點空間來存放這個引用計數呢?這樣一來,所有共享一塊內存區的類都有同樣的一個引用計數,而這個變量的地址既然是在共享區上的,那么所有共享這塊內存的類都可以訪問到,也就知道這塊內存的引用者有多少了。

請看下圖:



于是,有了這樣一個機制,每當我們為string分配內存時,我們總是要多分配一個空間用來存放這個引用計數的值,只要發生拷貝構造可是賦值時,這個內存的值就會加一。而在內容修改時,string類為查看這個引用計數是否為0,如果不為零,表示有人在共享這塊內存,那么自己需要先做一份拷貝,然后把引用計數減去一,再把數據拷貝過來。下面的幾個程序片段說明了這兩個動作:

復制代碼 代碼如下:

   //構造函數(分存內存)
    string::string(const char* tmp)
{
    _Len = strlen(tmp);
    _Ptr = new char[_Len+1+1];
    strcpy( _Ptr, tmp );
    _Ptr[_Len+1]=0;  // 設置引用計數  
}

//拷貝構造(共享內存)
    string::string(const string& str)
    {
if (*this != str){
     this->_Ptr = str.c_str();   //共享內存
     this->_Len = str.szie();
     this->_Ptr[_Len+1] ++;  //引用計數加一
}
}

//寫時才拷貝Copy-On-Write
char& string::operator[](unsigned int idx)
{
    if (idx > _Len || _Ptr == 0 ) {
static char nullchar = 0;
return nullchar;
 }

_Ptr[_Len+1]--;   //引用計數減一
    char* tmp = new char[_Len+1+1];
    strncpy( tmp, _Ptr, _Len+1);
    _Ptr = tmp;
    _Ptr[_Len+1]=0; // 設置新的共享內存的引用計數

    return _Ptr[idx];
}

//析構函數的一些處理
~string()

_Ptr[_Len+1]--;   //引用計數減一

// 引用計數為0時,釋放內存
    if (_Ptr[_Len+1]==0) {
        delete[] _Ptr;
}
}


哈哈,整個技術細節完全浮出水面。

不過,這和STL中basic_string的實現細節還有一點點差別,在你打開STL的源碼時,你會發現其取引用計數是通過這樣的訪問:_Ptr[-1],標準庫中,把這個引用計數的內存分配在了前面(我給出來的代碼是把引用計數分配以了后面,這很不好),分配在前的好處是當string的長度擴展時,只需要在后面擴展其內存,而不需要移動引用計數的內存存放位置,這又節省了一點時間。

STL中的string的內存結構就像我前面畫的那個圖一樣,_Ptr指著是數據區,而RefCnt則在_Ptr-1 或是 _Ptr[-1]處。

 
2.4、臭蟲Bug

是誰說的“有太陽的地方就會有黑暗”?或許我們中的許多人都很迷信標準的東西,認為其是久經考驗,不可能出錯的。呵呵,千萬不要有這種迷信,因為任何設計再好,編碼再好的代碼在某一特定的情況下都會有Bug,STL同樣如此,string類的這個共享內存/寫時才拷貝技術也不例外,而且這個Bug或許還會讓你的整個程序crash掉!

不信?!那么讓我們來看一個測試案例:

假設有一個動態鏈接庫(叫myNet.dll或myNet.so)中有這樣一個函數返回的是string類:

復制代碼 代碼如下:

string GetIPAddress(string hostname)
{
    static string ip;
    ……
    ……
    return ip;
}


而你的主程序中動態地載入這個動態鏈接庫,并調用其中的這個函數:

復制代碼 代碼如下:

main()
{
//載入動態鏈接庫中的函數
hDll = LoadLibraray(…..);
pFun =  GetModule(hDll, “GetIPAddress”);

//調用動態鏈接庫中的函數
string ip = (*pFun)(“host1”);
……
……
//釋放動態鏈接庫
FreeLibrary(hDll);
……
cout << ip << endl;
}


讓我們來看看這段代碼,程序以動態方式載入動態鏈接庫中的函數,然后以函數指針的方式調用動態鏈接庫中的函數,并把返回值放在一個string類中,然后釋放了這個動態鏈接庫。釋放后,輸入ip的內容。

根據函數的定義,我們知道函數是“值返回”的,所以,函數返回時,一定會調用拷貝構造函數,又根據string類的內存共享機制,在主程序中變量ip是和函數內部的那個靜態string變量共享內存(這塊內存區是在動態鏈接庫的地址空間的)。而我們假設在整個主程序中都沒有對ip的值進行修改過。那么在當主程序釋放了動態鏈接庫后,那個共享的內存區也隨之釋放。所以,以后對ip的訪問,必然做造成內存地址訪問非法,造成程序crash。即使你在以后沒有使用到ip這個變量,那么在主程序退出時也會發生內存訪問異常,因為程序退出時,ip會析構,在析構時就會發生內存訪問異常。

內存訪問異常,意味著兩件事:1)無論你的程序再漂亮,都會因為這個錯誤變得暗淡無光,你的聲譽也會因為這個錯誤受到損失。2)未來的一段時間,你會被這個系統級錯誤所煎熬(在C++世界中,找到并排除這種內存錯誤并不是一件容易的事情)。這是C/C++程序員永遠的心頭之痛,千里之堤,潰于蟻穴。而如果你不清楚string類的這種特征,在成千上萬行代碼中找這樣一個內存異常,簡直就是一場噩夢。

備注:要改正上述的Bug,有很多種方法,這里提供一種僅供參考:
string ip = (*pFun)(“host1”).cstr();

3、    后記

文章到這里也應該結束了,這篇文章的主要有以下幾個目的:

1)    向大家介紹一下寫時才拷貝/內存共享這種技術。
2)    以STL中的string類為例,向大家介紹了一種設計模式。
3)    在C++世界中,無論你的設計怎么精巧,代碼怎么穩固,都難以照顧到所有的情況。智能指針更是一個典型的例子,無論你怎么設計,都會有非常嚴重的BUG。
4)    C++是一把雙刃劍,只有了解了原理,你才能更好的使用C++。否則,必將引火燒身。如果你在設計和使用類庫時有一種“玩C++就像玩火,必須千萬小心”的感覺,那么你就入門了,等你能把這股“火”控制的得心應手時,那才是學成了。

最后,還是利用這個后序,介紹一下自己。我目前從事于所有Unix平臺下的軟件研發,主要是做系統級的產品軟件研發,對于下一代的計算機革命――網格計算非常地感興趣,同于對于分布式計算、P2P、Web Service、J2EE技術方向也很感興趣,另外,對于項目實施、團隊管理、項目管理也小有心得,希望同樣和我戰斗在“技術和管理并重”的陣線上的年輕一代,能夠和我多多地交流。我的MSN和郵件是:haoel@hotmail.com。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
日本成人精品在线| 欧美久久精品一级黑人c片| 亚洲天堂成人在线| 欧美激情2020午夜免费观看| 在线视频欧美日韩| 日韩精品在线观看视频| 欧美激情一区二区三区在线视频观看| 亚洲精品久久视频| 精品爽片免费看久久| 亚洲精品电影网在线观看| 欧美最顶级的aⅴ艳星| 91免费看国产| 久久影院资源网| 欧美亚洲另类激情另类| 国产精品亚洲欧美导航| 最新日韩中文字幕| www.久久久久久.com| 国产成人综合精品在线| 国产日韩在线视频| 久久成人综合视频| 亚洲天堂开心观看| 国产精品综合不卡av| 久久九九有精品国产23| 精品视频—区二区三区免费| 国产成人精品一区二区在线| 最近2019中文免费高清视频观看www99| 久久影视电视剧凤归四时歌| 国产免费久久av| 97视频在线观看亚洲| 国产日韩在线观看av| 久久精品一偷一偷国产| 精品国产拍在线观看| 久久男人资源视频| 亚洲一级黄色av| 97精品视频在线观看| 在线亚洲欧美视频| 久久影院免费观看| 中日韩美女免费视频网址在线观看| 欧美理论电影在线观看| 亚洲aⅴ日韩av电影在线观看| 日韩精品久久久久| 国产欧美一区二区三区四区| 亚洲综合在线中文字幕| 91网站在线免费观看| 91久久久久久久久久久久久| 亚洲性生活视频| 欧美电影免费观看高清完整| 亚洲激情视频网站| 尤物九九久久国产精品的特点| 深夜福利亚洲导航| 成人在线中文字幕| 国产精品无av码在线观看| 久久影院资源网| 777国产偷窥盗摄精品视频| 国内精品美女av在线播放| 国产精自产拍久久久久久| 久久精品国产久精国产思思| 欧美午夜女人视频在线| 色哟哟亚洲精品一区二区| 中文字幕在线亚洲| 色综合影院在线| 成人午夜小视频| 91av在线精品| 久久成人综合视频| 91九色综合久久| 国产精品嫩草影院久久久| 亚洲精品www久久久| 91精品国产综合久久香蕉的用户体验| 久99久在线视频| 欧美性极品少妇精品网站| 日本三级久久久| 亚洲欧美综合精品久久成人| 欧美在线观看视频| 国产一区二区三区在线播放免费观看| 成人在线播放av| 亚洲综合成人婷婷小说| 色偷偷噜噜噜亚洲男人| 黄色一区二区在线| 在线看福利67194| 亚洲精品资源美女情侣酒店| 亚洲精品久久久久中文字幕二区| 欧美一区二区三区免费视| 欧美日韩国产一区在线| 成人福利网站在线观看11| 国产va免费精品高清在线| 国产成人jvid在线播放| 欧美一级片一区| 狠狠色噜噜狠狠狠狠97| 亚洲91av视频| 久久久久久91香蕉国产| 国产精品va在线播放| 高清欧美性猛交xxxx| 欧美黄色小视频| 人人爽久久涩噜噜噜网站| 日韩成人在线视频网站| 亚洲精品一区中文字幕乱码| 亚洲精品乱码久久久久久金桔影视| 亚洲国产成人精品久久久国产成人一区| 亚洲精品999| 欧美插天视频在线播放| 亚洲美女激情视频| 日本久久久久亚洲中字幕| 欧美激情免费视频| 欧美日韩国产精品| 亚洲精品自拍视频| 激情成人中文字幕| 一区二区亚洲精品国产| 国产精品久久久久久久久久久久久| 国产日韩精品在线播放| 国产一区二区欧美日韩| 亚洲国产精品va在看黑人| 中文字幕成人在线| 亚洲老板91色精品久久| 久久久久久久久久婷婷| 91精品视频观看| 国产不卡精品视男人的天堂| 欧美亚洲国产日韩2020| 国产精品欧美一区二区| 91精品久久久久久综合乱菊| 国产成人亚洲综合| 91在线视频精品| 国产精品视频精品视频| 亚洲精品456在线播放狼人| 亚洲人成在线观| 欧美专区中文字幕| 亚洲精品国产精品久久清纯直播| 中文字幕亚洲天堂| 黑人巨大精品欧美一区二区一视频| 91在线高清视频| 91国产视频在线| 成人性生交xxxxx网站| 日韩国产高清视频在线| 成人性生交大片免费观看嘿嘿视频| 国产一区二区动漫| 88国产精品欧美一区二区三区| 国产精品劲爆视频| 欧美性猛交xxxx乱大交3| 亚洲美女激情视频| 91色在线视频| 色噜噜久久综合伊人一本| 国产精品亚洲综合天堂夜夜| 欧美日韩国产123| 亚洲aaaaaa| 亚洲欧洲一区二区三区久久| 日韩av在线天堂网| 国产精品丝袜久久久久久高清| 一本色道久久综合亚洲精品小说| 国产精品毛片a∨一区二区三区|国| 国产一区二区黄| 成人观看高清在线观看免费| 亚洲第一免费网站| 成人性生交xxxxx网站| 欧美黑人性生活视频| 国产精品一区二区三区在线播放| 国产精品美女www爽爽爽视频| 亚洲最大福利网站| 亚洲一区二区三区四区在线播放| 亚洲精品久久久久久久久久久久久| 国产成人精品电影| 欧美激情免费在线| 亚洲最大激情中文字幕| 亚洲欧美日韩中文在线制服| 欧美猛交免费看| 国产香蕉97碰碰久久人人|