淺談Linux環境下并發編程中C語言fork()函數的使用

2020-01-26 14:32:37

字體：大中小

來源：轉載

供稿：網友

由fork創建的新進程被稱為子進程（child process）。fork函數被調用一次，但返回兩次。子進程的返回值是0，而父進程的返回值則是新進程的進程ID。將子進程ID返回給父進程的理由是：因為一個進程的子進程可以有多個，并且沒有一個函數使一個進程可以獲得其所有子進程的進程ID。fork使子進程得到返回值0的理由是：一個進程只會有一個父進程，所以子進程總是可以調用getpid以獲得其父進程的進程ID。
使fork失敗的兩個主要原因是：系統中已經有了太多的進程，或者該實際用戶ID的進程總數超過了系統限制。

fork有下面兩種用法：

（1）一個父進程希望復制自己，使父、子進程同時執行不同的代碼段。這在網絡服務進程中是常見的--父進程等待客戶端的服務請求。當這種請求到達時，父進程調用fork，使子進程處理此請求。父進程則繼續等待下一個服務請求到達。

（2）一個進程要執行一個不同的程序。這對shell是常見的情況。子進程從fork返回后立即調用exec。

歸結起來說就是是實現多線程。C語言多線程實現需要自己控制來實現，這個比Java要復雜。

注意：fork確實創建了一個子進程并完全復制父進程，但是子進程是從fork后面那個指令開始執行的。對于原因也很合乎邏輯，如果子進程也從main開頭到尾執行所有指令，那么它執行到fork指令時也必定會創建一個子子進程，子子孫孫無窮盡也，如此下去，這個小小的程序就可以創建無數多個進程可以把你的電腦搞癱瘓，所以fork作者肯定不會這么做。

原來剛剛開始做Linux下面的多進程編程的時候，對于下面這段代碼感到很奇怪，

#include<unistd.h>#include<stdio.h>#include<string.h>#include<stdlib.h>#include<stdarg.h>#include<errno.h>#define LEN 2void err_exit(char *fmt,...);int main(int argc,char *argv[]){  pid_t pid;  int loop;  for(loop=0;loop<LEN;loop++)  {  if((pid=fork()) < 0)    err_exit("[fork:%d]: ",loop);  else if(pid == 0)  {   printf("Child process/n");   }  else  {    sleep(5);  }  }  return 0;}

為什么這段程序會創建3個子進程，而不是兩個，為什么在第20行后面加上一個return 0;就創建的又是兩個子進程了？原來一直搞不明白，后來了解了C語言程序的存儲空間布局以及在fork之后父子進程是共享正文段(代碼段CS)之后才明白這其中的緣由！具體原理是啥，且容我慢慢道來！

首先得明白一個東西就是C程序的存儲空間布局，如下圖所示：

2016622160156132.png (338×322)

當一個C程序執行之后，它會被加載到內存之中，它在內存中的布局如上圖，分為這么幾個部分，環境變量和命令行參數、棧、堆、數據段（初始化和未初始化的）、正文段，下面挨個來說明這幾段分別代表了什么：

環境變量和命令行參數：這些指的就是Unix系統上的環境變量(比如$PATH)和傳給main函數的參數(argv指針所指向的內容)。

數據段：這個是指在C程序中定義的全局變量，如果沒有初始化，那么就存放在未初始化的數據段中，程序運行時統一由exec賦值為0。否則就存放在初始化的數據段中，程序運行時由exec統一從程序文件中讀取。（了解匯編的朋友們想必知道匯編語言中的數據段DS，這和匯編中的數據段其實是一個東西）。

堆：這一部分主要用來動態分配空間。比如在C語言中用malloc申請的空間就是在這個區域申請的。

正文段：C語言代碼并不是直接執行的，而是被編譯成了機器指令才能夠在電腦上執行，最終生成的機器指令就是存放在這個區域（匯編中的代碼段CS指的就是這片區域）。

棧：個人感覺這是C程序內存布局最關鍵的部分了。這個部分主要用來做函數調用。具體而言怎么說呢，程序剛開始棧中只有main這一個函數的內容（即main的棧幀），如果main函數要調用func函數，那么func函數的返回地址(main函數的地址)，func函數的參數，func函數中定義的局部變量，還有func函數的返回值等等這些都會被壓入棧中，這時棧中就多了func函數的內容（func的棧幀）。然后func函數運行完了之后再來彈棧，把它原來壓的內容去掉（即清除掉func棧幀），此時棧中又只剩下了main的棧幀。（這片區域就是匯編中的棧段SS）

OK，這就是C程序的存儲器布局。這里我聯想到另外一點，就是全局變量和靜態變量是存儲在數據段中的，而局部變量是存儲在棧中的，棧中數據在函數調用完之后一彈棧就沒了，這就是為什么全局變量的生存周期比局部變量的生存周期要長的原因。

了解了C程序在存儲器的布局之后，我們再來了解fork的內存復制機制，關于這個，我們只需要了解一句話就夠了，“子進程復制父進程的數據空間(數據段)、棧和堆，父、子進程共享正文段。”也就是說，對于程序中的數據，子進程要復制一份，但是對于指令，子進程并不復制而是和父進程共享。具體來看下面這段代碼（這是我在上面那段代碼上稍微添加了一點東西）：

/* 這個程序會創建3個子進程，理解這句話，父子進程復制數據段、棧、堆，共享正文段 * */#include<unistd.h>#include<stdio.h>#include<string.h>#include<stdlib.h>#include<stdarg.h>#include<errno.h>#define BUFSIZE 512#define LEN 2void err_exit(char *fmt,...);int main(int argc,char *argv[]){  pid_t pid;  int loop;  for(loop=0;loop<LEN;loop++)  {  printf("Now is No.%d loop:/n",loop);  if((pid=fork()) < 0)    err_exit("[fork:%d]: ",loop);  else if(pid == 0)  {   printf("[Child process]P:%d C:%d/n",getpid(),getppid());   }  else  {    sleep(5);  }  }  return 0;}

為什么上面那段代碼會創建三個子進程？我們來具體分析一下它的執行過程：

首先父進程執行循環，通過fork創建一個子進程，然后sleep5秒。

再來看父進程創建的這個子進程，這里我們記為子進程1.子進程1完全復制了這個父進程的數據部分，但是需要注意的是它的正文段是和父進程共享的。也就是說，子進程1開始執行代碼的部分并不是從main的 { 開始執行的，而是主函數執行到哪里了，它就接著執行，具體而言就是它會執行fork后面的代碼。所以子進程1首先會打印出它的ID和它的父進程的ID。然后繼續第二遍循環，然后這個子進程1再來創建一個子進程，我們記為子進程11，子進程1開始sleep。

子進程11接著子進程1執行的代碼開始執行(即fork后面)，它也是打印出它的ID和父進程ID（子進程1），然后此時loop的值再加1就等于2了，所以子進程2直接就返回了。

那個子進程1sleep完了之后也是loop的值加1之后變成了2，所以子進程1也返回了！

然后我們再返回去看父進程，它僅僅循環了一次，sleep完之后再來進行第二次循環，這次又創建了一個子進程我們記為子進程2。然后父進程開始sleep，sleep完了之后也結束了。

那么那個子進程2怎么樣了呢？它從fork后開始執行，此時loop等于1，它打印完它的ID和父進程ID之后，就結束循環了，整個子進程2就直接結束了！

這就是上面那段代碼的運行流程，進程間的關系如下圖所示：

2016622160234992.png (645×436)