最近排查一個web服務的問題,webserver使用的nginx,最終發現是踩了nginx中proxy_pass的一個坑,這里記錄下來。
踩坑經過
一個線上的http服務,示例nginx關鍵配置如下:
server { listen 80; server_name ligang.gdemo.com; server_tokens off; keepalive_timeout 5; charset utf-8; include /home/ligang/devspace/gobox-demo/conf/http/general/gzip.conf; access_log logs/ligang.gdemo.com.log combinedio buffer=1k; error_log logs/ligang.gdemo.com.log.err; location / { include /home/ligang/devspace/gobox-demo/conf/http/general/http_proxy.conf; proxy_intercept_errors on; proxy_pass http://ligang.proxy.gdemo.com; }}
這里可以看到,請求 ligang.gdemo.com
時,nginx把請求反向代理到 ligang.proxy.gdemo.com 去做處理。
ligang.proxy.gdemo.com
這個服務在線上部署并解析到了A、B、C這3個機房,現在我想調整解析,去掉C機房,僅留A、B兩個機房。
調整解析后,查看新的解析已經生效,但觀察C機房的請求量,發現和之前一樣,沒有任何變化。
于是我觀察C機房的nginx的log,發現請求來源還是 ligang.gdemo.com
的機器,域名解析調整后nginx那邊依舊使用之前的IP。
于是我將 ligang.gdemo.com
的機器上的nginx全部reload后,C機房的請求終于沒有了。
問題說明
上面的問題,說明在nginx的proxy_pass中如果使用了域名,那么nginx會把解析的結果緩存下來,貌似不會更新,因為上面的例子中,我調整解析后是幾乎是隔了一天去看C機房的log發現流量沒有任何變化的。
這樣的話,如果你配置一個反向代理服務器,如果上游調整了域名,而你又沒有得到通知,那么你的代理服務相當于不可用了。
從代碼中看下nginx是如何解析主機ip的
有點好奇nginx是如何解析主機ip的,所以追蹤下代碼:
proxy_pass指令定義的地方(http/modules/ngx_http_proxy_module.c):
{ ngx_string("proxy_pass"), NGX_HTTP_LOC_CONF|NGX_HTTP_LIF_CONF|NGX_HTTP_LMT_CONF|NGX_CONF_TAKE1, ngx_http_proxy_pass, //處理方法 NGX_HTTP_LOC_CONF_OFFSET, 0, NULL },
ngx_http_proxy_pass方法(http/modules/ngx_http_proxy_module.c):
static char *ngx_http_proxy_pass(ngx_conf_t *cf, ngx_command_t *cmd, void *conf){ ngx_http_proxy_loc_conf_t *plcf = conf; size_t add; u_short port; ngx_str_t *value, *url; ngx_url_t u; ngx_uint_t n; ngx_http_core_loc_conf_t *clcf; ngx_http_script_compile_t sc; ...... url = &value[1]; ...... ngx_memzero(&u, sizeof(ngx_url_t)); u.url.len = url->len - add; u.url.data = url->data + add; u.default_port = port; u.uri_part = 1; u.no_resolve = 1; plcf->upstream.upstream = ngx_http_upstream_add(cf, &u, 0);}
新聞熱點
疑難解答