Nginx 多 worker 预监听端口时 reload 过慢

背景

在 Nginx 1.15.10 版本之后，引入了 listen port1-port2 监听范围端口的语法，可以方便的在一个 server 块同时监听多个端口，如下所示：

worker_processes  128;
 ........      
 server {
    listen  127.0.0.1:2000-5000 backlog=20480 ssl reuseport;
    listen  6000-8000;   
..........

这样就可以在 127.0.0.1 这个IP下同时监听 2000 到 5000 这范围内所有端口；同时在一个 server 块下，可以同时配置多条 listen 语句。

问题

之前在基于定制 Nginx 的项目需要，预先监听必定数量的端口，尽可能不触发 nginx reload 过程。在测试环境下，按如下配置时, 即开启 128 worker 预监听 3000 多个端口，reload 过程超级慢（而刚启动时速度很迅速），预计达到 7 min 左右。

分析

通过在 ngx_init_cycle 函数里面手动插入日志分析发现，reload 卡在从 old_cycle->listening 中监听描述符 fd 复用到新的 cycle->listening 这段逻辑里面

  if (old_cycle->listening.nelts) {
        ls = old_cycle->listening.elts;
        for (i = 0; i < old_cycle->listening.nelts; i++) {
            tmp = *(struct sockaddr_in *)ls[i].sockaddr;
                        // 调试加入日志
            ngx_log_error(NGX_LOG_NOTICE, old_cycle->log, 0, "================> listening addr_text: %s:%d, fd: %d, worker: %d",
                inet_ntoa(tmp.sin_addr), ntohs(tmp.sin_port), ls[i].fd, ls[i].worker);
            ls[i].remain = 0;
        }

        nls = cycle->listening.elts;
                // 调试加入日志
        ngx_log_error(NGX_LOG_NOTICE, cycle->log, 0, "====================> cycle->listening.nelts: %d, old_cycle->listening.nelts: %d", cycle->listening.nelts, old_cycle->listening.nelts);
        for (n = 0; n < cycle->listening.nelts; n++) {

            tmp = *(struct sockaddr_in *)nls[n].sockaddr;
                        // 调试加入日志
            ngx_log_error(NGX_LOG_NOTICE, cycle->log, 0, "================> listening addr_text: %s:%d, fd: %d, worker: %d",
                inet_ntoa(tmp.sin_addr), ntohs(tmp.sin_port), nls[n].fd, ls[i].worker);

            for (i = 0; i < old_cycle->listening.nelts; i++) {
                if (ls[i].ignore) {
                    continue;
                }

                if (ls[i].remain) {
                    continue;
                }

                if (ls[i].type != nls[n].type) {
                    continue;
                }

                if (ngx_cmp_sockaddr(nls[n].sockaddr, nls[n].socklen,
                                     ls[i].sockaddr, ls[i].socklen, 1)
                    == NGX_OK)
                {
                    nls[n].fd = ls[i].fd;
                    nls[n].previous = &ls[i];
                    ls[i].remain = 1;

                    if (ls[i].backlog != nls[n].backlog) {
                        nls[n].listen = 1;
                    }

.................................

从 12 行代码开始有两个 for 循环用于查找对应的 listening 配置，查找算法为 O(n**2). 目前 worker_processes 设置为 50，listen 范围改成 2000-3000 个端口测试一下