Nginx,永远滴神!

51CTO技术栈

420篇原创内容
公众号

Nginx 以其高性能,稳定性,丰富的功能,简单的配置和低资源消耗而闻名。这几年,Nginx 逐渐成为国内使用最广泛的 Web 服务器,无论是创业公司还是一线大厂都在用。本文为大家讲解 Nginx 架构原理!

图片来自 Pexels

Nginx 基础架构

Nginx 启动后以 daemon 形式在后台运行,后台进程包含一个 master 进程和多个 worker 进程。

如下图所示:

master 与 worker

Nginx 是由一个 master 管理进程,多个 worker 进程处理工作的多进程模型。

基础架构设计,如下图所示:

基础架构设计

master 负责管理 worker 进程,worker 进程负责处理网络事件。整个框架被设计为一种依赖事件驱动、异步、非阻塞的模式。

如此设计的优点:

  • 可以充分利用多核机器,增强并发处理能力。

  • 多 worker 间可以实现负载均衡。

  • Master 监控并统一管理 worker 行为。在 worker 异常后,可以主动拉起 worker 进程,从而提升了系统的可靠性。

    并且由 Master 进程控制服务运行中的程序升级、配置项修改等操作,从而增强了整体的动态可扩展与热更的能力。

Master 进程

①核心逻辑

master 进程的主逻辑在 ngx_master_process_cycle,核心关注源码:
ngx_master_process_cycle(ngx_cycle_t *cycle)
{
    ...
    ngx_start_worker_processes(cycle, ccf->worker_processes,
                                        NGX_PROCESS_RESPAWN);
    ...

for ( ;; ) {
        if (delay) {...}

ngx_log_debug0(NGX_LOG_DEBUG_EVENT, cycle->log, 0, 'sigsuspend');

sigsuspend(&set);

ngx_time_update();

ngx_log_debug1(NGX_LOG_DEBUG_EVENT, cycle->log, 0,
                             'wake up, sigio %i', sigio);

if (ngx_reap) {
            ngx_reap = 0;
            ngx_log_debug0(NGX_LOG_DEBUG_EVENT, cycle->log, 0, 'reap children');
            live = ngx_reap_children(cycle);
        }

if (!live && (ngx_terminate || ngx_quit)) {...}

if (ngx_terminate) {...}

if (ngx_quit) {...}

if (ngx_reconfigure) {...}

if (ngx_restart) {...}

if (ngx_reopen) {...}

if (ngx_change_binary) {...}

if (ngx_noaccept) {
            ngx_noaccept = 0;
            ngx_noaccepting = 1;
            ngx_signal_worker_processes(cycle,
                                                  ngx_signal_value(NGX_SHUTDOWN_SIGNAL));
        }
    }
 }

由上述代码,可以理解,master 进程主要用来管理 worker 进程,具体包括如下 4 个主要功能:

  • 接受来自外界的信号。其中 master 循环中的各项标志位就对应着各种信号,如:ngx_quit 代表 QUIT 信号,表示优雅的关闭整个服务。

  • 向各个 worker 进程发送信。比如 ngx_noaccept 代表 WINCH 信号,表示所有子进程不再接受处理新的连接,由 master 向所有的子进程发送 QUIT 信号量。

  • 监控 worker 进程的运行状态。比如 ngx_reap 代表 CHILD 信号,表示有子进程意外结束,这时需要监控所有子进程的运行状态,主要由 ngx_reap_children 完成。

  • 当 woker 进程退出后(异常情况下),会自动重新启动新的 woker 进程。主要也是在 ngx_reap_children。

②热更

热重载-配置热更:

热重载

Nginx 热更配置时,可以保持运行中平滑更新配置,具体流程如下:

  • 更新 nginx.conf 配置文件,向 master 发送 SIGHUP 信号或执行 nginx -s reload

  • master 进程使用新配置,启动新的 worker 进程

  • 使用旧配置的 worker 进程,不再接受新的连接请求,并在完成已存在的连接后退出

热升级-程序热更:

热升级

Nginx 热升级过程如下:

  • 将旧 Nginx 文件换成新 Nginx 文件(注意备份)

  • 向 master 进程发送 USR2 信号(平滑升级到新版本的 Nginx 程序)

  • master 进程修改 pid 文件号,加后缀 .oldbin

  • master 进程用新 Nginx 文件启动新 master 进程,此时新老 master/worker 同时存在。

  • 向老 master 发送 WINCH 信号,关闭旧 worker 进程,观察新 worker 进程工作情况。

    若升级成功,则向老 master 进程发送 QUIT 信号,关闭老 master 进程;若升级失败,则需要回滚,向老 master 发送 HUP 信号(重读配置文件),向新 master 发送 QUIT 信号,关闭新 master 及 worker。

Worker 进程

①核心逻辑

worker 进程的主逻辑在 ngx_worker_process_cycle,核心关注源码:
ngx_worker_process_cycle(ngx_cycle_t *cycle, void *data){    ngx_int_t worker = (intptr_t) data;

    ngx_process = NGX_PROCESS_WORKER;    ngx_worker = worker;

    ngx_worker_process_init(cycle, worker);

    ngx_setproctitle('worker process');

    for ( ;; ) {

        if (ngx_exiting) {...}

        ngx_log_debug0(NGX_LOG_DEBUG_EVENT, cycle->log, 0, 'worker cycle');

        ngx_process_events_and_timers(cycle);

        if (ngx_terminate) {...}

        if (ngx_quit) {...}

        if (ngx_reopen) {...}    }}

由上述代码,可以理解,worker 进程主要在处理网络事件,通过 ngx_process_events_and_timers 方法实现,其中事件主要包括:网络事件、定时器事件。

②事件驱动-epoll

worker 进程在处理网络事件时,依靠 epoll 模型,来管理并发连接,实现了事件驱动、异步、非阻塞等特性。

如下图所示:

infographic-Inside-NGINX_nonblocking

通常海量并发连接过程中,每一时刻(相对较短的一段时间),往往只需要处理一小部分有事件的连接即活跃连接。

基于以上现象,epoll 通过将连接管理与活跃连接管理进行分离,实现了高效、稳定的网络 IO 处理能力。

网络模型对比

其中,epoll 利用红黑树高效的增删查效率来管理连接,利用一个双向链表来维护活跃连接。

epoll 数据结构

③惊群

由于 worker 都是由 master 进程 fork 产生,所以 worker 都会监听相同端口。

这样多个子进程在 accept 建立连接时会发生争抢,带来著名的“惊群”问题。

worker 核心处理逻辑 ngx_process_events_and_timers 核心代码如下:
void ngx_process_events_and_timers(ngx_cycle_t *cycle){
    //这里面会对监听socket处理
    ...

if (ngx_accept_disabled > 0) {
            ngx_accept_disabled--;
    } else {
        //获得锁则加入wait集合,
        if (ngx_trylock_accept_mutex(cycle) == NGX_ERROR) {
            return;
        }
        ...
        //设置网络读写事件延迟处理标志,即在释放锁后处理
        if (ngx_accept_mutex_held) {
            flags |= NGX_POST_EVENTS;
        }
    }
    ...
    //这里面epollwait等待网络事件
    //网络连接事件,放入ngx_posted_accept_events队列
    //网络读写事件,放入ngx_posted_events队列
    (void) ngx_process_events(cycle, timer, flags);
    ...
    //先处理网络连接事件,只有获取到锁,这里才会有连接事件
    ngx_event_process_posted(cycle, &ngx_posted_accept_events);
    //释放锁,让其他进程也能够拿到
    if (ngx_accept_mutex_held) {
        ngx_shmtx_unlock(&ngx_accept_mutex);
    }
    //处理网络读写事件
    ngx_event_process_posted(cycle, &ngx_posted_events);
}

由上述代码可知,Nginx 解决惊群的方法:

  • 将连接事件与读写事件进行分离。连接事件存放为 ngx_posted_accept_events,读写事件存放为 ngx_posted_events。

  • 设置 ngx_accept_mutex 锁,只有获得锁的进程,才可以处理连接事件。

④负载均衡

worker 间的负载关键在于各自接入了多少连接,其中接入连接抢锁的前置条件是 ngx_accept_disabled > 0,所以 ngx_accept_disabled 就是负载均衡机制实现的关键阈值。
ngx_int_t             ngx_accept_disabled;ngx_accept_disabled = ngx_cycle->connection_n / 8 - ngx_cycle->free_connection_n;

因此,在 nginx 启动时,ngx_accept_disabled 的值就是一个负数,其值为连接总数的 7/8。

当该进程的连接数达到总连接数的 7/8 时,该进程就不会再处理新的连接了。

同时每次调用'ngx_process_events_and_timers'时,将 ngx_accept_disabled 减 1,直到其值低于阈值时,才试图重新处理新的连接。

因此,Nginx 各 worker 子进程间的负载均衡仅在某个 worker 进程处理的连接数达到它最大处理总数的 7/8 时才会触发,其负载均衡并不是在任意条件都满足。

如下图所示:

实际工作情况

其中'pid'为 1211 的进程为 master 进程,其余为 worker 进程。

思考

为什么不采用多线程模型管理连接?

①无状态服务,无需共享进程内存。

②采用独立的进程,可以让互相之间不会影响。一个进程异常崩溃,其他进程的服务不会中断,提升了架构的可靠性。

③进程之间不共享资源,不需要加锁,所以省掉了锁带来的开销。

为什么不采用多线程处理逻辑业务?

①进程数已经等于核心数,再新建线程处理任务,只会抢占现有进程,增加切换代价。

②作为接入层,基本上都是数据转发业务,网络 IO 任务的等待耗时部分,已经被处理为非阻塞/全异步/事件驱动模式,在没有更多 CPU 的情况下,再利用多线程处理,意义不大。

并且如果进程中有阻塞的处理逻辑,应该由各个业务进行解决,比如 OpenResty 中利用了 Lua 协程,对阻塞业务进行了优化。

作者:handsomeli,腾讯 IEG 后台开发工程师

编辑:陶家龙

出处:转载自公众号腾讯技术工程(ID:Tencent_TEG)

(0)

相关推荐

  • UC头条:Nginx基础知识

    UC头条:Nginx基础知识

  • 分布式 | 不可不知的负载均衡

    最近有小伙伴在后台留言,让我写一篇负载均衡的文章,说网上文章其实已经很多了,每次都觉得某某文章讲的不错,可是一旦过段时间,啥都不记得了.那今天我们就用生活中的故事来聊聊负载均衡.文章中部分可能有点啰嗦 ...

  • nginx的记录配置心得

    一.nginx的安装 安装前的一些准备工作 [root@taotao2016 ~]# cat /etc/redhat-release CentOS Linux release 7.2.1511 (Co ...

  • 深入理解Nginx模块开发与架构解析

    一.研究Nginx前的准备工作 1.Nginx特点:更快.高扩展性.高可靠性.低内存消耗.单机支持10万以上的并发连接.热部署.最自由的BSD许可协议 2.退出nginx nginx -s stop ...

  • 深入了解Nginx

    今天我们来谈谈什么是Nginx? 什么是Nginx? Nginx代码完全用C语言从头写成,已经移植到许多体系结构和操作系统,包括:Linux.FreeBSD.Solaris.Mac OS X.AIX以 ...

  • 嫦娥仙子,永远滴神

    嫦娥仙子,永远滴神

  • 天荷—阳台盆栽“永远滴神”,植株矮小,美若莲花,四季有花看

    每个爱养花的朋友,都想把阳台改造成花园吧?在家就能踏春赏花,使人身心愉悦,还能带来意想不到的装饰效果.你的阳台还有空位吗?今天来带大家欣赏一种优秀的观花植物,花朵颜值高,养护也简单,希望你喜欢. 天荷 ...

  • 旧版芈月永远滴神!!

    旧版芈月永远滴神!!

  • 炉石酒馆战棋平衡补丁后英雄新排名,苔丝已跌落神坛,植物人依然永远滴神

    距离平衡补丁上线已经有一段时间了,酒馆战棋环境发生了天翻地覆的变化,酒馆里不再是满地野猪人的时代了,苔丝也从神坛上掉了下来,那么在目前的新版本里,到底选哪些英雄更容易吃鸡呢?今天清风就带大家一起来看看 ...

  • yyds,永远滴神

    今天7点起床,早上有雨,下午跑步3.6公里. 今天(520)有人持上亿身价离婚(陈思诚佟丽娅),有人持亿万身家离任CEO(字节跳动张一鸣),有人持亿万身家因病去世(贝壳公司创始人兼董事长左晖).人活着 ...

  • 猫影幻舞,永远滴神

    猫影幻舞,永远滴神

  • 疯了!白酒是永远滴神?股民:投资信仰已经崩塌

    摘要 [疯了!白酒是永远滴神?股民:我的投资信仰已经崩塌!]在经历了年初的抱团股大崩盘之后,这几天白酒股又嗨了,特别是二三线白酒股,连连上涨.股民:熟悉的感觉又回来了,白酒永远滴神!(21金融圈) 白 ...

  • 不良人:喝最烈的酒,救最底层的黎民百姓,李淳风永远滴神

    导读:大家好,我是小姐机怀里的桃之助.不良帅为了李唐江山煞费苦心,就连娆疆也布了局.贞观九年,李淳风还是风度翩翩少年,作为李唐智囊团,时刻为大唐赴汤蹈火.原来娆疆造出了天下神器,想要染指中原,而辽东也 ...

  • 永远滴神 (yyds) - 俄语固定搭配

    考试中常见的固定结构 *用在作文里其实也很好的! *标蓝的是常考的 душа 类 по душе кому 合..心意 на душе 心情上 от души 衷心地 в душе 心里,暗自 вло ...