深入理解Nginx模块开发与架构解析 / 四六文摘

一、研究Nginx前的准备工作

1.Nginx特点：更快、高扩展性、高可靠性、低内存消耗、单机支持10万以上的并发连接、热部署、最自由的BSD许可协议

2.退出nginx

nginx -s stop
nginx -s quit

3.日志回滚：nginx -s reopen

二、Nginx的配置

A.运行中的Nginx进程间的关系

一般情况下，worker进程的数量与服务器上的CPU数量相等

B.Nginx服务的基本配置

1.用于调试进程和定位问题的配置项

daemon on | off;：是否以守护进程方式运行Nginx，默认on
master_process on | off;：是否以master/worker方式工作，默认on
error_log pathfile level;：error日志的设置
debug_points [stop|abort]：帮助用户跟踪调试nginx，一般不用
debug_connection [IP | CIDR]：仅对指定的客户端输出debug级别的日志，对定位高并发请求下发生的问题有用，需要configure时加入参数--with-debug
worker_rlimit_core size;：限制coredump核心转储文件的大小
working_directory path;：指定coredump文件生成的目录

2.正常运行的配置项

evn VAR|VAR=VALUE：让用户直接设置操作系统上的环境变量
include pathfile;：嵌入其他配置文件
pid path/file;pid文件的路径
user username [groupname];：Nginx worker进程运行的用户及用户组
worker_rlimit_nofile limit;：指定Nginx worker进程可以打开的最大句柄描述符个数
worker_rlimit_sigpending limit;：限制信号队列

3.优化性能的配置

worker_processes number;：定义worker进程的个数
worder_cpu_affinity cpumask [cpumask...];：绑定worker进程到指定的CPU内核
ssl_engine device;：SSL硬件加速
timer_resolution t;：系统调用gettimeofday的执行频率
worker_priority nice;：worker进程优先级设置

4.事件类配置项

accept_mutex [on | off];：是否打开accept锁，可以让多个worker进程轮流地、序列化地与新的客户端建立TCP连接
lock_file path/file;：lock文件的路径
accept_mutex_delay ms;：使用accept锁后到真正建立连接之间的延迟时间
multi_accept on | off;：批量建立新连接
use [kqueue|rtsig|epoll|/dev/poll|select|poll|eventport];：选择事件模型
worker_connections number;：每个worker的最大连接数

C.用HTTP核心模块配置一个静态Web服务器

1.虚拟主机与请求的分发

listen address:port[default|default_server|[backlog=num|rcvbuf=size|sndbuf=size|accept_filter=filter|deferred|bind|ipv6only=[on|off]|ssl]];：监听端口，配置在server块
server_name name[...];：主机名称，配置在server块
server_names_hash_bucket_size size;：设置每个散列表占用的内存大小，nginx使用散列表来存储server_name
server_names_hash_max_size size;：影响散列表的冲突率，越大消耗的内存越多，但散列key的冲突则会降低，检索速度也快
server_name_in_redirect on|off;：重定向主机名称的处理
location [=|~|~*|^~|@]/uri/{...}：根据请求的URI来匹配进入location{}块中的配置来处理用户请求，配置在server块

2.文件路径的定义

root path;：以root方式设置资源路径
alias path;：别名，将uri映射到真实的磁盘文件上，只能在location块中
index file ...;：访问首页
error_page code[code...][=|=answer-code]uri|@named_location：根据HTTP返回码重定向页面
recursive_error_pages [on|off];：是否允许递归使用error_page
try_files path1[path2]uri;：尝试按照顺序访问每一个path

3.内存及磁盘资源的分配

client_body_in_file_only on|clean|off;：HTTP包体只存储到磁盘文件中
client_body_in_single_buffer on|off;：HTTP包体尽量写入到一个内存buffer中
client_header_buffer_size size;：存储HTTP头部的内存buffer大小
large_client_header_buffers number size;：定义了Nginx接收一个超大HTTP头部请求的buffer个数和每个buffer的大小
client_body_buffer_size size;：存储HTTP包体的内存buffer大小
client_body_temp_path dir-path[level1[level2[level3]]];：HTTP包体的临时存放目录
connection_pool_size size;：Nginx对于每个建立成功的TCP连接会预先分配一个内存池，这个配置将指定个内存池的初始大小，用于减少内核对于小块内存的分配次数
request_pool_size size;：Nginx会为每个请求分配一个内存池，配置将指定这个内存池的初始大小

4.网络连接的设置

client_header_timeout time：读取HTTP头部的超时时间
client_body_timeout time：读取HTTP包体的超时时间
send_timeout time;：发送响应的超时时间
reset_timeout_connection on|off;：连接超时后将通过向客户端发送RST包来直接重置连接，这个选项打开后，Nginx将直接向用户发送RST重置包，不再等待用户应答，直接释放缓存
lingering_close off|on|always;：控制Nginx关闭用户连接的方式
lingering_time time;：对上传大文件很有用，当超过时间后，不管是否仍在上传，都会关闭连接
ligering_timeout time;：在lingering_close生效后，在关闭连接前，会检测是否有用户发送的数据到达服务器，如果超过时间后还没有数据可读，就直接关闭连接
keepalive_disable [msie6|safari|none]...：对某些浏览器禁用keepalive功能
keepalive_timeout time time：keepalive超时时间
keepalive_requests n;：一个keepalive长连接上允许承载的请求最大数
tcp_nodelay on|off;：确定对keepalive连接是否使用TCP_NODELAY选项
tcp_nopush on|off;：在打开sendfile选项时，确定是否开启FreeBSD系统上的TCP_NOPUSH或Linux系统上的TCP_CORK功能

5.MIME类型的设置

type{...};：MIME type与文件扩展的映射
default_type MIME-type;：默认MIME type
types_hash_bucket_size size;：设置散列表占用的内存大小
types_hash_max_size size;：影响散列表的冲突率

6.对客户端请求的限制

limit_except method...{...}：按HTTP方法名限制用户请求
client_max_body_size size;：HTTP请求包体的最大值
limit_rate speed;：对客户端请求限制每秒传输的字节数
limit_rate_after time;：表示nginx向客户端发磅的响应长度超过limit_rate_after后才开始限速

7.文件操作的优化

sendfile on|off;：启用sendfile系统调用来发送文件
aio on|off;：表示是否在FreeBSD或Linux系统上启用内核级别的异步I/O功能，与sendfile是互斥的
directio size|off;：在FreeBSD和Linux系统上使用O_DIRECT选项去读取文件，与sendfile互斥
directio_alignment size;：与directio配合，指定directio方式读取文件时的对齐方式
open_file_cache max=N[inactive=time]|off;：打开文件缓存
open_file_cache_errors on|off;：是否缓存打开文件错误的信息
open_file_cache_min_uses number;：不被淘汰的最小访问次数，与open_file_cache的inactive配合使用，如果超过了，则不会被淘汰出缓存
open_file_cache_valid time;：检验缓存中元素有效性的频率

8.对客户端请求的特殊处理

ignore_invalid_headers on|off;：忽略不合法的HTTP头部
underscores_in_headers on|off;：HTTP头部是否允许下划线
if_modified_since [off|exact|before];：对If-Modified-Since头部的处理策略
log_not_found on|off;：文件未找到时是否记录到error日志
merge_slashes on|off;：是否合并相邻的/
resolver address...;：废黜DNS名字解析服务器的地址
resolver_timeout time;：DNS解析超时时间
server_tokens on|off;：返回错误页面时是否在Server中注明Nginx版本

D.用HTTP proxy module配置一个反向代理服务器

1.负载均衡的基本配置

upstream name {...}：定义了一个上游服务器的集群，便于反向代理中的proxy_pass使用，配置在http块
server name [weight=number,max_fails=number,fail_timeout=time,down,backup]：指定一台上游服务器的名字，可以是域名、ip地址端口、UNIX句柄等，配置在upstream块中
ip_hash;：根据客户IP地址将请求始终落在固定的一台上游服务器中，与weight配置不可同时使用

2.反向代理的基本配置

proxy_pass URL;：将当前请求反向代理到URL参数指定的服务器上，URL可使用是域名、ip地址端口、UNIX句柄或upstream块，配置在location、if块中
proxy_set_header Host $host;：转发请求中的Host头，默认proxy_pass不转发
proxy_method method;：转发时的协议方法名
proxy_hide_header the_header;：可以指定哪些HTTP头部字段不能被转发
proxy_pass_header the_header;：与proxy_hide_header相反
proxy_pass_request_body on|off;：确定是否向上游服务器发送HTTP包体部分
proxy_pass_request_headers on|off;：确定是否转发HTTP头部
proxy_redirect [default|off|redirect replacement];：当上游服务器返回重定向或刷新请求时，可以重设HTTP头部的location或refresh字段
proxy_next_upstream [ errpo,timeout,invalid_header,http500,http_502,http503,http_504,http_404,off]：当一台上游服务器转发请求出现错误时，继续换一台处理这个请求

三、开发一个简单的HTTP模块

1.整型的封装：ngx_int_t、ngx_uint_t

2.字符串：ngx_str_t

3.链表容器：ngx_list_t

4.key/value对：ngx_table_elt_t

5.缓冲区：ngx_buf_t

6.与ngx_buf_t配合使用的链接结构：ngx_chain_t

四、配置、error日志和请求上下文

五、访问第三方服务

1.upstream可以保证在与第三方服务器交互时（包括三次握手建立TCP连接、发送请求、接收响应、四次握手关闭TCP连接等）不会阻塞Nginx进程处理其他请求

2.subrequest是分解复杂请求的一种设计模式，最终也是基于upstream实现的

3.当我们希望把第三方服务的内容几乎原封不动地返回给用户时，一般使用upstream方式，可以非常高效地透传HTTP；如果访问第三方服务只是为了获取某些信息，再依据这些信息来构造响应并传送给客户，应该使用subrequest方式

六、开发一个简单的HTTP过滤模块

七、Nginx提供的高级数据结构

八、Nginx基础架构

九、事件模块

十、HTTP框架的初始化

十一、HTTP框架的执行流程

十二、upstream机制的设计与实现

十三、邮件代理模块

十四、进程间的通信机制

十五、变量

十六、slab共享内存

深入理解Nginx模块开发与架构解析

相关推荐