今天跟大家聊一下关于网关选型的话题,为什么我最后选择了 OpenResty?

图片来自 包图网

互联网公司,不论体量大小如何,其内部的技术架构基本都是相似的,体现在以下几个方面:

  • 数据量过大,如何定制化存储

  • 访问量高了,如何集群化部署,流量负载均衡

  • 响应速度慢了,如何提高处理速度,引入多级缓存

  • 如果机器多了,如何保证某台服务器突然抽风,不影响业务集群的服务稳定性

麻雀虽小五脏俱全,今天要讲的网关,就是其中的关键一环,不论公司规模大小如何,基本都要有这个系统。那么网关是干什么用的?

什么是网关

网关是连接客户端与服务端的中间桥梁,将很多通用地、非业务逻辑抽离,前置到网关系统,减少了很多重复性开发工作,是整个网站的唯一流量入口。

为了提高系统的扩展性,网关通常采用组件式架构,高内聚低耦合。

常用的组件功能:

  • 黑名单拦截

  • 日志

  • 参数校验

  • 鉴权

  • 限流

  • 负载均衡

  • 路由转发

  • 监控

  • 灰度分流

  • 多协议支持

  • 熔断、降级、重试、数据聚合等

系统设计上一般采用责任链设计模式,定义好抽象接口,每个组件实现自己的专属功能,职责单一。

并且根据不同的业务请求 API,添加、删除一些节点,动态构建新的节点链,从而满足多样化的业务需求。

网关选型

目前比较常见的网关如下:

  • Tomcat/Jetty+NIO+Servlet3

  • Nginx

  • Spring WebFlux

  • Soul

  • Spring cloud Gateway

  • Zuul

  • OpenResty

  • Kong

  • Netty 自建

各个框架的资料网上基本都有,考虑到篇幅限制,这里就不展开分析每个框架的优缺点。

我们计划选型 OpenResty,主要有以下几个原因:

  • 能实现跨网络的 gRPC 请求转发,底层采用 HTTP/2 协议。

  • 支持 SSL/TLS 证书加密,通讯安全。

  • 性能方面,支持较高的并发请求。

  • 性能开销低,延迟少。

翻牌 OpenResty

下图是 Netcraft 最新统计的 2021年10月 Web 服务器排行榜:

Netcraft 是一家总部位于英国巴斯始于 1995 年的互联网服务公司。该公司官网每月发布的调研数据报告:Web Server Survey 系列,已成为当今人们了解全球网站的服务器市场份额。

OpenResty 现在全球排名第三,由于将 Nginx 扩展成动态服务器,发展势头很猛。

我们常用的 12306 的余票查询功能,京东的商品详情页,这些高流量的背后,其实都是 OpenResty 在提供服务。

OpenResty 最擅长的是部署在流量入口处,处理各种高并发流量。接下来,我们来深入了解下这个框架。

OpenResty 诞生起因

Nginx 采用 master-worker 进程模型,分工明确,职责单一,也是其具备高性能的原因之一。

①master 进程

管理进程,处理指令如:-s reload、-s stop,通过进程间通信,将管理指令发送给 worker 进程,从而实现对 worker 进程的控制。

②worker 进程

工作进程,不断接收客户端的连接请求,处理请求。数量通常设置为与 CPU 核数一致,Nginx 也会将每个进程与每个 CPU 进行绑定,充分利用其多核特性。

多个 worker 进程会竞争一个共享锁,只有抢到锁的进程才能处理客户端的请求。

如果请求是 accept 事件,则会将其添加到 accept 队列中;如果是 read 或者 write 事件,则会将其添加到 read-write 队列。

可能有人问,OpenResty 为什么要基于 Nginx 框架?

主要还是看重了 Nginx 的高并发能力,反向代理服务器通常流量很大,本身不涉及复杂计算,属于 I/O 密集型服务。

Nginx 采用基于 epoll 机制的事件驱动,异步非阻塞,大大提高并发处理能力。

但是 Nginx 采用 C 语言开发,二次开发门槛较高。市场应用广泛,更多是基于 nginx.conf 预留配置参数,如:反向代理、负载均衡、静态 web 服务器等。

如果想让 Nginx 访问 MySQL ,定制化开发一些业务逻辑,难度很高。

OpenResty 通过嫁接方式,将 Nginx 和 Lua 脚本相结合,既保留 Nginx 高并发优势,也拥有脚本语言的开发效率,也大大降低了开发门槛。

Lua 是最快的、动态脚本语言,接近 C 语言运行速度。LuaJIT 将一些常用的 lua 函数和工具库预编译并缓存,下次调用时直接使用缓存的字节码,速度很快。

另外,Lua 支持协程,这个很重要。协程是用户态的操作,上下文切换不用涉及内核态,系统资源开销小;另外协程占用内存很小,初始 2KB。

OpenResty 核心架构

OpenResty 是一个基于 Nginx 的 Web 平台,内部嵌入 LuaJIT 虚拟机运行 Lua 脚本。使用 Lua 编程语言对 Nginx 核心以及各种 Nginx C 模块进行脚本编程。

如上图:

  • 每接到一个客户端请求,通过抢占锁,由一个 worker 进程来跟进处理。

  • worker 内部会创建一个 lua 协程,绑定请求,也就是说一个请求对应一个 lua 协程。

  • lua 协程将请求通过网络发出,并添加一个 event 事件到 nginx。然后,当前协程就处于 yield,让出 CPU 控制权。

  • 当服务端响应数据后,网络流程会创建一个新的 event 事件,将之前的协程唤醒,将结果返回。

注意:不同的 lua 协程之间数据隔离,从而保证了不同的客户端请求不会相互影响。另外,一个 worker 中同一时刻,只会有一个协程在运行。

cosocket 将 Lua 协程 + Nginx 事件通知两个重要特性组合。cosocket 是 OpenResty 世界中技术、实用价值最高部分。

让我们可以用非常低廉的成本,优雅的姿势,比传统 socket 编程效率高好几倍的方式进行网络编程。无论资源占用、执行效率、并发能力都非常出色。

为了方便开发,OpenResty 将一个 HTTP 请求划分为 11 个阶段,每个阶段有自己的专属职责。

函数功能说明:

  • set_by_lua,用于设置变量。

  • rewrite_by_lua,用于转发、重定向等。

  • access_by_lua,用于准入、权限等。

  • content_by_lua,用于生成返回内容。

  • balancer_by_lua,负载均衡,路由转发。

  • header_filter_by_lua,用于响应头过滤处理。

  • body_filter_by_lua,用于响应体过滤处理。

  • log_by_lua,日志记录。

OpenResty 提供了大量的 Lua API 接口,用于操作 Nginx 。只要熟悉 lua 语法,同时对 Nginx 的运行流程有较清楚理解,那么就可以轻松的在 Nginx 上做二次开发。

无论是作为应用网关,还是高性能的 web 应用,支持连接各种丰富的后端存储,如:MySQL、Redis、Memcache、PostgreSQL 等,周边生态非常丰富。

https://github.com/openresty/lua-nginx-module/#accessbylua

注意:OpenResty 的 API 有使用范围限制,每个 API 都有与之对应的使用阶段列表,如果你超范围使用就会报错。

①部署安装

本文以 CentOS 系统中为例。

添加 openresty 仓库,这样以后可以通过 yum updata 命令安装或更新我们的软件包:

yum install yum-utils -y  yum-config-manager --add-repo https://openresty.org/package/centos/openresty.repo

安装软件:

yum install openresty -y

安装命令行工具 resty:

yum install openresty-resty -y

②项目实战

修改 nginx.conf 配置文件:

worker_processes  auto; worker_rlimit_nofile 1000000; events {     use epoll;     worker_connections  150000; }  http {     include       mime.types;     default_type  application/octet-stream;      log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '                       '$status $content_length $body_bytes_sent "$http_referer" '                       '"$http_user_agent" "$http_x_forwarded_for" "$upstream_response_time" "$request_time"';      access_log  logs/access.log  main;      server {         listen 8080;         location / {             access_by_lua_block {                 local headers = ngx.req.get_headers(0)                 local trace_id= headers["X-Trace-Id"]                 ngx.log(ngx.ERR, trace_id)             }             #  ngx.say("<p>hello !</p>")             proxy_pass http://168.12.8.10:8080;         }     }      server {         listen 8082;         location / {             default_type text/html;             content_by_lua_block {                 ngx.say("<p>Hello Openresty!</p>")             }         }     } }

nginx.conf 内部分为三层嵌套:

  • 最外层的 http,表示处理 HTTP 协议。

  • http 内部 的 server 监听端口,会启动一个 LuaJIT 虚拟机,执行lua代码

  • 同一个端口内部,区分不同的业务功能,采用 location 配置,通过不同的 path 路径,处理不同的业务逻辑。

添加环境变量:

echo "export PATH=$PATH:/usr/local/openresty/nginx/sbin" >> /etc/profile  source /etc/profile

启动 openresty,启动命令和 nginx 一致:

nginx -c /usr/local/openresty/nginx/conf/nginx.conf

访问 Web 服务:

curl http://localhost:8082/

如果正常,浏览器页面会输出 Hello Openresty!

如果 nginx.conf 配置项做了修改,我们可以重新启动:

nginx -s reload

作者:Tom哥

编辑:陶家龙

来源:转载自公众号微观技术(ID:weiguanjishu)