[学习笔记] - 负载均衡

分类

  • 软件负载均衡
  • 硬件负载均衡
  • DNS

  • 二层负载均衡(MAC)
    • 虚拟MAC
  • 三层负载均衡(IP)
    • 虚拟IP
  • 四层负载均衡(TCP)
    • 根据IP和端口
  • 七层负载均衡(HTTP)
    • 根据URL和IP

四层负载均衡

通过报文中的目标地址端口,再加上负载均衡设备设置的服务器选择方式,决定最终选择的内部服务器

  • F5:硬件负载均衡器
  • LVS:重量级四层负载软件
  • Nginx:轻量级四层负载软件,带缓存
  • Haproxy:模拟四层转发

七层负载均衡

基于虚拟的URL或主机IP的负载均衡,也称内容交换,也就是主要通过报文中真正有意义的应用层内容,再加上负载均衡设备设置的服务器选择方式,决定最终选择的内部服务器

  • Haproxy:天生负载均衡技能,全面支持七层代理,会话保持,标记,路径转移
  • Nginx:只在http和mail
  • apache:功能交叉
  • mysql proxy
四层负载均衡 七层负载均衡
实现方式 基于IP+Port的 基于虚拟的URL或主机IP等。
功能类比 路由器 代理服务器
握手次数 1 2
难度
性能 高;无需解析内容 中;需要算法识别 URL,HTTP head 等信息
安全性 低,无法识别DDOS 高,可以防御SYN cookies或SYN flood
额外功能 会话保持,图片压缩等

LVS

LVS是Linux Virtual Server的简称,也就是Linux虚拟服务器。通过LVS提供的负载均衡技术和Linux操作系统实现一个高性能,高可用的服务器集群,它具有良好的可靠性,可扩展性,从而以低廉的成本实现最优的服务性能

  • 优点
    • 高并发连接,单台可上百万
    • 稳定性强
    • 成本低廉
    • 配置简单
    • 支持多种算法
    • 支持多种工作模式
    • 应用范围广
  • 缺点
    • 不支持7层
    • 不适合小规模应用

LVS核心组件

  • LVS管理工具和内核模块:ipvsadm/IPVS
    • ipvsadm: 用户空间的命令行工具,用于管理集群服务及集群服务上的RS等
    • IPVS: 工作于内核上的netfilter INPUT钩子之上的程序,可根据用户定义的集群实现请求转发

  • VS(Virtual Server):虚拟服务
  • Balancer:负载均衡器
  • RS(Real Server):后端请求处理服务器
  • CIP(Client IP):用户端
  • VIP(Director Virtual IP):负载均衡器虚拟IP
  • DIP(Director IP):负载均衡器IP
  • RIP(Real Server IP):后端请求处理服务器IP’
            graph TD
            CIP --> |VIP| VS
VS --> |CIP| RS(VIP)
          

LVS工作原理

  1. 当客户端的请求到达负载均衡器的内核空间时,首先会到达PREROUTING链。
  2. 当内核发现请求数据包的目的地址是本机时,将数据包送往INPUT链。
  3. LVS由用户空间的ipvsadm和内核空间的IPVS组成,ipvsadm用来定义规则,IPVS利用ipvsadm定义的规则工作,IPVS工作在INPUT链上,当数据包到达INPUT链时,首先会被IPVS检查,如果数据包里面的目的地址及端口没有在规则里面,那么这条数据包将被放行至用户空间。
  4. 如果数据包里面的目的地址及端口在规则里面,那么这条数据报文将被修改目的地址为事先定义好的后端服务器,并送往POSTROUTING链。
  5. 最后经由POSTROUTING链发往后端服务器。

LVS内核模型

NAT工作模式

  • 客户端将请求发往前端的负载均衡器
    • 请求报文源地址是CIP(客户端IP), 后面统称为CIP
    • 目标地址为VIP(负载均衡器前端地址,后面统称为VIP)
  • 负载均衡器收到报文后,发现请求的是在规则里面存在的地址,那么它将客户端请求报文的目标地址改为了后端服务器的RIP地址并将报文根据算法发送出去。
  • 报文送到RS(Real Server)后,由于报文的目标地址是自己,所以会响应该请求,并将响应报文返还给LVS。
  • 然后LVS将此报文的源地址修改为本机并发送给客户端
  • 特点
    • LB会修改数据包的地址
    • LB会透传客户端IP到RS(DR模式也会透传),RS收到的请求包里是能看到客户端IP
    • 需要将RS的默认网关地址配置为LB的浮动IP地址
    • LB和RS须位于同一个子网,并且客户端不能和LB/RS位于同一子网

像NAT一样修改IP地址

  • 优点
    • 节省IP
    • 对后端服务器的操作系统无要求
    • 支持端口映射
  • 缺点
    • 性能低
    • 要求服务器和调度器在同一个VLAN
    • 需要将服务器的默认网关指向调度器

DR工作模式

DR和RS(Real Server)都使用同一个IP对外服务,但只有DP对ARP请求进行响应

默认模式,修改MAC地址

  • 客户端将请求发往前端的负载均衡器,请求报文源地址是CIP,目标地址为VIP。
  • 负载均衡器收到报文后,发现请求的是在规则里面存在的地址,那么它将客户端请求报文的源MAC地址改为自己DIP的MAC地址,目标MAC改为了RIP的MAC地址,并将此包发送给RS。
  • RS发现请求报文中的目的MAC是自己,就会将次报文接收下来,处理完请求报文后,将响应报文通过lo接口送给eth0网卡直接发送给客户端。

回复不经过LVS

  • 特点
    • 数据包在LB转发过程中,源/目的IP端口都不会变化
    • 每台RS上都必须在环回网卡上绑定LB的虚拟服务IP
    • RS上的业务进程必须监听在环回网卡的虚拟服务IP上,且端口必须和LB上的虚拟服务端口一致
    • RS处理完请求后,响应直接回给客户端,不再经过LB
    • LB和RS须位于同一个子网(MAC地址,否则会获取到网关MAC地址)

  • 优点
    • 与TUN相比,没有IP隧道的开销,性能最好
  • 缺点
    • 要求调度器与服务器都有一块网卡连在同一物理网段(同一个VLAN)上
    • 要求服务器网络设备(或者设备别名)不作ARP响应,或者能将报文重定向(Redirect)到本地的Socket端口上
    • 服务器上直接绑定虚拟IP(Virtaul IP),风险很大
    • 不支持端口映射

TUN工作模式

  • 客户端将请求发往前端的负载均衡器,请求报文源地址是CIP,目标地址为VIP。
  • 负载均衡器收到报文后,发现请求的是在规则里面存在的地址,那么它将在客户端请求报文的首部再封装一层IP报文,将源地址改为DIP,目标地址改为RIP,并将此包发送给RS。
  • RS收到请求报文后,会首先拆开第一层封装,然后发现里面还有一层IP首部的目标地址是自己lo接口上的VIP,所以会处理次请求报文,并将响应报文通过lo接口送给eth0网卡直接发送给客户端。

可以跨互联网,用IP隧道技术(VPN)

  • 优点
    • 不需要调度应答报文,性能高
    • 服务器和调度器可以不在同一个VLAN
    • 支持广域负载均衡
  • 缺点
    • 所有的服务器必须支持“IP Tunneling”协议,要安装内核模块(比如IPIP等),配置复杂
    • 有建立IP隧道的开销
    • 服务器上直接绑定虚拟IP(Virtaul IP),风险很大
    • 服务器需要联通外网
    • 不支持端口映射

LVS的调度算法

静态算法

只根据算法进行调度 而不考虑后端服务器的实际连接情况和负载情况

  • RR:轮叫调度(Round Robin)

调度器通过”轮叫”调度算法将外部请求按顺序轮流分配到集群中的真实服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载。

  • WRR:加权轮叫(Weight RR)

调度器通过“加权轮叫”调度算法根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。

  • DH:目标地址散列调度(Destination Hash)

根据请求的目标IP地址,作为散列键(HashKey)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。

  • SH:源地址 hash(Source Hash)

源地址散列”调度算法根据请求的源IP地址,作为散列键(HashKey)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。

动态算法

前端的调度器会根据后端真实服务器的实际连接情况来分配请求

  • LC:最少链接(Least Connections)

调度器通过”最少连接”调度算法动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用”最小连接”调度算法可以较好地均衡负载。

  • WLC:加权最少连接(默认)(Weighted Least Connections)

在集群系统中的服务器性能差异较大的情况下,调度器采用“加权最少链接”调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。

  • SED:最短延迟调度(Shortest Expected Delay)

在WLC基础上改进,Overhead = (ACTIVE + 1) * 256 / 加权,不再考虑非活动状态,把当前处于活动状态的数目+1来实现,数目最小的,接受下次请求,+1的目的是为了考虑加权的时候,非活动连接过多缺陷:当权限过大的时候,会倒置空闲服务器一直处于无连接状态。

  • NQ永不排队/最少队列调度(Never Queue Scheduling NQ)

无需队列。如果有台real server的连接数=0就直接分配过去,不需要再进行SED运算,保证不会有一个主机很空闲。在SED基础上无论+几,第二次一定给下一个,保证不会有一个主机不会很空闲着,不考虑非活动连接,才用NQ,SED要考虑活动状态连接,对于DNS的UDP不需要考虑非活动连接,而httpd的处于保持状态的服务就需要考虑非活动连接给服务器的压力

  • LBLC:基于局部性的最少链接(locality-Based Least Connections)

基于局部性的最少链接”调度算法是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用“最少链接”的原则选出一个可用的服务器,将请求发送到该服务器

  • LBLCR:带复制的基于局部性最少连接(Locality-Based Least Connections with Replication)

带复制的基于局部性最少链接”调度算法也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。它与LBLC算法的不同之处是它要维护从一个目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务器组,按”最小连接”原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器;若服务器超载,则按“最小连接”原则从这个集群中选出一台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的程度

7层负载均衡

即学习Nginx,这里跳过

Keepalive高可用

keepalived是以VRRP协议为实现基础(虚拟路由冗余协议),主要有3个模块

  • core模块:负载主程序的启动,维护,以及全局配置文件的加载和解析
  • check负载健康检查,包括场景的各种检查方式
  • vrrp模块:实现VRRP协议