漫漫运维路——集群基础知识
集群的基本概念
随着计算机科学的发展,对计算机的性能要求越来越高,比如在很多流量比较大的门户网站以及科学实验环境中需要海量计算的环境,这时候就迫切需要后端的服务器性能有提升。而对于提升后端服务器性能所采用的方式有两种,其一为提升服务器本身的性能,即向上扩展,通过增加服务器的内存,CPU核心数等来实现;其二就是向外扩展,一台服务器不能完成的任务就使用两台、三台甚至更多。在此,以不同的方式把许多服务器组合起来的服务器组就是集群。
集群的分类
按照集群功能的不同,可以把集群分为以下三类:
LB集群
LB即Load Balancing的首字母缩写,即负载均衡。其主要实现的目的是为了降低后端服务器的压力,通过不同的调度方式把来自客户端的请求发给后端的终端服务器,也就是后端有多台此种集群主要用于高并发请求且请求都类似的环境,如WEB服务。
HA集群
HA(High Availability),即高可用集群,此类集群强调的是可靠性,例如在负载均衡集群实现上,通常会采用一台调度器对客户端的请求作出决策,所以此时若调度器出现故障则会成为整个WEB站点的瓶颈,此时就可以对LB集群做高可用,通过添加多个冗余的调度器来降低其因为单点故障造成的站点整体宕机。
HP集群
HP( high Performance),即高性能集群,也被称为科学集群,此类集群,该类集群常见于科学计算中,比如,需要计算海量数据时,一台服务器无法胜任就采取多台服务器构建集群来实现,所以此类集群就被称为科学集群。
集群的实现方式
集群的实现方式有多种,从结构上来说可以分为以下几类:
NAT
NAT(Network Addiress Translate)即网络地址转换,使用NAT方式的原理非常简单,通常需要一台单独的服务器作为整个集群服务的“总指挥官”,负责把前端客户端发来的请求报文发送到后端真实服务器上,而现实的方式也就是把请求报文首部的目标地址修改为后端相应真实服务器的地址,然后当后端服务器处理完请求后生成响应报文发给前端调度器,调度器又把响应报文的报文首部的源地址改为自己的,让客户以为响应自己请求的就是自己请求的那台服务器。其基本框架如下图所示:
图1 NAT模型示意图
从其工作原理上来说使用NAT有一下几个特点:
调度器(director)必须有两块网卡,一块网卡配置有公网IP,负责接收前端客户端发送过来的请求。而另一块配置私网IP,负责和后端真实服务器(Real Server)组通信。
由于前端客户端发送过来的请求还需要经过调度器处理,所以可把响应的端口映射为非客户端初始请求服务的端口。
由于不管是客户端发送请求的报文,还是后端真实服务器响应的响应报文都需要调度器的处理,所以调度器性能要求一般非常高,且容易成为整个集群服务器组的瓶颈。
由于后端服务器组只要求能对客户端的请求做出响应即可,所以后端服务器可安装任意操作系统即可。
DR
DR为Director Route的缩写,即直连路由。其工作原理大致为,当前端客户端发送来请求报文时,调度器接收到,并识别出此请求报文所请求的服务是自己管辖服务器所提供的服务,随即把报文再次封装,添加新的报文首部,源地址不变,把目标地址改为调度器随机选取的真实服务器的MAC地址,并广播出去,后端真实服务器接收到该报文后作出响应,响应时,Real Server会使用调度器的VIP,然后把响应报文直接发给客户端,不再经过调度器即可完成。其大体结构如下图所示:
图2 DR模型示意图
根据其工作原理,DR有以下几个特点:
由于调度器要直接与真实服务器通信,所以调度器和后端真实服务器的各个节点必须在同一网络内。
后端节点可使用公网IP,以此方便管理与维护。由于调度器并未修改请求报文的报文首部,而是直接再次封装,所以后端真实服务器可以直接响应给客户端,因此调度器只负责处理前端客户端请求,不负责处理后端响应。
相对NAT来说,由于DR模式是由后端真实服务器直接响应,所以不能完成端口映射。
TUN
TUN为Tunneling的缩写,即隧道技术。其工作原理和NAT模式相似,但是调度器在处理请求报文是是通过二次封装请求报文来实现,封装时使用调度器的地址为源地址,目标地址即为Real Server的地址,当Real Server收到该报文后会把该报文拆分,获得客户端地址,响应时就直接和客户端交互,不会经过Virtual Server。因此,使用隧道技术会大大降低调度器的压力,其工作流程如下图所示:
图 3 TUN模型示意图
TUN主要特点如下:
集群中的节点,即后端真实服务器可以跨越互联网,因此,调度器的位置和真实服务器的位置更加灵活多变。但是跨越互联网却使用更多的公有IP,造成共有IP的大量浪费,在当今共有IP比较紧缺的前提下,跨越互联网的TUN模型并不是明智的选择。
和DR一样,隧道技术可实现端口映射。且调度器只负责处理前端的客户所发请求报文,而响应报文则由真实服务器直接发送给客户端。
由于需要具有隧道技术的Real Server才能响应客户端,所以后端Real Server的操作系统必须为具备隧道技术的操作系统。
Full NAT
正如名字一样,Full NAT模型就是完全地址转换的意思,在NAT模型中,来自客户端的请求会被调度器修改其目标地址,然后转发给后端的真实服务器。而Full NAT不仅会修改其目标地址且会修改其源地址为调度器的地址,然后通过真实服务器处理返回后再经由调度器修改其源地址和目标地址,响应给客户端。其结构模型和NAT基本相似,就不再赘述。
LVS介绍
LVS( Linux Virtual Server),是由现任阿里巴巴集团副总裁的章文嵩博士发起和领导的,它是基于Linux系统的服务器集群解决方案,其实现目标是创建一个具有良好的扩展性高可靠性高性能和高可用性的体系许多商业的集群产品,比如RedHat的Piranha Turbo Linux公司的Turbo Cluster等,都是基于LVS的核心代码的体系结构,使用LVS架设的服务器集群系统从体系结构上看是透明的,最终用户只会感觉到一个虚拟服务器物理服务器之间可以通过高速的LAN或分布在各地的WAN相连最前端是负载均衡器,它负责将各种服务请求分发给后面的物理服务器,让整个集群表现像一个服务于同一IP地址的虚拟服务器而在Linux中LVS和NetFilter一样分为两个部分,内核中如要支持LVS功能则必须在编译时把ipvs模块编译进内核,而在用户空间则使用管理工具对ipvsadm进行管理。
LVS调度方法介绍
静态方法
仅考虑方法本身,不考虑后端真实服务器的负载情况,包括以下几类:
(1)RR轮叫调度(Round Robin),此类方法适合用于服务器硬件性能一致,且用户请求数据大小相差不大的环境中,采用此类调度方式,可以把用户请求按照顺序平均地分给后端服务器。
(2) WRR加权轮叫调度算法(Weighted Round Robin),使用此类调度算法,可以让调度器根据服务器的性能来对调度的顺序做修改,如在真实环境中有甲乙两台服务器,甲服务器处理数据能力是乙的两倍,我们即可设置把用户请求发两次给甲,而第三次才发给乙。
(3) DH目标地址散列(Destination Hashing)该算法使用客户端请求的目标ip地址作为散列键(Hash Key)从静态分配的散列表中找出该服务器,若服务器链接未超过负载则把请求发到该服务器,若该服务器超过负载则返回空值。
(4) SH源地址散列(Source Hashing)和dh相似,只是sh把源地址作为散列键。
动态方法
调度器不仅要考虑调度方法,还要考虑后端服务器的负载情况。主要包括以下几种:
(1) LC最少链接(Least Connections),此调度算法会对当前后端服务器的链接数量进行计算,把请求发给正处于空闲或者链接客户端数量较少的服务器。
(2)WLC加权最少链接(Weighted Least Connections),和加权轮叫调度算法相一致,此算法会根据服务器性能差异然后加上链接客户端数量加以判断,然后再转发用户请求。
(3)LBLC 基于局部性的最少链接(Locality-Based Least Connections),此种算法根据请求的目标ip地址来找出最近使用的服务器,若该服务器可用,未超过负载,则把该请求发到该服务器;若该服务器不可用或超出负载则选择现在链接最少的服务器,将该请求发到选中的服务器上。
(4) LBLCR 带复制的基于局部性最少链接(Locality-Based Least Connections with Replication):此种算法实现方式和lblc相似,但是lblc针对的是从一个ip到一台服务器的映射,而lblcr则是一个ip到一组服务器的映射,当从调度器客户端发来的请求目标ip曾是此组服务器中一台服务器的ip时,调度器就会判断所控制Real Server中哪一台是“最少链”,然后就把该请求发到该Real server。
(5)SED 最短期望延迟(Shorted Expectation delay),该方法在调度时会根据当前连接数和权重来衡量,通常使用其活动链接数加上1然后乘以256再除以权重,算出来的值进行比较,每个链接发送过来后根据算出来的值,选择其值最大的并发送过去
(6)NQ 永不排队(Never Queue),此方法会根据后端服务器的负载情况,把请求发给空闲的服务器,其算法也是基于WLC,但是当选择的的服务器不空时,就不会发往该服务器。
本来打算做个实例,把基于NAT模型和DR模型的负载均衡集群做出来写在后面,但是感觉太长了,所以将在下一篇博客中实现,有写得不妥的还望指正!
转载于:https://blog.51cto.com/7703592/1655782
相关文章:

数据爆发时代,英特尔携手腾讯构筑全面的数据长城
作者 | 贾凯强 出品 | AI科技大本营(ID:rgznai100) 5G到来,边缘需求不断,IoT持续爆棚,数据在爆炸式增长。 在数据增长的过程中, 相应的其处理能力也需要增长,CPU等算力核心也在提升,…

python3 _笨方法学Python_日记_DAY3
Day3 习题 13: 参数、解包、变量from sys import argvscript, first, second, third argvprint("The script is called:",script) print("Your first variable is:",first) print("Your second variable is:",second) print("Your third…

动漫风格迁移 AnimeGANv2 ,发布线上运行 Demo
作者 | 神经星星出品 | HyperAI超神经By 超神经内容一览:最强二次元风格迁移模型 AnimeGAN 更新啦,现在可以在线上轻松运行模型,还可以调整风格参数,输出你想要的照片效果。关键词:风格迁移 机器视觉 二次元AnimeGANv2…

linux学习笔记一
常用命令 文件操作命令 cat命令 显示文件内容 复制代码 -b 从1开始对所有非空输出行进行编号 -n 从1开始对所有输出行进行编号 ctrls停止滚屏 ctrlq恢复滚屏 ctrlc终止命令的执行 cat file1 file2同时显示文件file1和file2的内容cat file1 file2 > file3将文件file1和f…

解决SecureCRT中文乱码
由于工作和学习需要在Windows7上使用Securecrt操作Linux(Red Hat Enterprise Linux 5)。一看汉字是乱码。Google一下。基本上是两个方面考虑解决问题:1、首先是Linux要支持汉字字符集:一般UTF-8。在etc/sysconfig/i18n中把LANG改成…

7000 字精华总结,Pandas/Sklearn 进行机器学习之特征筛选,有效提升模型性能
作者 | 俊欣来源 | 关于数据分析与可视化今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征的数量会带来许多的好处,例如提高预…

徒手撸出一个类Flask微框架(三)根据业务进行路由分组
所谓分组就是按照前缀分布映射如:/product/(\w)/(?P<id>\d # 匹配/product/123123 的前缀比如什么类别,类别下的什么产品 等,用request path进行正则匹配,所以需要用到正则分组分析我们当前代码,只有__…

TCP编程函数和步骤
TCP编程的服务器端一般步骤是1、 创建一个socket,用函数socket();2、 设置socket属性,用函数setsockopt(); * 可选3、 绑定IP地址、端口等信息到socket上,用函数bind();4、 开启监听,用函数listen();5、 接…

OSD的主要实现方法和类型(转)
源:OSD的主要实现方法和类型 目前有两种主要的OSD实现方法:外部OSD发生器与视频处理器间的叠加合成;视频处理器内部 支持OSD,直接在视频缓存内部叠加OSD信息。 外部OSD发生器与视频处理器间的叠加合成的实现原理是:由一个MCU内建的…

为什么要研究游戏 AI 呢?
作者 | 叶鑫来源 | DatawhaleAI作为时下计算机算法的超级巨星,在例如CV、NLP、语音、机器人等诸多领域都有广泛的应用。而在游戏领域,AI的应用往往被认为只是把游戏角色拟人化,算法的第一印象也通常是强化学习。但实际当中,AI在游…

oracle 工具:tkprof
https://docs.oracle.com/cd/B10501_01/server.920/a96533/ex_plan.htm http://blog.csdn.net/dba_waterbin/article/details/8010629 oracle sql执行计划怎么看 https://zhidao.baidu.com/question/1178766860347033659.html

Linux环境编程--文件基本操作
Linux 下目录是/这样的 而windows是\怎么记呢?\和w是不是一样的反向?所以Linux的目录就是反的反向,好记了。 一:open函数名称:open目标:打开一个文件。头文件:#include <sys/types.h>#in…

Firefox插件
为什么80%的码农都做不了架构师?>>> 网站优化必备的9个Firefox插件 在网页设计制作中经常使用到的火狐浏览器插件工具: 1. Firebug Firebug是开发人员们钟爱火狐浏览器的一个重要原因,Firebug是火狐浏览器上一个集成式的强大调试…

马斯克公开支持“上班摸鱼”:让工作更愉快!
整理 | 王晓曼出品 | 程序人生 (ID:coder _life)11月16日,在国美集团批评员工上班摸鱼的通报中,一名员工在网易云音乐上使用了22.5G的流量格外显眼。11月18日,网易云音乐也紧跟热点上线了摸鱼计算器活动&am…

瀚思首发三款产品 推动大数据安全战略布局
安全已成为了当下社会最为关注的几个问题之一,随着大数据时代的来临,如今的安全问题也变得严峻和复杂。近日,HanSight瀚思在北京召开了产品战略暨融资发布会,推出了瀚思用户行为分析系统(HanSight UBA)、瀚…

Linux环境编程--编辑器基本操作
vim使用 新建文件 #vim hello.c 插入模式 按下I键,底下出现- - 插入- - 换行:按下Enter 删除字符:普通模式下按x 删除整行:按dd 恢复删除:按u 取消命令: CtrlR 对U后果弥补 复制:y y2w复制2个…

2021 IDEA大会开启AI思想盛宴,用“创业精神”做科研
11月22日上午10时许,由深圳市福田区人民政府、深圳市福田区科技创新局和粤港澳大湾区数字经济研究院(International Digital Economy Academy, 简称“IDEA”)联合举办的2021 IDEA大会在深圳福田开幕。大会以“The World Needs a Few Good IDE…

Android不同分辨率和不同密度适配
官方原文地址:http://developer.android.com/training/multiscreen/screendensities.html 本文主要介绍: 1.dip dp sp 简单用法 2.适配不同分辨率屏幕图片的处理方法 支持不同的密度或分辨率 本课介绍如何通过提供不同的资源和使用的测量分辨率独立单元支…

网络工程师成长日记333-某城市政府项目
网络工程师成长日记333-某城市政府项目 这是我的第333篇原创文章,记录网络工程师行业的点点滴滴,结交IT行业有缘之人 直接上干货,拓扑图: 工程目的:排除故障配置如下:LinWei#show running-configBuilding c…

linux环境编程-- ftok()函数
系统建立IPC通讯(如消息队列、共享内存时)必须指定一个ID值。通常情况下,该id值通过ftok函数得到。 ftok原型如下: key_t ftok( char * fname, int id )fname就时你指定的文件名(该文件必须是存在而且可以访问的),id是…

使用 ChatterBot 库制作一个聊天机器人
作者 | 周萝卜来源 | 萝卜大杂烩我们学习一些如何使用 ChatterBot 库在 Python 中创建聊天机器人,该库实现了各种机器学习算法来生成响应对话,还是挺不错的1什么是聊天机器人聊天机器人也称为聊天机器人、机器人、人工代理等,基本上是由人工智…

powerDesign设计随笔
PowerDesigner的Table视图同时显示Code和Name的方法 实现方法:Tools-Display Preference powerDesigner设置 name不自动等于code 从数据库里抽取了数据模型,为了理清思路,需要将name改为中文名称,但是pd自动将name填充为code&…

Apache Kylin在绿城客户画像系统中的实践
前言\\作为国内知名的房地产开发商,绿城经过24年的发展,已为全国25万户、80万人营造了美丽家园,并将以“理想生活综合服务提供商”为目标,持续为客户营造高品质的房产品和生活服务。\\2017年,绿城理想生活集团成立&…

linux环境编程--IPC 之 msg queue
消息队列在UNIX的SystemV版本,AT&T引进了三种新形式的IPC功能(消息队列、信号量、以及共享内存)。但BSD版本的UNIX使用套接口作为主要的IPC形式。Linux系统同时支持这两个版本。系统调用msgget() 如果希望创建一个新的消息队列࿰…

2021 IDEA大会圆满落幕,一文回顾大会精彩看点
11月23日,为期两天的2021 IDEA大会在深圳福田圆满落幕。2021 IDEA大会由深圳市福田区人民政府、深圳市福田区科技创新局和粤港澳大湾区数字经济研究院(International Digital Economy Academy,简称“IDEA”)联合举办。深圳市科创委…

【转】Android下编译jni库的二种方法(含示例) -- 不错
原文网址:http://blog.sina.com.cn/s/blog_3e3fcadd01011384.html 总结如下:两种方法是:1)使用Android源码中的Make系统2)使用NDK(从NDK r5开始)---------------------------------源码要求&…

linux下如何修改系统时间
我们一般使用“date -s”命令来修改系统时间。比如将系统时间设定成2018年2月23日的命令如下。 #date -s 02/23/2018 将系统时间设定成下午11点12分0秒的命令如下。 #date -s 11:12:00 注意,这里说的是系统时间,是linux由操作系统维…

thttpd服务器
1 引言随着微处理器技术、计算机网络技术的进步,基于嵌入式WEB的网络数字视频监控系统逐渐得到了人们的广泛关注。把图像采集、视频压缩和WEB功能集中到一个体积很小的设备内,可以直接连入局域网和Internet,达到即插即用,省掉多种…

链接产业 聚变未来 | 移动云区块链开发者论坛来了
有人认为,如果说蒸汽机释放了人们的生产力,电力解决了人们基本的生活需求,互联网改变了信息传递的方式,那么区块链作为构造信任的机器,将可能改变整个人类社会价值传递的方式。区块链已走进大众视野,成为社…

Bzoj4016: [FJOI2014]最短路径树问题
题面 传送门 Sol 先\(SPFA\)求出单源最短路,\(Bfs\)建出树,字典序可以用堆解决 然后就是点分治的一眼题 开桶记录到当前根经过边长度相同的最长路,记录它的长度 自己强行\(yy\)了一个这种类型的点分丑陋写法 # include <bits/stdc.h> #…