当前位置: 首页 > 编程日记 > 正文

举个栗子看如何做MySQL 内核深度优化

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

本文由云+社区发表

作者介绍:简怀兵,腾讯云数据库高级工程师,负责腾讯云CDB内核及基础设施建设;先后供职于Thomson Reuters和YY等公司,PTimeDB作者,曾获一项发明专利;从事MySQL内核开发工作8年,具有丰富的优化经验;在分布式存储等领域有较丰富经验。

MYSQL数据库适用场景广泛,相较于Oracle、DB2性价比更高,Web网站、日志系统、数据仓库等场景都有MYSQL用武之地,但是也存在对于事务性支持不太好(MySQL 5.5版本开始默认引擎才是InnoDB事务型)、存在多个分支、读写效率瓶颈等问题。

所以如何用好MYSQL变得至关重要,一方面需要通过MYSQL优化找出系统读写瓶颈,提高数据库性能;另一方面需要合理涉及数据结构、调整参数,以提高用户操作响应;同时还有尽可能节省系统资源,以便系统可以提供更大负荷的服务。本文将为大家介绍腾讯云团队是如何对Mysql进行内核级优化的思路和经验。

早期的CDB主要基于开源的Oracle MySQL分支,侧重于优化运维和运营的OSS系统。在腾讯云,因为用户数的不断增加,对CDB for MySQL提出越来越高的要求,腾讯云CDB团队针对用户的需求和业界发展的技术趋势,对CDB for MySQL分支进行深度的定制优化。优化重点围绕内核性能、内核功能和外围OSS系统三个维度展开,具体的做法如下:

一.内核性能的优化

由于腾讯云上的DB基本都需要跨园区灾备的特性,因此CDB for MySQL的优化主要针对主从DB部署在跨园区网络拓扑的前提下,重点去解决真实部署环境下的性能难题。经过分析和调研,我们将优化的思路归纳为:“消除冗余I/O、缩短I/O路径和避免大锁竞争”。以下是内核性能的部分案例:

1.主备DB间的复制优化

img

问题分析

如上图所示,在原生MySQL的复制架构中,Master侧通过Dump线程不断发送Binlog事件给Slave的I/O线程,Slave的I/O线程在接受到Binlog事件后,有两个主要的动作:

  • 写入到Relay Log中,这个过程会和Slave SQL线程争抢保护Relay Log的锁。
  • 更新复制元数据(包含Master的位置等信息)。

优化方法

经过分析,我们的优化策略是:

  • Slave I/O线程和Slave SQL线程是典型的单写单读生产者-消费者模型,是可以做到无锁设计的;因此实现思路就是Slave I/O线程在每次写完数据后,原子更新Relay Log的长度信息,Slave SQL线程读取Relay Log的时以长度信息为边界。这样就将原本竞争激烈的Relay Log锁化解为无锁;
  • 由于Binlog事件中的GTID(Global Transaction Identifier)和DB事务是一一对应的关系,所以Relay Log中的数据本身已经包含了所需要的复制元数据,所以我们可以不写Master info文件,消除了冗余的文件I/O;
  • 于DB都是以事务为更新粒度的,因为在Relay Log文件I/O上,我们通过合并离散小I/O为事务粒度的大I/O等手段,使磁盘I/O得以大幅提升。

优化效果

img

如上图所示,经过优化:左图35.79%的锁竞争(futex)已经被完全消除;同压测压力下,56.15%的文件I/O开销被优化到19.16%,Slave I/O线程被优化为预期的I/O密集型线程。

2.主库事务线程和Dump线程间的优化

img

问题分析

如上图所示,在原生MySQL中多个事务提交线程TrxN和多个Dump线程之间会同时竞争Binlog文件资源的保护锁,多个事务提交线程对Binlog执行写入,多个Dump线程从Binlog文件读取数据并发送给Slave。所有的线程之间是串行执行的!

优化方法

经过分析,我们的优化策略是:

  • 将读写分离开来,多个写入的线程还是在锁保护下串行执行,每一个写入线程写入完成后更新当前Binlog的长度信息,多个Dump线程以Binlog文件的长度信息为读取边界,多个Dump线程之间并行执行。以这种方式来让复制拓扑中的Dump线程发送得更快!

效果

img

经过测试,优化后的内核,不仅提升了事务提交线程的性能,在Dump线程较多的情况下,对主从复制性能有较大提升。

二.主备库交互流程优化

img

问题分析

如上图所示,在原生MySQL中主备库之间的数据发送和ACK回应是简单的串行执行,在上一个事件ACK回应到达之前,不允许继续发送下一个事件;这个行为在跨园区(RTT 2-3ms)的情况性能非常差,而且也不能很好地利用带宽优势。

优化方法

经过分析,我们的优化策略是:

  • 将发送和ACK回应的接收独立到不同的线程中,由于发送和接收都是基于TCP流的传输,所以时序性是有保障的;这样发送线程可以在未收ACK之前继续发送,接受线程收到ACK后唤醒等待的线程执行相应的任务。

效果

根据实际用例测试,优化后的TPS提升为15%左右。

三.内核功能的优化

1. 预留运维帐号连接数配额

在腾讯云上,不时遇到用户APP异常或者BUG从而占满DB的最大连接限制,这是CDB OSS帐号无法登录以进行紧急的运维操作。针对这个现状,我们在MySQL内核单独开辟了一个可配置的连接数配额,即便在上述场景下,运维帐号仍然可以连接到DB进行紧急的运维操作。极大地降低了异常情况下DB无政府状态的风险。该帐号仅有数据库运维管理权限,无法获取用户数据,也保证了用户数据的安全性。

2. 主备强同步

针对一些应用对数据的一致性要求非常高,CDB在MySQL原生半同步的基础上进行了深度优化,确保一个事务在主库上提交之前一定已经复制到至少一个备库上。确保主库宕机时数据的一致性。

四.外围系统的优化

除了以上提到的MySQL内核侧的部分优化,我们也在外围OSS平台进行了多处优化。例如使用异步MySQL ping协议实现大量实例的监控、通过分布式技术来加固原有系统的HA/服务发现和自动扩容等功能、在数据安全/故障切换和快速恢复方面也进行了多处优化。

此文已由作者授权腾讯云+社区发布


转载于:https://my.oschina.net/qcloudcommunity/blog/2992895

相关文章:

Ubuntu--开启TELNET服务

1 sudo apt-get install xinetd telnetd 安装成功后,系统也会有相应提示, 测试安装完之后就可以Telnet,要是还不行继续 2 sudo vi /etc/inetd.conf 并加入以下一行 telnet stream tcp nowait telnetd /usr/sbin/tcpd /usr/sbin/in.telnetd …

Python的range()函数

如果想产生一个等差数列,用range()函数再合适不过。 range()函数可以有起始值、终值、步长三个参数。 range(start 0,end,step 1) 但是起始值和步长是可以缺省的。起始值的缺省值是0,步长的缺省值是1。 起始值被包含,终值不包含。 为了方…

C++链式继承

继承,对于学习C的每一个人来说,都不会陌生。在Qt的开发中,如果你需要对一个无边框的界面支持move操作,那么你就得通过继承重写虚函数来实现,这并不难,但如果我还需要对一个按钮支持移动,一般情况…

调度框架学习笔记(3)—— 集群调度框架的架构演进过程

本章是 The evolution of cluster scheduler architectures 文章的学习笔记。这篇文章讨论了这些年调度架构是如何发展的以及为什么会这样发展。 首先介绍一下这篇文章的作者:Malte Schwarzkopf,他目前在 MIT 的 PDOS实验室 作博士后,说起作者…

查缺补漏 | Python自定义函数

1 默认参数要放在自定义函数参数列表的最后,也就是说下面的定义是不允许的 2 调用函数时熟悉的是位置参数,但是也可以用关键字参数,也就是调用时把参数名写出来(可以通过它来改变参数的顺序)。不过貌似系统定义的函数不能用关键字参数&#x…

ZBar与ZXing使用后感觉

[原]ZBar与ZXing使用后感觉(上) 2014-3-18阅读2011 评论1 最近对二维码比较感兴趣,还是那句老话,那么我就对比了一下zxing和zbar 如果对于这两个的背景不了解的话,可以看我以前的文章,介绍了几个比较基础的…

X-UA-Compatible

X-UA-Compatible是IE8的一个专有<meta>属性&#xff0c;它告诉IE8采用何种IE版本去渲染网页&#xff0c;在html的<head>标签中使用。可以在微软官方文档获取更多介绍。 在IE8刚推出的时候&#xff0c;很多网页由于重构的问题&#xff0c;无法适应较高级的浏览器&a…

[转]【 视频 】PAR、DAR和SAR都是啥

原地址:http://blog.yikuyiku.com/?cat3 PAR —— Pixel Aspect Ratio 像素纵横比DAR —— Display Aspect Ratio 显示纵横比SAR —— Sample Aspect Ratio 采样纵横比 16&#xff1a;9和4&#xff1a;3指的是DAR&#xff0c;DAR和SAR之间没有必然联系。横向上的像素数目/纵向…

登高自卑 | 我的NumPy笔记

注&#xff1a;以下内容来自NumPy中文网 1 NumPy的矢量化和广播两个特征是大部分功能的基础。 矢量化让代码更接近标准的数学符号&#xff0c;更Pythonic&#xff0c;隐藏了所有的显示循环(幕后是C在做显示循环)。 广播即操作的隐式逐元素行为&#xff0c;不仅仅局限于算数运…

TI IPNC Web网页之网页修改教程

web网页程序修改 打开gStudio之后&#xff0c;点击菜单栏中Help->Contents。先把这个诡异的编程语言看一遍吧。这里搬一些东西出来。 GoDB简介 从第一副图片中&#xff0c;我们可以看出&#xff0c;从源文件到可执行文件的过程。 从第二幅图我们可以了解到GoDB是如何跨平台的…

Spring Cloud构建分布式电子商务平台:服务消费(基础)

使用LoadBalancerClient在Spring Cloud Commons中提供了大量的与服务治理相关的抽象接口&#xff0c;包括DiscoveryClient、这里我们即将介绍的LoadBalancerClient等。对于这些接口的定义我们在上一篇介绍服务注册与发现时已经说过&#xff0c;Spring Cloud做这一层抽象&#x…

OPENGL ES 对象的拾取

时间&#xff1a;19:51 2010-12-14 用户问题的说明 响应鼠标操作&#xff0c;其当中有一个非常重要的知识&#xff1a;使用鼠标点取&#xff0c;达到对三维模型对象的捕捉。 对象的拾取&#xff0c;这是3D当中的一个专业术语。也就是在二维屏幕当中选择三维对象。 我们要使用之…

如何禁止NumPy自动跳过数组的中心部分并仅打印角点

import numpy as np import sys np.set_printoptions(thresholdsys.maxsize)

用C#创建Windows服务(Windows Services)

转载自 hyslove最终编辑 hysloveWindows服务在Visual Studio 以前的版本中叫NT服务&#xff0c;在VS.net启用了新的名称。用Visual C# 创建Windows服务不是一件困难的事&#xff0c;本文就将指导你一步一步创建一个Windows服务并使用它。这个服务在启动和停止时&#xff0c;向一…

JS判断滚动条到底部

form:http://www.uphtm.com/js/269.html判断滚动条到底部&#xff0c;需要用到DOM的三个属性值&#xff0c;即scrollTop、clientHeight、scrollHeight。 scrollTop为滚动条在Y轴上的滚动距离。 clientHeight为内容可视区域的高度。 scrollHeight为内容可视区域的高度加上溢出…

docker容器网络 - 同一个host下的容器间通信

2019独角兽企业重金招聘Python工程师标准>>> 对于复杂的应用&#xff0c;不可避免需要多个服务部署在多个容器中&#xff0c;并且服务间存在相互间通信的情况。比如服务A需要连接mysql的容器。本文将介绍docker的容器网络&#xff0c;并通过实践解决在同一个docker …

登高自卑 | 我的PyTorch入门与实践笔记

1 函数名后带下划线会修改函数本身。如y.add_(x)会改变张量y。 2 PyTorch的Tensor和NumPy中的ndarray是可以互相转换的&#xff0c;转换后的对象共享内存(一个变另一个也跟着变)。

234. Palindrome Linked List - Easy

Given a singly linked list, determine if it is a palindrome. Example 1: Input: 1->2 Output: false Example 2: Input: 1->2->2->1 Output: true Follow up:Could you do it in O(n) time and O(1) space? 找中点&#xff0c;反转后半部分&#xff0c;再一一…

Hibernate 获取某个表全部记录时 奇怪现象 (重复出现某个记录)

我用Hibernate连接access的mdb 列出某个表全部记录的时候&#xff0c;发现有一个记录重复了。而直接用jdbc连接&#xff0c;就可以正确列出来。 本来还以为mdb不稳定&#xff0c;还吓了我一跳。毕竟打算用它作为长久数据库嘛~~ 分析了一下&#xff0c;发现正好重复的数据的主键…

iOS7导航栏和状态栏的定制

http://www.cocoachina.com/applenews/devnews/2013/1104/7287.html 转载于:https://www.cnblogs.com/luningning0901/p/4437190.html

2021年浙软夏令营预推免面经

夏令营 时间&#xff1a;七月中旬 参加人工智能分营&#xff0c;为期两周&#xff0c;评分标准&#xff1a;简历上课参与情况项目完成情况(具体占比不明)。 项目是完成三个深度学习模型&#xff0c;系统根据测试用例的通过情况评分。 预推免 时间&#xff1a;九月下旬 评…

ext前后台数据传输的标准化

一、标准化的数据传输是什么 这里所说的标准化主要是指&#xff0c;使用代理提交数据时&#xff0c;格式必须统一化、标准化&#xff0c;而服务器返回的数据格式也必须是标准化的数据。 简言之&#xff0c;使用代理提交数据时&#xff0c;前台--->后台&#xff0c;后台---&g…

对称加密解密类c#

namespace EncryptDLL{ #region 对称加密类 /// <summary> /// 对称加密解密类 /// </summary> public static class SymmetricEncryptClass { #region 对称加密代码 /// <summary> /// 对称加密方法 /// <…

java代码完全手写模仿qq登录界面

这是我模仿QQ2015版界面&#xff0c;实现的基本功能有登陆验证&#xff0c;重置等&#xff0c;当然直接复制代码运行是不一样的&#xff0c;还要注意自己插入自己的图片。 结果截图如下所示&#xff1a; import java.awt.BorderLayout;import java.awt.Color;import java.awt.F…

Vue3 计算属性的特性

computed:里面的方法 仅当依赖的值发生变动时&#xff0c;才会重新进行计算 这样一来解决的是性能问题 而methods里面的方法&#xff0c;哪怕无关值发生变动&#xff0c;也会重新进行计算 下面是两组对比 1-通过distance()计算属性来计算路程 2-通过getDis()方法计算路程…

解读源码中的问题

1.HashMap 构建中如何保证容量为 2 的幂次方 static final int tableSizeFor(int cap) {int n cap - 1;n | n >>> 1;n | n >>> 2;n | n >>> 4;n | n >>> 8;n | n >>> 16;return (n < 0) ? 1 : (n > MAXIMUM_CAPACITY) ?…

User Profile Data Web Part 读取属性字段

User Profile Data Web Part Property NameDisplay NameUserProfile_GUIDIdSIDSIDADGuidActive Directory IDAccountName帐户名FirstName名字SPS-PhoneticFirstName拼音名LastName姓氏SPS-PhoneticLastName拼音姓PreferredName名称SPS-PhoneticDisplayName拼音显示姓名WorkPho…

Linux 环境变量配置

linux 环境&#xff0c;用户通过shell 操作时&#xff0c;系统会为用户初使化环境变量&#xff0c; 比如系统公共资源路径: path , include , bin 等目录。 shell 模式下&#xff0c;执行 export &#xff0c; 查看用户环境变量 , echo $key 查询某个环境变量。设置环境变量&am…

Android 自定义View之3D骰子旋转

你可以指定立方体中每一面骰子的点数&#xff0c;颜色和背景&#xff0c;同时也可以指定执行的动画时间和动画插值器 更多有趣的view 使用 在根目录的build.gradle添加这一句代码&#xff1a; allprojects {repositories {//...maven { url https://jitpack.io }} } 复制代码在…