PgSQL · 实战经验 · 如何预测Freeze IO风暴
背景和原理
有没有被突发的IO惊到过,有没有见到过大量的autovacuum for prevent wrap。
PostgreSQL 的版本冻结是一个比较蛋疼的事情,为什么要做版本冻结呢?
因为PG的版本号是uint32的,是重复使用的,所以每隔大约20亿个事务后,必须要冻结,否则记录会变成未来的,对当前事务”不可见”。
冻结的事务号是2
src/include/access/transam.h
#define InvalidTransactionId ((TransactionId) 0)
#define BootstrapTransactionId ((TransactionId) 1)
#define FrozenTransactionId ((TransactionId) 2)
#define FirstNormalTransactionId ((TransactionId) 3)
#define MaxTransactionId ((TransactionId) 0xFFFFFFFF)
现在,还可以通过行的t_infomask来区分行是否为冻结行
src/include/access/htup_details.h
/** information stored in t_infomask:*/
#define HEAP_XMIN_COMMITTED 0x0100 /* t_xmin committed */
#define HEAP_XMIN_INVALID 0x0200 /* t_xmin invalid/aborted */
#define HEAP_XMIN_FROZEN (HEAP_XMIN_COMMITTED|HEAP_XMIN_INVALID)
表的最老事务号则是记录在pg_class.relfrozenxid里面的。
执行vacuum freeze table,除了修改t_infomask,还需要修改该表对应的pg_class.relfrozenxid的值。
那么系统什么时候会触发对表进行冻结呢?
当表的年龄大于autovacuum_freeze_max_age时(默认是2亿),autovacuum进程会自动对表进行freeze。
freeze后,还可以清除掉比整个集群的最老事务号早的clog文件。
那么可能会出现这样的情形:
可能有很多大表的年龄会先后到达2亿,数据库的autovacuum会开始对这些表依次进行vacuum freeze,从而集中式的爆发大量的读IO(DATAFILE)和写IO(DATAFILE以及XLOG)。
如果又碰上业务高峰,会出现很不好的影响。
为什么集中爆发Freeze很常见?
因为默认情况下,所有表的autovacuum_freeze_max_age是一样的,并且大多数的业务,一个事务或者相邻的事务都会涉及多个表的操作,所以这些大表的最老的事务号可能都是相差不大的。
这样,就有非常大的概率导致很多表的年龄是相仿的,从而导致集中的爆发多表的autovacuum freeze。
PostgreSQL有什么机制能尽量的减少多个表的年龄相仿吗?
目前来看,有一个机制,也许能降低年龄相仿性,但是要求表有发生UPDATE,对于只有INSERT的表无效。
vacuum_freeze_min_age 这个参数,当发生vacuum或者autovacuum时,扫过的记录,只要年龄大于它,就会置为freeze。因此有一定的概率可以促使频繁更新的表年龄不一致。
那么还有什么手段能放在或者尽量避免大表的年龄相仿呢?
为每个表设置不同的autovacuum_freeze_max_age值,从认为的错开来进行vacuum freeze的时机。
例如有10个大表,把全局的autovacuum_freeze_max_age设置为5亿,然后针对这些表,从2亿开始每个表间隔1000万事务设置autovacuum_freeze_max_age。 如2亿,2.1亿,2.2亿,2.3亿,2.4亿….2.9亿。
除非这些表同时达到 2亿,2.1亿,2.2亿,2.3亿,2.4亿….2.9亿。 否则不会出现同时需要vacuum freeze的情况。
但是,如果有很多大表,这样做可能就不太合适了。
建议还是人为的在业务空闲时间,对大表进行vacuum freeze。
优化建议
1. 分区,把大表分成小表。每个表的数据量取决于系统的IO能力,前面说了VACUUM FREEZE是扫全表的, 现代的硬件每个表建议不超过32GB。
2. 对大表设置不同的vacuum年龄. alter table t set (autovacuum_freeze_max_age=xxxx);
3. 用户自己调度 freeze,如在业务低谷的时间窗口,对年龄较大,数据量较大的表进行vacuum freeze。
4. 年龄只能降到系统存在的最早的长事务即 min pg_stat_activity.(backend_xid, backend_xmin)。 因此也需要密切关注长事务。
讲完了Freeze的背景,接下来给大家讲讲如何预测Freeze IO风暴。
预测 IO 风暴
如何预测此类(prevent wrapped vacuum freeze) IO 风暴的来临呢?
首先需要测量几个维度的值。
- 表的大小以及距离它需要被强制vacuum freeze prevent wrap的年龄
- 每隔一段时间的XID值的采样(例如每分钟一次),采样越多越好,因为需要用于预测下一个时间窗口的XID。(其实就是每分钟消耗多少个事务号的数据)
- 通过第二步得到的结果,预测下一个时间窗口的每分钟的pXID(可以使用线性回归来进行预测)
预测方法这里不在细说,也可以参考我以前写的一些预测类的文章。
预测的结论包括”未来一段时间的总Freeze IO量,以及分时的Freeze IO量”。
预测结果范例
Freeze IO 时段总量
Freeze IO 分时走势
预测过程
- 每隔一段时间的XID值的采样(例如每分钟一次),采样越多越好,因为需要用于预测下一个时间窗口的XID。(其实就是每分钟消耗多少个事务号的数据)
vi xids.sh
#!/bin/bash
export PATH=/home/digoal/pgsql9.5/bin:$PATH
export PGHOST=127.0.0.1
export PGPORT=1921
export PGDATABASE=postgres
export PGUSER=postgres
export PGPASSWORD=postgrespsql -c "create table xids(crt_time timestamp, xids int8)"
for ((i=1;i>0;))
do
# 保留1个月的数据
psql -c "with a as (select ctid from xids order by crt_time desc limit 100 offset 43200) delete from xids where ctid in (select ctid from a);"
psql -c "insert into xids values (now(), txid_current());"
sleep 60
donechmod 500 xids.shnohup ./xids.sh >/dev/null 2>&1 &
采集1天的数据可能是这样的
postgres=# select * from xids ;crt_time | xids
----------------------------+------2016-06-12 12:36:13.201315 | 20202016-06-12 12:37:13.216002 | 90212016-06-12 12:38:13.240739 | 210222016-06-12 12:39:13.259203 | 320232016-06-12 12:40:13.300604 | 420242016-06-12 12:41:13.325874 | 520252016-06-12 12:42:13.361152 | 620262016-06-12 12:43:15.481609 | 72027
...
- 表的大小以及距离它需要被强制vacuum freeze prevent wrap的年龄(因为freeze是全集群的,所以需要把所有库得到的数据汇总到一起)
vi pred_io.sh#!/bin/bash
export PATH=/home/digoal/pgsql9.5/bin:$PATH
export PGHOST=127.0.0.1
export PGPORT=1921
export PGDATABASE=postgres
export PGUSER=postgres
export PGPASSWORD=postgrespsql -c "drop table pred_io; create table pred_io(crt_time timestamp, bytes int8, left_live int8);"
for db in `psql -A -t -q -c "select datname from pg_database where datname <> 'template0'"`
do
psql -d $db -c " copy (
select now(), bytes, case when max_age>age then max_age-age else 0 end as xids from
(select block_size*relpages bytes,
case when d_max_age is not null and d_max_age<max_age then d_max_age else max_age end as max_age,
age from
(select
(select setting from pg_settings where name='block_size')::int8 as block_size,
(select setting from pg_settings where name='autovacuum_freeze_max_age')::int8 as max_age,
relpages,
substring(reloptions::text,'autovacuum_freeze_max_age=(\d+)')::int8 as d_max_age,
age(relfrozenxid) age
from pg_class where relkind in ('r', 't')) t) t
) to stdout;" | psql -d $PGDATABASE -c "copy pred_io from stdin"
done. ./pred_io.sh
得到的数据可能是这样的
postgres=# select * from pred_io limit 10;crt_time | bytes | left_live
----------------------------+--------+-----------2016-06-12 13:24:08.666995 | 131072 | 1999996722016-06-12 13:24:08.666995 | 65536 | 1999996722016-06-12 13:24:08.666995 | 0 | 1999996722016-06-12 13:24:08.666995 | 0 | 1999996722016-06-12 13:24:08.666995 | 0 | 1999996722016-06-12 13:24:08.666995 | 0 | 199999672
...
- 预测XIDs走势(略),本文直接取昨天的同一时间点开始后的数据。
create view v_pred_xids as
with b as (select min(crt_time) tbase from pred_io), a as (select crt_time + interval '1 day' as crt_time, xids from xids,b where crt_time >= b.tbase - interval '1 day')
select crt_time, xids - (select min(xids) from a) as xids from a ;
数据可能是这样的,预测未来分时的相对XIDs消耗量
crt_time | xids
----------------------------+------2016-06-13 12:36:13.201315 | 02016-06-13 12:37:13.216002 | 1002016-06-13 12:38:13.240739 | 2002016-06-13 12:39:13.259203 | 3002016-06-13 12:40:13.300604 | 400
- 结合pred_io与v_pred_xids 进行 io风暴预测
基准视图,后面的数据通过这个基准视图得到
create view pred_tbased_io as
with a as (select crt_time, xids as s_xids, lead(xids) over(order by crt_time) as e_xids from v_pred_xids)
select a.crt_time, sum(b.bytes) bytes from a, pred_io b where b.left_live >=a.s_xids and b.left_live < a.e_xids group by a.crt_time order by a.crt_time;
未来一天的总freeze io bytes预测
postgres=# select min(crt_time),max(crt_time),sum(bytes) from pred_tbased_io ;min | max | sum
----------------------------+----------------------------+----------2016-06-13 12:36:13.201315 | 2016-06-14 12:35:26.104025 | 19685376
(1 row)
未来一天的freeze io bytes分时走势
得到的结果可能是这样的
postgres=# select * from pred_tbased_io ;crt_time | bytes
----------------------------+----------2016-06-13 12:36:13.201315 | 655362016-06-13 12:37:13.216002 | 5816322016-06-13 12:38:13.240739 | 02016-06-13 12:39:13.259203 | 02016-06-13 12:40:13.300604 | 02016-06-13 12:41:13.325874 | 02016-06-13 12:43:15.481609 | 1064962016-06-13 12:43:24.133055 | 81922016-06-13 12:45:24.193318 | 02016-06-13 12:46:24.225559 | 163842016-06-13 12:48:24.296223 | 134348802016-06-13 12:49:24.325652 | 245762016-06-13 12:50:24.367232 | 4014082016-06-13 12:51:24.426199 | 02016-06-13 12:52:24.457375 | 393216
......
小结
预测主要用到哪些PostgreSQL的手段?
- 线性回归
- with语法
- 窗口函数
- xid分时消耗统计
- 强制prevent wrap freeze vacuum的剩余XIDs统计
相关文章:
【CTF】实验吧 传统知识+古典密码
对照顺序写下: 根据对应的干支得到 28 30 23 8 17 10 16 30 甲子 所有的数加60 得到 88 90 83 68 77 70 76 90 找到ASCII码对照表可得到XZSDMFLZ 题干中提到古典密码(常用的就是栅栏密码和凯撒密码) 栅栏密码(两栏&#…

NSSize 尺寸
前言 结构体,这个结构体用来表示事物的宽度和高度。typedef CGSize NSSize;struct CGSize {CGFloat width;CGFloat height; };typedef struct CGSize CGSize; 1、NSSize 结构体变量的创建与调用 // NSSize 结构体变量的创建与赋值// 先定义变量,再赋值 N…

Android中对Log日志文件的分析[转]
一,Bug出现了, 需要“干掉”它 bug一听挺吓人的,但是只要你懂了,android里的bug是很好解决的,因为android里提供了LOG机制,具体的底层代码,以后在来分析,只要你会看bug,a…

Unix下C程序内存泄漏检测工具Valgrind安装与使用
Valgrind是一款用于内存调试、内存泄漏检测以及性能分析的软件开发工具。 Valgrind的最初作者是Julian Seward,他于2006年由于在开发Valgrind上的工作获得了第二届Google-OReilly开源代码奖。 Valgrind遵守GNU通用公共许可证条款,是一款自由软件。 官网…
【CTF】实验吧 robomunication
用audacity软件,猜测是摩斯密码 听到的都是“bi”或者“bu”,这里用b代表“bi”,“p”代表“bu” bbbb b bpbb bpbb ppp bpp bbbb bp p bb bbb p bbbb b pbp b pbpp bb p bb bbb (p b bb) ppp ppp bppb pbbb b b bppb 打括号那里显得较分散一…

Mac原生Terminal快速登录ssh
1. 创建rsa key 在终端中输入以下命令: ssh-keygen -t rsa完成之后可以在~/.ssh目录下找到公钥和私钥 如果你与我一样有使用gitlab,那么这个秘钥应该已经存在了,所以就不用重新建立了。 2.上传公钥到服务器 有教程会说,用scp或者类…
Java开发环境的搭建以及使用eclipse从头一步步创建java项目
原文:出自本人的Linux博客http://blog.csdn.net/unix21/article/details/18813173 一、Java 开发环境的搭建 这里主要说windows环境下怎么配置Java环境。如果是Linux环境参考本博客另一篇文章即可:Linux环境安装卸载JDK1.首先安装JDK java的SDK简称JDK。…

全球首届APMCon,带你给“应用性能”把把脉
前段时间,美国苹果公司应用程序购买商店和手机等一系列应用因技术故障中断服务,持续了约两个半小时。故障发生后,世界多地苹果用户纷纷吐槽无法购买和更新手机应用、无法备份等。其实,这不是苹果公司在线服务第一次掉线࿰…
【CTF】实验吧 The Flash-14
标题的提示是:闪电侠的第十四集用到的加密方式(看来写CTF题要无所不知,不然咋能想到是一部剧) 根据两两一组将数据分类 54 43 32 52 22 44 55 34 22 51 52 22 44 34 22 23 11 34 12 按照上表的对应关系可以得到…

XML 标签 首字母转换为大写
2019独角兽企业重金招聘Python工程师标准>>> public static String xmlTagCapitalize(String xmlStr) {String regex "<(/*[A-Za-z])>";regex "<([^>]*)>";Matcher matcher Pattern.compile(regex).matcher(xmlStr);StringBu…

简析 .NET Core 构成体系
简析 .NET Core 构成体系 Roslyn 编译器RyuJIT 编译器CoreCLR & CoreRTCoreFX(.NET Core Libraries).NET Core 代码开发、部署、运行过程总结前文介绍了.NET Core 在整个.NET 平台所处的地位,以及与.NET Framework的关系(原文链接),本文将详细介绍.N…
【CTF】实验吧 奇怪的短信
和实验吧 The Flash-14有些类似,总共的数字数目是偶数,所以两两分开,题干中的“短信”是提示,观察两两分组的第二个数字没有超过四的,可以想到手机上的九键 例如第一组数:33 对应的是F,最后全部…
mybatis结合log4j打印SQL日志
mybatis结合log4j打印SQL日志1.Maven引用jar包 默认的mybatis不能打印出SQL日志,不便于查看调试,需要结合log4jdbc-log4j2就可以完整的输入SQL的调试信息。 pom.xml 配置maven,注意以下3个都需要<dependency><groupId>org.bgee.l…

EOS Chain/Wallet RPC API的PHP开发包
2019独角兽企业重金招聘Python工程师标准>>> 介绍一个EOS Chain/Wallet RPC API的PHP开发包。 开始 你可以查看EOS的RPC API参考,但要注意缺少一些较新的方法。Wallet RPC API实现EOS v1.1.0 of RPC API reference。此外,这些文档中的一些示例…
深入浅出理解Paxos算法
Paxos算法是莱斯利兰伯特(英语:Leslie Lamport,LaTeX中的「La」)于1990年提出的一种基于消息传递且具有高度容错特性的一致性算法。 Paxos算法一开始非常难以理解,但是一旦理解其实也并不难,之所以难理解其…

显示界面的普通仓库
实际脚本如下 procedure xianshi_PTCK(Npc: TNormNpc; Player: TPlayObject);procedure CWPRPTCK_QWP(Npc: TNormNpc; Player: TPlayObject; Args: TArgs); beginplayer.TakebackStorageItem(Args.Int[0]);cangku.xianshi_PTCK(npc,player); end; procedure xianshi_PTCK(Np…
【CTF】实验吧 围在栅栏中的爱
对摩斯密码进行解码:kiqlwtfcqgnsoo QWE是键盘上的前三个,ABC是26个字母的前三个。所以,二者有这样的对应关系。 #include <stdio.h> #include <string.h> int main () {char zc[]"abcdefghijklmnopqrstuvwxyz"; cha…

nginx tomcat https
1.首先确保机器上安装了openssl和openssl-devel #yum install openssl #yum install openssl-devel2. server {listen 443 ssl;server_name vota.swmmotors.com.cn;ssl_certificate cert/vota.swmmotors.com.cn_bundle.crt; #当前conf/目录下ssl_certificate_…
Spring4实战学习笔记
《Spring4实战 第4版》2016年4月新出版的,之前的第三版看起来还是不错的,所以看到新版就直接买下来。 英文版源码地址:Spring in Action, Fourth Edition Covers Spring 4 1.IOC装配Bean 参考【Spring实战4 2.2】,作者提倡无XML…

vmstat 命令
2019独角兽企业重金招聘Python工程师标准>>> 1.用法 vmstat [-a] [-n] [-S unit] [delay [ count]] vmstat [-s] [-n] [-S unit] vmstat [-m] [-n] [delay [ count]] vmstat [-d] [-n] [delay [ count]] vmstat [-p disk partition] [-n] [delay [ count]] vmstat […
【CTF】实验吧 疑惑的汉字
考察的是当铺密码: 王夫 井工 夫口 由中人 井中 夫夫 由中大:67 84 70 123 82 77 125 当铺密码就是一种将中文和数字进行转化的密码,算法相当简单:当前汉字有多少笔画出头,就是转化成数字几。

Date PHP
转载于:https://www.cnblogs.com/liuliang389897172/p/10087895.html

Java多线程的11种创建方式以及纠正网上流传很久的一个谬误
创建线程比较传统的方式是继承Thread类和实现Runnable,也可以用内部类,Lambda表达式,线程池,FutureTask等。 经常面试会问到继承Thread类和实现Runnable的区别,然后网上会流传如下这样的说法,这是错误的。…
【CTF】实验吧 古典密码
一共是35个字符分成5*7或者7*5 最终选择5行7列 首先变动第一行的位置,然后根据第一行变动的位置,依次变动下面的行 OCU{CFT ELXOUYD ECTNGAH OHRNFIE NM}IOTA CTF{COU LTYOUEX CHANGET HEINFOR MATION} CTF{COULTYOUEXCHANGETHEINFORMATION}

对比React Native、dcloud、LuaView三个框架技术(内部)
转载自:http://www.jianshu.com/p/ee1cdb33db8d主要对比React Native和5SDK(就是dcloud的SDK)两个: 开发语言:三个都是用其他语言来统一开发IOS、android应用的框架技术,其中,React Native是使用…

spring boot 临时文件过期
2019独角兽企业重金招聘Python工程师标准>>> 第一种方案:-Djava.io.tmpdir /xxx 第二种方案: 线上的系统中不能上传文件了,出现如下错误: org.springframework.web.multipart.MultipartException: Could not parse mu…

ASP.NET MVC+Bootstrap个人博客之打造清新分页Helper(三)
0. 没有找到一款中意的分页插件,又不想使用现成的(丑到爆),所以自己动手造一个吧 先看下效果(其实也不咋滴...): 有点另类,分页直接是在后台拼接好html,然后发送到前台的: 1. 分页容器: <di…
支撑Java框架的基础技术:泛型,反射,动态代理,cglib
以Spring为例要想看明白他的源码需要彻底理解Java的一些基础技术泛型,反射同时对于一些高级技术例如动态代理,cglib和字节码技术也需要掌握,下面就按章节来一一说清楚这些技术的核心部分,最后手写一个简单的Spring框架。 一.静态代…
【CTF】实验吧 困在栅栏里的凯撒
题目先提到栅栏,再提到凯撒,按照顺序先栅栏解码,再凯撒解码。 一般密码的开头不是flag就是key或者ctf 所以选择“6栏”,在进行凯撒解码 在所有组合中,发现CTF即为flag
经典算法书籍推荐以及算法书排行【算法四库全书】
经典算法书籍推荐以及算法书排行【算法四库全书】 作者:霞落满天 https://linuxstyle.blog.csdn.net/ https://blog.csdn.net/21aspnet 行文方式:类似《四库全书》截取经典算法书目录和精华篇章 版权说明:本文于2019年5月5日首发于CS…