互斥量、读写锁长占时分析的利器——valgrind的DRD
在进行多线程编程时,我们可能会存在同时操作(读、写)同一份内存的可能性。为了保证数据的正确性,我们往往会使用互斥量、读写锁等同步方法。(转载请指明出于breaksoftware的csdn博客)
互斥量的用法如下
pthread_mutex_lock(&mutex);// do somethingpthread_mutex_unlock(&mutex);
我们在第2行处填充业务代码。这样一个线程上锁成功后,其他线程必须等待这个锁被释放(第3行)。这也就意味着其他线程必须等着第2行业务代码执行完毕才能继续执行。
如果业务代码非常耗时,就会导致整个程序执行的效率大打折扣。因为大量的线程都处在等待状态,没有充分利用CPU资源。这与多线程编程的初衷是相违背的。于是控制锁粒度是个非常重要的优化设计方案。
但是,对于一个庞大的项目,可能使用互斥量加锁的地方很多,我们如何排查出是哪个锁的效率低呢?这个使用valgrind就该出场了。
我们设计一个例子
/** Hold several types of synchronization objects locked as long as specified.*/#define _GNU_SOURCE 1#include <assert.h>
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <unistd.h>static void delay_ms(const int ms) {struct timespec ts;assert(ms >= 0);ts.tv_sec = ms / 1000;ts.tv_nsec = (ms % 1000) * 1000 * 1000;nanosleep(&ts, 0);
}void double_lock_mutex(const int ms) {pthread_mutex_t mutex;pthread_mutexattr_t mutexattr;fprintf(stderr, "Locking mutex ...\n");pthread_mutexattr_init(&mutexattr);pthread_mutexattr_settype(&mutexattr, PTHREAD_MUTEX_RECURSIVE);pthread_mutex_init(&mutex, &mutexattr);pthread_mutexattr_destroy(&mutexattr);pthread_mutex_lock(&mutex);delay_ms(ms);pthread_mutex_lock(&mutex);pthread_mutex_unlock(&mutex);pthread_mutex_unlock(&mutex);pthread_mutex_destroy(&mutex);
}int main(int argc, char** argv) {int interval = 0;int optchar;while ((optchar = getopt(argc, argv, "i:")) != EOF) {switch (optchar) {case 'i':interval = atoi(optarg);break;default:fprintf(stderr, "Usage: %s [-i <interval time in ms>].\n", argv[0]);break;}}double_lock_mutex(interval);fprintf(stderr, "Done.\n");return 0;
}
delay_ms方法接受程序传入的参数,然后休眠相应的毫秒数。这个操作用于模拟业务代码,当我们希望业务代码执行较快时,则把该时间调低;当我们希望业务代码非常耗时时,则把该时间调大。
使用下面指令编译
gcc hold_lock.c -g -lpthread -o hold_lock
对于产出,我们可以这么调用
./hold_lock -i 10000
程序将在10000ms(10s)后执行完毕。相当于一个复杂的业务代码执行了10秒。
然后我们使用下面的valgrind指令来检查锁占用的时间
valgrind --tool=drd --exclusive-threshold=10 ./hold_lock -i 20
这次我们让业务代码只执行20ms,但是使用--exclusive-threshold=10参数的意思是:检查所有独占锁占用10ms已上的场景。
==4000== drd, a thread error detector
==4000== Copyright (C) 2006-2017, and GNU GPL'd, by Bart Van Assche.
==4000== Using Valgrind-3.13.0 and LibVEX; rerun with -h for copyright info
==4000== Command: ./hold_lock -i 20
==4000==
Locking mutex ...
==4000== Acquired at:
==4000== at 0x4C39193: pthread_mutex_lock (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4000== by 0x108E1E: double_lock_mutex (hold_lock.c:31)
==4000== by 0x109029: main (hold_lock.c:80)
==4000== Lock on mutex 0x1ffefffe60 was held during 22 ms (threshold: 10 ms).
==4000== at 0x4C3A123: pthread_mutex_unlock (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4000== by 0x108E4C: double_lock_mutex (hold_lock.c:35)
==4000== by 0x109029: main (hold_lock.c:80)
==4000== mutex 0x1ffefffe60 was first observed at:
==4000== at 0x4C385F0: pthread_mutex_init (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4000== by 0x108E06: double_lock_mutex (hold_lock.c:29)
==4000== by 0x109029: main (hold_lock.c:80)
==4000==
Done.
==4000==
==4000== For counts of detected and suppressed errors, rerun with: -v
==4000== ERROR SUMMARY: 1 errors from 1 contexts (suppressed: 0 from 0)
第11行显示,这个互斥量占用了22ms。它是在hold_lock.c的第29行(第17行显示)第一次被使用的,在第31行(第9行显示)第一次被上锁,在第35行(第13行显示)最后一次被解锁。如此我们便能找到耗时超过10ms的独占锁了。
我们再改下执行指令,让业务代码执行(休眠)9ms。这是处在比较靠近边界10ms的时间,所以我们多执行几次下面命令,可以看到有时候可能检测到超过10ms的,有时候也没有。
valgrind --tool=drd --exclusive-threshold=10 ./hold_lock -i 9
==4026== Command: ./hold_lock -i 9
==4026==
Locking mutex ...
Done.
==4026==
上面是不超过10ms的场景,下面是超过的场景。
==4027==
Locking mutex ...
==4027== Acquired at:
==4027== at 0x4C39193: pthread_mutex_lock (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4027== by 0x108E1E: double_lock_mutex (hold_lock.c:31)
==4027== by 0x109029: main (hold_lock.c:80)
==4027== Lock on mutex 0x1ffefffe60 was held during 11 ms (threshold: 10 ms).
==4027== at 0x4C3A123: pthread_mutex_unlock (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4027== by 0x108E4C: double_lock_mutex (hold_lock.c:35)
==4027== by 0x109029: main (hold_lock.c:80)
==4027== mutex 0x1ffefffe60 was first observed at:
==4027== at 0x4C385F0: pthread_mutex_init (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4027== by 0x108E06: double_lock_mutex (hold_lock.c:29)
==4027== by 0x109029: main (hold_lock.c:80)
==4027==
Done.
==4027==
除了互斥量,这个方式还可以检测读写锁。
读写锁又称共享-独占锁。当写锁被设置,其他获取锁的操作都会进入等待状态(独占);当读锁被设置,其他线程仍然可以获取读锁(共享),但是写锁需要等待所有读锁释放后才可以获得。
我们看个写锁耗时长的例子
void write_lock(const int ms) {pthread_rwlock_t rwlock;fprintf(stderr, "Locking rwlock exclusively ...\n");pthread_rwlock_init(&rwlock, 0);pthread_rwlock_wrlock(&rwlock);delay_ms(ms);pthread_rwlock_unlock(&rwlock);pthread_rwlock_destroy(&rwlock);
}
仍然使用exclusive-threshold参数去检测
valgrind --tool=drd --exclusive-threshold=10 ./hold_lock -i 20
可以得到如下结果。其解读方式和之前一致(注意此处的代码行号是我文件中的行号,而非csdn显示的局部代码行号)。
==4074==
Locking rwlock exclusively ...
==4074== Acquired at:
==4074== at 0x4C41404: pthread_rwlock_wrlock (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4074== by 0x108EC6: write_lock (hold_lock.c:45)
==4074== by 0x109033: main (hold_lock.c:81)
==4074== Lock on rwlock 0x1ffefffe50 was held during 22 ms (threshold: 10 ms).
==4074== at 0x4C428D5: pthread_rwlock_unlock (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4074== by 0x108EDC: write_lock (hold_lock.c:47)
==4074== by 0x109033: main (hold_lock.c:81)
==4074== rwlock 0x1ffefffe50 was first observed at:
==4074== at 0x4C40685: pthread_rwlock_init (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4074== by 0x108EBA: write_lock (hold_lock.c:44)
==4074== by 0x109033: main (hold_lock.c:81)
==4074==
Done.
最后看一个读锁耗时长的场景
void read_lock(const int ms) {pthread_rwlock_t rwlock;fprintf(stderr, "Locking rwlock shared ...\n");pthread_rwlock_init(&rwlock, 0);pthread_rwlock_rdlock(&rwlock);delay_ms(ms);pthread_rwlock_rdlock(&rwlock);pthread_rwlock_unlock(&rwlock);pthread_rwlock_unlock(&rwlock);pthread_rwlock_destroy(&rwlock);
}
由于读锁不是独占锁,所以我们不能使用exclusive-threshold去分析,而是要使用shared-threshold
valgrind --tool=drd --shared-threshold=10 ./hold_lock -i 20
其结果的解读和前面一致
Locking rwlock shared ...
==4122== Acquired at:
==4122== at 0x4C40FB4: pthread_rwlock_rdlock (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4122== by 0x108F56: read_lock (hold_lock.c:57)
==4122== by 0x10903D: main (hold_lock.c:82)
==4122== Lock on rwlock 0x1ffefffe50 was held during 21 ms (threshold: 10 ms).
==4122== at 0x4C428D5: pthread_rwlock_unlock (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4122== by 0x108F84: read_lock (hold_lock.c:61)
==4122== by 0x10903D: main (hold_lock.c:82)
==4122== rwlock 0x1ffefffe50 was first observed at:
==4122== at 0x4C40685: pthread_rwlock_init (in /usr/lib/valgrind/vgpreload_drd-amd64-linux.so)
==4122== by 0x108F4A: read_lock (hold_lock.c:56)
==4122== by 0x10903D: main (hold_lock.c:82)
==4122==
Done.
相关文章:

一次性同步修改多台linux服务器的密码
如何一次性修改多台linux服务器的密码,这是个问题,我给大家提供一个脚本,是前一段我刚刚写的,希望能对大家有所帮助一 , 需求:linux环境下运行,需要tcl和expect支持原理说明:利用expect的摸拟交互的功能&…
麻省理工学院的新系统TextFooler, 可以欺骗Google的自然语言处理系统及Google Home的音频...
来源 | news.mit编译 | 武明利责编 | Carol出品 | AI科技大本营(ID:rgznai100)两年前,Google的AI还不太成熟。一段时间以来,有一部分计算机科学研究一直致力于更好地理解机器学习模型如何处理这些“对抗性”攻击,这些攻…

Oracle VS DB2 数据类型
Oracle VS DB2 本文转自:http://www.bitscn.com/oracle/install/200604/16541.html首先,通过下表介绍ORACLE与DB2/400数据类型之间的对应关系,是一对多的关系,具体采用哪种对应关系,应具体问题具体分析。 OracleDB2/40…

死锁问题分析的利器——valgrind的DRD和Helgrind
在《DllMain中不当操作导致死锁问题的分析--死锁介绍》一文中,我们介绍了死锁产生的原因。一般来说,如果我们对线程同步技术掌握不牢,或者同步方案混乱,极容易导致死锁。本文我们将介绍如何使用valgrind排查死锁问题。(…
疫情可视化,基于知识图谱的AI“战疫”平台如何做?
来源 | DataExa渊亭科技武汉封城半个月,疫情依然严峻。但与17年前的SARS相比,我国在此次疫情防控工作中展现出了更高的医疗救治水平、更快的防疫反应速度、更透明的信息披露机制、更迅速的数据报送机制。在这场没有硝烟的战役中,社会各界团结…

mysql乐观锁总结和实践
2019独角兽企业重金招聘Python工程师标准>>> 上一篇文章《MySQL悲观锁总结和实践》谈到了MySQL悲观锁,但是悲观锁并不是适用于任何场景,它也有它存在的一些不足,因为悲观锁大多数情况下依靠数据库的锁机制实现,以保证操…

数据竞争(data race)问题分析的利器——valgrind的Helgrind
数据竞争(data race)是指在非线程安全的情况下,多线程对同一个地址空间进行写操作。一般来说,我们都会通过线程同步方法来保证数据的安全,比如采用互斥量或者读写锁。但是由于某些笔误或者设计的缺陷,还是存…

sql charindex函数
CHARINDEX函数返回字符或者字符串在另一个字符串中的起始位置。CHARINDEX函数调用方法如下: CHARINDEX ( expression1 , expression2 [ , start_location ] ) Expression1是要到expression2中寻找的字符中,start_location是CHARINDEX函数开始在expressi…
170亿参数加持,微软发布史上最大Transformer模型
来源 | 微软译者 | 刘畅出品 | AI科技大本营(ID:rgznai100)Turing Natural Language Generation(T-NLG)是微软提供的一个有170亿参数的语言模型,在许多NLP任务上均优于目前的SOTA技术。我们向学者演示了该模型…

iOS 开发 OC编程 数组冒泡排序.图书管理
// // main.m // oc -5 数组 // // Created by dllo on 15/10/28. // Copyright (c) 2015年 dllo. All rights reserved. // #import <Foundation/Foundation.h> #import "Student.h" #import "Book.h" int main(int argc, const char * argv[])…

C#中使用Monitor类、Lock和Mutex类来同步多线程的执行(转)
C#中使用Monitor类、Lock和Mutex类来同步多线程的执行 在多线程中,为了使数据保持一致性必须要对数据或是访问数据的函数加锁,在数据库中这是很常见的,但是在程序中由于大部分都是单线程的程序,所以没有加锁的必要,但是…
从0开始搭建编程框架——思考
需求来源于问题。(转载请指明出于breaksoftware的csdn博客) 之前有个人做前端开发的同学在群里问“C语言能做什么?能写网页么?”,然后大家就开始基于这个问题展开争辩。有的认为是“不能,从来没听说过C语言…
2月15日Python线上峰会免费学!6场精华分享,用代码“抗”疫
截至截止2月12号09时43分,新型冠状病毒在全国已确诊44726例,疑似病例已达21675例。而专家所说的“拐点”始终未至,受疫的影响,各大公司开启远程办公模式,将返回工作场所办公的时间一延再延。在抗疫前线,中国…

C#语言 数组
转载于:https://www.cnblogs.com/a849788087/p/4947939.html
从0开始搭建编程框架——主框架和源码
一个良好的结构是“对修改关闭,对扩展开放”的。(转载请指明出于breaksoftware的csdn博客) 这个过程就像搭建积木。框架本身需要有足够的向内扩展能力以使自身有进化能力,其次要有足够的外向扩展能力以使其可以方便定制业务。一般…
中文版开源!这或许是最经典的Python编程教材
整理 | AI科技大本营(ID:rgznai100)想入门Python,但一直没找到合适的参考书籍?《Think Python》是很多Python初学者的不二入门教材,受到广泛好评。该书原作者是美国Olin工程学院的教授Allen B. Downey,目前…

[流水账]毕业?工作?
离正常毕业时间还有1年多, 没想到这么早就开始感受到毕业的气息了. 前几天收到去参加IBM中国研究院校友座谈会的邀请, 因为有事没过去, 今天又接到了校友蒋师兄的电话来了解我的个人情况. 接到电话时蒋师兄先核对了一下信息, 然后要我介绍一下自己, 我做事一向比较谨慎, 对涉及…

Java并发编程-信号量
Semaphore 直译是信号量,它的功能比较好理解,就是通过构造函数设定一个数量的许可,然后通过 acquire 方法获得许可,release 方法释放许可。它还有 tryAcquire 和 acquireUninterruptibly 方法,可以根据自己的需要选择。…

从0开始搭建编程框架——插件
我将插件设计为两种类型。一种是框架自身携带的插件,用于增强其基础能力。一种是用户自定义插件,用于完成业务。本文将分别介绍在peleus框架下,这两种插件该怎么写。(转载请指明出于breaksoftware的csdn博客) 本文谈下…
蚂蚁金服AAAI收录论文曝光,动态网络剪枝方法、无语预训练的网络剪枝技术有重大突破...
来源 | 蚂蚁金服责编 | Carol出品 | AI科技大本营(ID:rgznai100)一年一度在人工智能方向的顶级会议之一AAAI 2020于2月7日至12日在美国纽约举行,旨在汇集世界各地的人工智能理论和领域应用的最新成果。以下是蚂蚁金服的技术专家对入选论文《基…

安装 Enthought Tool Suite 时遇到的问题
文:fasiondog 来源:http://blog.csdn.net/KongDong/archive/2009/05/26/4217942.aspx 因想研究一下Enthought Tool Suite ,尤其是可能需要使用其中的Chaco 和Envisage 软 件包,便安装试用一下。刚开始装机时曾经使用新立得安装过…

SQL知识累积
详细介绍select的文章,展示原始数据、SQL、查询结果,以及在不同数据库下SQL应该如何写。 https://en.wikipedia.org/wiki/Select_(SQL) 目录如下: Contents [hide] 1 Examples 2 Limiting result rows 2.1 ROW_NUMBER() window fu…
C++拾趣——使用多态减少泛型带来的代码膨胀
泛型编程是C语言中一种非常重要的技术,它可以让我们大大减少相似代码编写量。有时候,我和同事提及该技术时,称它是“一种让编译器帮我们写代码的技术”。(转载请指明出于breaksoftware的csdn博客) C是一门静态语言&…

如何成为一个优秀的程序员
本文给出了十五个评定软件开发人员的标准,可以帮助程序员朋友从一个好的程序员成为一个优秀的程序员,和大家共飨! 怎样评定一名软件开发人员?这是一个颇为奇怪的问题。现在已经有了很多的理论和形式来做这件事,人力资源…
2020年,最适合AI的5种编程语言
来源 | medium编译 | 张涛责编 | Carol出品 | AI科技大本营(ID:rgznai100)AI系统的开发必须有计算机代码,而计算机程序的开发有不同类型的编程语言可以选择。本文分析哪些编程语言最适合你的人工智能或机器学习用例开发。文中给出了一个想要在…

kafka生产者、消费者java示例
1. 生产者 import java.util.Properties; import kafka.javaapi.producer.Producer; import kafka.producer.KeyedMessage; import kafka.producer.ProducerConfig; public class MyProducer { public static void main(String[] args) { Properties props new Properti…
bug诞生记——临时变量、栈变量导致的双杀
这是《bug诞生记》的第一篇文章。本来想起个文艺点的名字,比如《Satan(撒旦)来了》,但是最后还是想让这系列的重心放在“bug的产生过程”和“缺失的知识点”上,于是就有了本系列这个稍微中性的名称。(转载请…
波士顿动力的机器狗上班了!巡逻、检测不在话下,挪威公司为其编发工号
作者 | 神经小刀来源 | HyperAI超神经(ID: HyperAI)AI 界的网红,波士顿动力机器狗 Spot ,近日获得了新的工作岗位,它将入职挪威的石油天然气开采公司 Aker ,负责巡检工作,还破天荒地获得了工牌和…

C语言运算符的优先级
() [] -> . (--->) ! ~ -- - (type类型) * & sizeof (<---) 单目运算符 * / % (--->) - (--->) << >> (--->) 移位运算符 < < > > (--->) 关系运算符 ! (--->) 等于或不等于&…

Java 多线程(六) synchronized关键字详解
多线程的同步机制对资源进行加锁,使得在同一个时间,只有一个线程可以进行操作,同步用以解决多个线程同时访问时可能出现的问题。 同步机制可以使用synchronized关键字实现。 当synchronized关键字修饰一个方法的时候,该方法叫做同…