当前位置: 首页 > 编程日记 > 正文

死锁问题分析的利器——valgrind的DRD和Helgrind

在《DllMain中不当操作导致死锁问题的分析--死锁介绍》一文中,我们介绍了死锁产生的原因。一般来说,如果我们对线程同步技术掌握不牢,或者同步方案混乱,极容易导致死锁。本文我们将介绍如何使用valgrind排查死锁问题。(转载请指明出于breaksoftware的csdn博客)

构造一个场景

#include <pthread.h>pthread_mutex_t s_mutex_a;
pthread_mutex_t s_mutex_b;
pthread_barrier_t s_barrier;void lock() {pthread_mutex_lock(&s_mutex_b);{pthread_barrier_wait(&s_barrier);pthread_mutex_lock(&s_mutex_a);pthread_mutex_unlock(&s_mutex_a);}pthread_mutex_unlock(&s_mutex_b);
}static void* thread_routine(void* arg) {pthread_mutex_lock(&s_mutex_a);{pthread_barrier_wait(&s_barrier);pthread_mutex_lock(&s_mutex_b);pthread_mutex_unlock(&s_mutex_b);}pthread_mutex_unlock(&s_mutex_a);
}int main(int argc, char** argv) {pthread_t tid;pthread_mutex_init(&s_mutex_a, 0);pthread_mutex_init(&s_mutex_b, 0);pthread_barrier_init(&s_barrier, 0, 2);pthread_create(&tid, 0, &thread_routine, 0);lock();pthread_join(tid, 0);pthread_cancel(tid);pthread_barrier_destroy(&s_barrier);pthread_mutex_destroy(&s_mutex_a);pthread_mutex_destroy(&s_mutex_b);return 0;
}

这段代码我们只要关注lock和thread_routine两个方法。

lock方法在主线程中执行,它先给s_mutex_b上锁,然后通过屏障s_barrier等待线程也执行到屏障处(第21行)。

thread_routine是线程函数,它先给s_mutex_a上锁,然后通过屏障s_barrier等待主线程也执行到屏障处(第10行)。

主线程和子线程都执行到屏障处后,屏障被打开,它们继续向下执行:主线程执行到第12行试图获取s_mutex_a;子线程执行到第23行试图获取s_mutex_b。由于这两个互斥量已经被占用,所以产生死锁。

这是通过代码分析出来的,但是对于比较大的工程项目,我们则需要通过工具来分析。下面我们使用valgrind来分析

valgrind --tool=drd --trace-mutex=yes ./dead_lock

我们使用上面指令,让valgrind把互斥量相关的信息给打印出来

==4749== [1] mutex_init      mutex 0x30a040
==4749== [1] mutex_init      mutex 0x30a0a0
==4749== [1] mutex_init      mutex 0x1ffefffe10
==4749== [1] mutex_ignore_ordering mutex 0x1ffefffe10
==4749== [1] mutex_trylock   mutex 0x1ffefffe10 rc 0 owner 0
==4749== [1] post_mutex_lock mutex 0x1ffefffe10 rc 0 owner 0
==4749== [1] mutex_unlock    mutex 0x1ffefffe10 rc 1
==4749== [2] mutex_trylock   mutex 0x1ffefffe10 rc 0 owner 1
==4749== [2] post_mutex_lock mutex 0x1ffefffe10 rc 0 owner 1
==4749== [2] mutex_unlock    mutex 0x1ffefffe10 rc 1
==4749== [2] mutex_trylock   mutex 0x30a040 rc 0 owner 0
==4749== [2] post_mutex_lock mutex 0x30a040 rc 0 owner 0
==4749== [1] cond_post_wait  mutex 0x1ffefffe10 rc 0 owner 2
==4749== [1] mutex_unlock    mutex 0x1ffefffe10 rc 1
==4749== [1] mutex_destroy   mutex 0x1ffefffe10 rc 0 owner 1
==4749== [1] mutex_trylock   mutex 0x30a0a0 rc 0 owner 0
==4749== [1] post_mutex_lock mutex 0x30a0a0 rc 0 owner 0
==4749== [1] mutex_trylock   mutex 0x30a040 rc 1 owner 2
==4749== [2] mutex_trylock   mutex 0x30a0a0 rc 1 owner 1

第18行显示线程1试图给0x30a040互斥量上锁,但是该互斥量的所有者(owner)是线程2。

第19行显示线程2试图给0x30a0a0互斥量上锁,但是该互斥量的所有者(owner)是线程1。

如此我们便可以确定这段程序卡住是因为死锁导致的。

但是DRD有个问题,不能指出发生死锁的位置。这个时候Helgrind该出场了。

valgrind --tool=helgrind ./dead_lock 

helgrind执行时,如果发生死锁,需要ctrl+C来终止运行,于是可以得到如下结果

==5373== Process terminating with default action of signal 2 (SIGINT)
==5373==    at 0x4E5310D: __lll_lock_wait (lowlevellock.S:135)
==5373==    by 0x4E4C022: pthread_mutex_lock (pthread_mutex_lock.c:78)
==5373==    by 0x4C33FD6: ??? (in /usr/lib/valgrind/vgpreload_helgrind-amd64-linux.so)
==5373==    by 0x108A11: lock (dead_lock.c:12)
==5373==    by 0x108AF4: main (dead_lock.c:38)
==5373== ---Thread-Announcement------------------------------------------
==5373== 
==5373== Thread #2 was created
==5373==    at 0x518287E: clone (clone.S:71)
==5373==    by 0x4E49EC4: create_thread (createthread.c:100)
==5373==    by 0x4E49EC4: pthread_create@@GLIBC_2.2.5 (pthread_create.c:797)
==5373==    by 0x4C36A27: ??? (in /usr/lib/valgrind/vgpreload_helgrind-amd64-linux.so)
==5373==    by 0x108AEA: main (dead_lock.c:36)
==5373== 
==5373== ----------------------------------------------------------------
==5373== 
==5373== Thread #2: Exiting thread still holds 1 lock
==5373==    at 0x4E5310D: __lll_lock_wait (lowlevellock.S:135)
==5373==    by 0x4E4C022: pthread_mutex_lock (pthread_mutex_lock.c:78)
==5373==    by 0x4C33FD6: ??? (in /usr/lib/valgrind/vgpreload_helgrind-amd64-linux.so)
==5373==    by 0x108A5C: thread_routine (dead_lock.c:23)
==5373==    by 0x4C36C26: ??? (in /usr/lib/valgrind/vgpreload_helgrind-amd64-linux.so)
==5373==    by 0x4E496DA: start_thread (pthread_create.c:463)
==5373==    by 0x518288E: clone (clone.S:95)
==5373== 
==5373== ---Thread-Announcement------------------------------------------
==5373== 
==5373== Thread #1 is the program's root thread
==5373== 
==5373== ----------------------------------------------------------------
==5373== 
==5373== Thread #1: Exiting thread still holds 1 lock
==5373==    at 0x4E5310D: __lll_lock_wait (lowlevellock.S:135)
==5373==    by 0x4E4C022: pthread_mutex_lock (pthread_mutex_lock.c:78)
==5373==    by 0x4C33FD6: ??? (in /usr/lib/valgrind/vgpreload_helgrind-amd64-linux.so)
==5373==    by 0x108A11: lock (dead_lock.c:12)
==5373==    by 0x108AF4: main (dead_lock.c:38)

第22和37行分别显示子线程和主线程在中断之前,都锁在哪行,这样就更容易定位问题了。

相关文章:

疫情可视化,基于知识图谱的AI“战疫”平台如何做?

来源 | DataExa渊亭科技武汉封城半个月&#xff0c;疫情依然严峻。但与17年前的SARS相比&#xff0c;我国在此次疫情防控工作中展现出了更高的医疗救治水平、更快的防疫反应速度、更透明的信息披露机制、更迅速的数据报送机制。在这场没有硝烟的战役中&#xff0c;社会各界团结…

mysql乐观锁总结和实践

2019独角兽企业重金招聘Python工程师标准>>> 上一篇文章《MySQL悲观锁总结和实践》谈到了MySQL悲观锁&#xff0c;但是悲观锁并不是适用于任何场景&#xff0c;它也有它存在的一些不足&#xff0c;因为悲观锁大多数情况下依靠数据库的锁机制实现&#xff0c;以保证操…

数据竞争(data race)问题分析的利器——valgrind的Helgrind

数据竞争&#xff08;data race&#xff09;是指在非线程安全的情况下&#xff0c;多线程对同一个地址空间进行写操作。一般来说&#xff0c;我们都会通过线程同步方法来保证数据的安全&#xff0c;比如采用互斥量或者读写锁。但是由于某些笔误或者设计的缺陷&#xff0c;还是存…

sql charindex函数

CHARINDEX函数返回字符或者字符串在另一个字符串中的起始位置。CHARINDEX函数调用方法如下&#xff1a; CHARINDEX ( expression1 , expression2 [ , start_location ] ) Expression1是要到expression2中寻找的字符中&#xff0c;start_location是CHARINDEX函数开始在expressi…

170亿参数加持,微软发布史上最大Transformer模型

来源 | 微软译者 | 刘畅出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;Turing Natural Language Generation&#xff08;T-NLG&#xff09;是微软提供的一个有170亿参数的语言模型&#xff0c;在许多NLP任务上均优于目前的SOTA技术。我们向学者演示了该模型&#xf…

iOS 开发 OC编程 数组冒泡排序.图书管理

// // main.m // oc -5 数组 // // Created by dllo on 15/10/28. // Copyright (c) 2015年 dllo. All rights reserved. // #import <Foundation/Foundation.h> #import "Student.h" #import "Book.h" int main(int argc, const char * argv[])…

C#中使用Monitor类、Lock和Mutex类来同步多线程的执行(转)

C#中使用Monitor类、Lock和Mutex类来同步多线程的执行 在多线程中&#xff0c;为了使数据保持一致性必须要对数据或是访问数据的函数加锁&#xff0c;在数据库中这是很常见的&#xff0c;但是在程序中由于大部分都是单线程的程序&#xff0c;所以没有加锁的必要&#xff0c;但是…

从0开始搭建编程框架——思考

需求来源于问题。&#xff08;转载请指明出于breaksoftware的csdn博客&#xff09; 之前有个人做前端开发的同学在群里问“C语言能做什么&#xff1f;能写网页么&#xff1f;”&#xff0c;然后大家就开始基于这个问题展开争辩。有的认为是“不能&#xff0c;从来没听说过C语言…

2月15日Python线上峰会免费学!6场精华分享,用代码“抗”疫

截至截止2月12号09时43分&#xff0c;新型冠状病毒在全国已确诊44726例&#xff0c;疑似病例已达21675例。而专家所说的“拐点”始终未至&#xff0c;受疫的影响&#xff0c;各大公司开启远程办公模式&#xff0c;将返回工作场所办公的时间一延再延。在抗疫前线&#xff0c;中国…

C#语言 数组

转载于:https://www.cnblogs.com/a849788087/p/4947939.html

从0开始搭建编程框架——主框架和源码

一个良好的结构是“对修改关闭&#xff0c;对扩展开放”的。&#xff08;转载请指明出于breaksoftware的csdn博客&#xff09; 这个过程就像搭建积木。框架本身需要有足够的向内扩展能力以使自身有进化能力&#xff0c;其次要有足够的外向扩展能力以使其可以方便定制业务。一般…

中文版开源!这或许是最经典的Python编程教材

整理 | AI科技大本营&#xff08;ID:rgznai100&#xff09;想入门Python&#xff0c;但一直没找到合适的参考书籍&#xff1f;《Think Python》是很多Python初学者的不二入门教材&#xff0c;受到广泛好评。该书原作者是美国Olin工程学院的教授Allen B. Downey&#xff0c;目前…

[流水账]毕业?工作?

离正常毕业时间还有1年多, 没想到这么早就开始感受到毕业的气息了. 前几天收到去参加IBM中国研究院校友座谈会的邀请, 因为有事没过去, 今天又接到了校友蒋师兄的电话来了解我的个人情况. 接到电话时蒋师兄先核对了一下信息, 然后要我介绍一下自己, 我做事一向比较谨慎, 对涉及…

Java并发编程-信号量

Semaphore 直译是信号量&#xff0c;它的功能比较好理解&#xff0c;就是通过构造函数设定一个数量的许可&#xff0c;然后通过 acquire 方法获得许可&#xff0c;release 方法释放许可。它还有 tryAcquire 和 acquireUninterruptibly 方法&#xff0c;可以根据自己的需要选择。…

从0开始搭建编程框架——插件

我将插件设计为两种类型。一种是框架自身携带的插件&#xff0c;用于增强其基础能力。一种是用户自定义插件&#xff0c;用于完成业务。本文将分别介绍在peleus框架下&#xff0c;这两种插件该怎么写。&#xff08;转载请指明出于breaksoftware的csdn博客&#xff09; 本文谈下…

蚂蚁金服AAAI收录论文曝光,动态网络剪枝方法、无语预训练的网络剪枝技术有重大突破...

来源 | 蚂蚁金服责编 | Carol出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;一年一度在人工智能方向的顶级会议之一AAAI 2020于2月7日至12日在美国纽约举行&#xff0c;旨在汇集世界各地的人工智能理论和领域应用的最新成果。以下是蚂蚁金服的技术专家对入选论文《基…

安装 Enthought Tool Suite 时遇到的问题

文&#xff1a;fasiondog 来源&#xff1a;http://blog.csdn.net/KongDong/archive/2009/05/26/4217942.aspx 因想研究一下Enthought Tool Suite &#xff0c;尤其是可能需要使用其中的Chaco 和Envisage 软 件包&#xff0c;便安装试用一下。刚开始装机时曾经使用新立得安装过…

SQL知识累积

详细介绍select的文章&#xff0c;展示原始数据、SQL、查询结果&#xff0c;以及在不同数据库下SQL应该如何写。 https://en.wikipedia.org/wiki/Select_(SQL) 目录如下&#xff1a; Contents [hide] 1 Examples 2 Limiting result rows 2.1 ROW_NUMBER() window fu…

C++拾趣——使用多态减少泛型带来的代码膨胀

泛型编程是C语言中一种非常重要的技术&#xff0c;它可以让我们大大减少相似代码编写量。有时候&#xff0c;我和同事提及该技术时&#xff0c;称它是“一种让编译器帮我们写代码的技术”。&#xff08;转载请指明出于breaksoftware的csdn博客&#xff09; C是一门静态语言&…

如何成为一个优秀的程序员

本文给出了十五个评定软件开发人员的标准&#xff0c;可以帮助程序员朋友从一个好的程序员成为一个优秀的程序员&#xff0c;和大家共飨&#xff01; 怎样评定一名软件开发人员&#xff1f;这是一个颇为奇怪的问题。现在已经有了很多的理论和形式来做这件事&#xff0c;人力资源…

2020年,最适合AI的5种编程语言

来源 | medium编译 | 张涛责编 | Carol出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;AI系统的开发必须有计算机代码&#xff0c;而计算机程序的开发有不同类型的编程语言可以选择。本文分析哪些编程语言最适合你的人工智能或机器学习用例开发。文中给出了一个想要在…

kafka生产者、消费者java示例

1. 生产者 import java.util.Properties; import kafka.javaapi.producer.Producer; import kafka.producer.KeyedMessage; import kafka.producer.ProducerConfig; public class MyProducer { public static void main(String[] args) { Properties props new Properti…

bug诞生记——临时变量、栈变量导致的双杀

这是《bug诞生记》的第一篇文章。本来想起个文艺点的名字&#xff0c;比如《Satan&#xff08;撒旦&#xff09;来了》&#xff0c;但是最后还是想让这系列的重心放在“bug的产生过程”和“缺失的知识点”上&#xff0c;于是就有了本系列这个稍微中性的名称。&#xff08;转载请…

波士顿动力的机器狗上班了!巡逻、检测不在话下,挪威公司为其编发工号

作者 | 神经小刀来源 | HyperAI超神经&#xff08;ID: HyperAI&#xff09;AI 界的网红&#xff0c;波士顿动力机器狗 Spot &#xff0c;近日获得了新的工作岗位&#xff0c;它将入职挪威的石油天然气开采公司 Aker &#xff0c;负责巡检工作&#xff0c;还破天荒地获得了工牌和…

C语言运算符的优先级

() [] -> . (--->) ! ~ -- - (type类型) * & sizeof (<---) 单目运算符 * / % (--->) - (--->) << >> (--->) 移位运算符 < < > > (--->) 关系运算符 ! (--->) 等于或不等于&…

Java 多线程(六) synchronized关键字详解

多线程的同步机制对资源进行加锁&#xff0c;使得在同一个时间&#xff0c;只有一个线程可以进行操作&#xff0c;同步用以解决多个线程同时访问时可能出现的问题。 同步机制可以使用synchronized关键字实现。 当synchronized关键字修饰一个方法的时候&#xff0c;该方法叫做同…

bug诞生记——const_cast引发只读数据区域写违例

对于C这种强类型的语言&#xff0c;明确的类型既带来了执行的高效&#xff0c;又让错误的发生提前到编译期。所以像const这类体现设计者意图的关键字&#xff0c;可以隐性的透露给我们它描述的对象的使用边界。它是我们的朋友&#xff0c;我们要学会和它相处&#xff0c;而不是…

听说Java被玩儿淘汰了?骨灰级程序员:远比你们想象的强大!

听过Java快被淘汰了&#xff1f;告诉你&#xff1a;没那么容易&#xff01;Java从诞生至今&#xff0c;已经走过了20多年的历史&#xff0c;虽然相比新型的技术语言算是“老古董”&#xff0c;但是它的应用依然最为广泛&#xff0c;并且有着非常成熟的生态。而且我相信&#xf…

RapidFramework使用Oracle的步骤

1.在lib包中加入Oracle驱动2.修改generator.properties,注释掉mysql,打开oracle注释 jdbc.urljdbc:oracle:thin:127.0.0.1:1521:orcljdbc.driveroracle.jdbc.driver.OracleDriver 3.设置jdbc.schemaMEETRICEjdbc.catalog 注意:jdbc.schema的值为大写 4.修改jdbc.properties jdb…

拇指接龙游戏升级记录03(升级MainScene.cpp)

MainScene是拇指接龙游戏的主游戏场景文件&#xff0c;拥有近5000行代码。说实在的&#xff0c;实现自cocos2d-x 2.x版本向当下最新的3.8.1版本的升级过程&#xff0c;其中涉及的技术不是一下能够说明的。有些是形式上的简单修改&#xff0c;更多的则是性能上的提升相应的修改。…