bug诞生记——临时变量、栈变量导致的双杀
这是《bug诞生记》的第一篇文章。本来想起个文艺点的名字,比如《Satan(撒旦)来了》,但是最后还是想让这系列的重心放在“bug的产生过程”和“缺失的知识点”上,于是就有了本系列这个稍微中性的名称。(转载请指明出于breaksoftware的csdn博客)
本系列博文的案例将都秉承一个原则——“因知识缺失,而非粗心大意导致”。在实际工作中,粗心大意产生的bug太多了。但这是工作态度或者工作状态导致的,要去解决这个问题,可能会从机制、管理等角度来讲述。但是这不是本系列想讨论的。本系列更想讲述的是一种“无心之过”,即因为相应知识点的缺乏,程序员想当然的做法导致的bug。
这篇我将讲述一个真实发生在工作中的例子。当然实际的代码和逻辑远比下文例子要复杂很多,我只是抽出比较核心的点来分析。至于为什么要这么做?为什么要这么设计?为什么要这种风格?为什么代码不严谨?……等与问题核心无关的疑问,我都将不做辩论。这个“免责声明”也将贯穿本系列所有例子。
下面这段代码用于拼装出一个绝对路径
std::string get_name(const std::string& index) {char name[16] = "Movie";std::string full_name = std::string(name) + index;return full_name;
}int main() {char full_path[32] = "/home/work/";std::string name = get_name("1");const char* ptr_name = name.c_str();strcat(full_path + strlen(full_path), ptr_name);printf(full_path);return 0;
}
它将输出/home/work/Movie1。
目前它还没什么问题,后来发生的逻辑变更:只要返回固定的/home/work/Movie路径就行了。于是程序员的改法是
std::string get_name(/*const std::string& index*/) {char name[16] = "Movie";std::string full_name = std::string(name);// + index;return full_name;
}int main() {char full_path[32] = "/home/work/";std::string name = get_name(/*"1"*/);const char* ptr_name = name.c_str();strcat(full_path + strlen(full_path), ptr_name);printf(full_path);return 0;
}
程序员将之前的代码注释掉了,当然这个行为是非常不好的。
此时一个具有“良知”但是“缺乏知识点”的同事将走上“犯罪”的道路,因为他将抱着“优化代码”的目的去产生了第一个bug。他是这么改的
std::string get_name() {char name[16] = "Movie";return std::string(name);
}int main() {char full_path[32] = "/home/work/";const char* ptr_name = get_name().c_str();strcat(full_path + strlen(full_path), ptr_name);printf(full_path);return 0;
}
- 把注释掉的废弃代码给删掉了。这是值得肯定的。
- 精简了get_name函数,不再以full_name作为返回值,减少了一次std::string类型的构造和释放。这个也是值得肯定的。
- 精简了main函数,删除了std::string name局部变量,试图直接从get_name()获取const char*指针。他的想法是好的,但是这步将导致bug。
这段代码没有经过测试就上线了。因为他和QA都觉得这点小的改动不需要测试。很可惜,自以为是往往要付出代价。因为这段代码的最终执行结果是/home/work,而不是约定的/home/work/Movie。那Movie去哪里了?
问题就出在第8行代码。一般情况下我们认为它可以翻译为下面两行
std::string temp = get_name();
const char* ptr_name = temp.c_str();
如果的确是上面这么翻译的,那也没问题。但是实际上,temp是个行内的临时变量,它脱离了该行就被释放了。我们看下反汇编
const char* ptr_name = get_name().c_str();lea eax,[ebp-148h] push eax call get_name (0851672h) add esp,4 mov dword ptr [ebp-15Ch],eax mov ecx,dword ptr [ebp-15Ch] call std::basic_string<char,std::char_traits<char>,std::allocator<char> >::c_str (085166Dh) mov dword ptr [ptr_name],eax lea ecx,[ebp-148h] call std::basic_string<char,std::char_traits<char>,std::allocator<char> >::~basic_string<char,std::char_traits<char>,std::allocator<char> > (08513D9h)
第4行调用了get_name方法,返回的std::string对象指针放在eax中。
第6行将该对象指针放到当前函数栈帧内——即一个临时对象。
第7行又将临时对象地址放到ecx中。ecx在C++编译中,一般用于传递this指针。
第8行对ecx中保存的std::string临时对象的this指针调用了c_str成员方法,得到的const char*地址保存在eax中。
第9行将上一指令返回的const char*地址保存到ptr_name局部变量中,此时ptr_name指向的是std::string临时对象的字符空间地址。它也就在这一刻是该程序员所期望的样子。
第10行和第11行,又通过ecx调用std::string的析构函数。这样保存在[ebp-148h]中的std::string对象指针指向的临时对象被析构,也就意味着第9步得到的指针数据被删除了。
所以const char* ptr_name = get_name().c_str();正确的翻译是
const char* ptr_name = NULL;
{std::string temp = get_name();ptr_name = temp.c_str();
}
最终这个程序员老老实实的把main中那行“精简代码”变成了两行
std::string get_name() {char name[16] = "Movie";return std::string(name);
}int main() {char full_path[32] = "/home/work/"; std::string name = get_name();const char* ptr_name = name.c_str();strcat(full_path + strlen(full_path), ptr_name);printf(full_path);return 0;
}
我想经过这次惊魂实践,这个程序员应该再也不想碰这块代码了。
但是肯定还有其他“有良知”的程序员,他会觉得这代码很不爽——搞什么std::string?转来转去,最终还是用了const char*。
于是他修改如下
const char* get_name() {char name[16] = "Movie";return name;
}int main() {char full_path[32] = "/home/work/"; const char* ptr_name = get_name();strcat(full_path + strlen(full_path), ptr_name);printf(full_path);return 0;
}
- 将get_name方法的返回类型改成了const char*,省去了中间std::string的转换。
- 将main中的std::string全干掉了。
这段代码修改的足够简单了。有人可能会觉得get_name可能可以干掉,直接在main函数中写死路径就行了。我想当时这个程序员保留get_name的原因可能是他预测该函数可能还是存在被定制的可能性。
抛开其他问题,这段程序的执行结果是正确的。相信这个版本的修改者此时内心是澎湃的,因为他觉得他不费吹灰之力,就干了一件好事。可是实际他却挖了一个坑。
这段代码在线上稳定运行了很久,后来随着业务逻辑的增长。一个同学不小心在第8和第9行代码之间插入了一个函数调用,然后这个程序就崩掉了。相信这个同学一定很郁闷,因为他可能仅仅修改了一下函数调用顺序,或者写了一个足够简单到不太可能出错的代码。结果进程崩溃,他要背锅!
为了把问题简单化,我让新插入的代码只干一件事——初始化一个栈上空间。
const char* get_name() {char name[16] = "Movie";return name;
}void satan() {char name[16] = "I am Satan";
}int main() {char full_path[32] = "/home/work/"; const char* ptr_name = get_name();satan();strcat(full_path + strlen(full_path), ptr_name);printf(full_path);return 0;
}
这个程序的输出是/home/work/I am Satan。仅仅加了一个satan函数,就改变了结果?是的。这是由于之前那个做代码修改的同学对栈变量和栈帧不熟悉导致的。
如果要介绍栈变量和栈帧,这个就需要从计算机基础知识讲起。本文当然不会讲的很细,大家可以通过其他渠道获取这些知识。
下面的图只是表意,不是准确表达栈空间清空。但是核心的意思是一致的。
进入main函数时,栈结构如下
红色表示当前活动的栈空间;绿色表示“未知区域”,该区域的数据我们可以认为是“野”的,不可保障的。
进入get_name函数后,栈结构变化如下
get_name的name数组将保存“Movie”。
get_name调用结束,发生退栈行为。于是程序又回到main函数中,其栈结构如下
注意一下,第12行代码已经让ptr_name指向了“野”空间。此时“野”空间数据还没被污染,所以执行结果还是正确的。
然后我们调用了satan函数。进入satan函数后栈结构如下
注意一下,之前get_name的name空间已经被satan的name空间覆盖了。此时它的数据是“I am Satan”。
satan函数结束后,又回到main函数空间,其栈结构如下
我们看到,此时ptr_name还是指向“野”空间。只是此时空间不再是调用get_name时的情况,栈上数据已经被satan函数“污染”了。
所以出现错误的结果是必然的。
这段不到15行的代码经过多个程序员的修改后,仿佛成了一个江湖。其中发生了各种因为“知识点缺乏”而导致的bug。所以如果我们不知道代码最终精确的表达,可能就会写出各种“不经意”的问题。
相关文章:
波士顿动力的机器狗上班了!巡逻、检测不在话下,挪威公司为其编发工号
作者 | 神经小刀来源 | HyperAI超神经(ID: HyperAI)AI 界的网红,波士顿动力机器狗 Spot ,近日获得了新的工作岗位,它将入职挪威的石油天然气开采公司 Aker ,负责巡检工作,还破天荒地获得了工牌和…

C语言运算符的优先级
() [] -> . (--->) ! ~ -- - (type类型) * & sizeof (<---) 单目运算符 * / % (--->) - (--->) << >> (--->) 移位运算符 < < > > (--->) 关系运算符 ! (--->) 等于或不等于&…

Java 多线程(六) synchronized关键字详解
多线程的同步机制对资源进行加锁,使得在同一个时间,只有一个线程可以进行操作,同步用以解决多个线程同时访问时可能出现的问题。 同步机制可以使用synchronized关键字实现。 当synchronized关键字修饰一个方法的时候,该方法叫做同…

bug诞生记——const_cast引发只读数据区域写违例
对于C这种强类型的语言,明确的类型既带来了执行的高效,又让错误的发生提前到编译期。所以像const这类体现设计者意图的关键字,可以隐性的透露给我们它描述的对象的使用边界。它是我们的朋友,我们要学会和它相处,而不是…
听说Java被玩儿淘汰了?骨灰级程序员:远比你们想象的强大!
听过Java快被淘汰了?告诉你:没那么容易!Java从诞生至今,已经走过了20多年的历史,虽然相比新型的技术语言算是“老古董”,但是它的应用依然最为广泛,并且有着非常成熟的生态。而且我相信…

RapidFramework使用Oracle的步骤
1.在lib包中加入Oracle驱动2.修改generator.properties,注释掉mysql,打开oracle注释 jdbc.urljdbc:oracle:thin:127.0.0.1:1521:orcljdbc.driveroracle.jdbc.driver.OracleDriver 3.设置jdbc.schemaMEETRICEjdbc.catalog 注意:jdbc.schema的值为大写 4.修改jdbc.properties jdb…

拇指接龙游戏升级记录03(升级MainScene.cpp)
MainScene是拇指接龙游戏的主游戏场景文件,拥有近5000行代码。说实在的,实现自cocos2d-x 2.x版本向当下最新的3.8.1版本的升级过程,其中涉及的技术不是一下能够说明的。有些是形式上的简单修改,更多的则是性能上的提升相应的修改。…

Flex与.NET互操作(十二):FluorineFx.Net的及时通信应用(Remote Shared Objects)(三)
远程共享对象(Remote Shared Objects) 可以用来跟踪、存储、共享以及做多客户端的数据同步操作。只要共享对象上的数据发生了改变,将会把最新数据同步到所有连接到该共享对象的应用程序客户端。FluorineFx所提供的远程共享对象(Remote Shared Objects)和FMS的共享对…

ffmpeg api的应用——提取视频图片
这些年来,“短视频”吸引了无数网民的注意。相对于丰富有趣的内容,我们码农可能更关心其底层技术实现。本系列文章将结合ffmpeg,讲解几则视频处理案例。(转载请指明出于breaksoftware的csdn博客) “短视频”都是以“文…
蚂蚁金服AAAI论文:基于长短期老师的样本蒸馏方法和自动车险定损系统的最新突破...
来源 | 蚂蚁金服出品 | AI科技大本营(ID:rgznai100)一年一度在人工智能方向的顶级会议之一AAAI 2020于2月7日至12日在美国纽约举行,旨在汇集世界各地的人工智能理论和领域应用的最新成果。以下是蚂蚁金服的技术专家对入选论文《基于长短期老师…

C# 实现HTML转换成图片的方法
/// <summary> /// 通过WebBrowser控件来实现从HTML到Bmp图片的生成。 /// </summary> /// <param name"htmPath">HTML路径</param> /// <returns>Bmp图片路径</returns> private static st…
一套使用注入和Hook技术托管入口函数的方案
工作中,我们可能会经常使用开源项目解决一些领域中的问题。这种“拿来主义”是一种“专业人干专业事”的思想,非常实用。(转载请指明出于breaksoftware的csdn博客) 一般场景下,我们都是把开源项目代码编译到我们自己的…

微软发布虚机管理SCVMM 2008 R2 RC版
来源:IT168服务器频道近日,微软发布了SCVMM(系统中心虚拟机管理器,System Center Virtual Machine Manager)2008 R2的RC版本。据了解,新的SCVMM相比去年的版本增加了六大新功能,目前用户可以从W…
AI芯片行业发展的来龙去脉
作者 | 清华大学微电子学研究所尹首一来源 | 《微纳电子与智能制造》期刊引言人 工 智 能( aritificial intelligence ,AI )是 一 门融合了数学 、计算机科学 、统计学 、脑神经学和社会科学 的前沿综合性技术。它的目标是希望计算机可以像 人一样思考 ,…

8)排序②排序算法之选择排序[1]直接选择排序
1 #include<iostream>2 using namespace std;3 4 //*******直接选择排序*********5 int select_sort(int n,int array[100]){6 int i,j;7 for(i0;i<n;i){8 for(ji;j<n;j){9 if(array[i]>array[j]){ 10 int temparr…

一份招聘需求的分析
今早,长期合作伙伴又给我们一份招聘需求,以下是招聘条件: 工作性质:全职 工作地点:南京 发布日期:2009/6/15 截止日期:2009/6/30 招聘人数:6 工作经验:不限 学 历&…

bug诞生记——隐蔽的指针偏移计算导致的数据错乱
C语言为了兼容C语言,做了很多设计方面的考量。但是有些兼容设计产生了不清晰的认识。本文就将讨论一个因为认知不清晰而导致的bug。(转载请指明出于breaksoftware的csdn博客) class Base { public:Base() default;void set_v_b(int v_b) {_…
福利直投!这个活动承包你2020全年技术干货
CSDN技术公开课有奖评选开始啦~~听过课的小伙伴们,哪位讲师的分享让你获益匪浅?记得给TA投票哦!投票后获取入群方式,参与抽奖,奖品很丰厚哦~~进入付费时代,如今我们看似只要招招手,一切知识随手…

第四章 Controller接口控制器详解(5)——跟着开涛学SpringMVC
2019独角兽企业重金招聘Python工程师标准>>> 原创内容,转载请注明iteye http://jinnianshilongnian.iteye.com/ 4.15、MultiActionController 之前学过的控制器如AbstractCommandController、SimpleFormController等一般对应一个功能处理方法ÿ…
自动机器学习:团队如何在自动学习项目中一起工作?(附链接)
来源 | 数据派THU作者 | Francesca Lazzeri翻译 | 王琦责编 | Carol出品 | AI科技大本营(ID:rgznai100)去年11月,我写了一篇关于使用自动机器学习来进行AI民主化(democratization)的文章(见下面链接&#x…
C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(ubuntu g++)——插入
操作系统是ubuntu 18.04.1 server amd64,gcc是 7.3.0。编译产出是64位测试程序。(转载请指明出于breaksoftware的csdn博客) 因为加入测量,就会导致误差。我已经尽量将环境影响降低,但是还是难免有误差。大家可以通过文…

SSIS中的记录集目标
这一篇,我们来看看另外一个特殊的目标组件:记录集目标。它与DataReader目标有些类似,也是在内存中的。但与DataReader目标不同的是,它可以被下游任务使用。 它的使用也比较简单,我们一般指定一个变量来接收它的结果&am…

Leetcode: Maximum Depth of Binary Tree
题目:算出二叉树的最大深度 解决方案:(1)BFS (2)DFS (1)BFS 一层一层往下搜索,一直找到最深的点,这里由于节点的val是没有用的,所以可以用来存储当前节点的深度ÿ…
C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(ubuntu g++)——删除
相关环境和说明在《C拾趣——STL容器的插入、删除、遍历和查找操作性能对比(ubuntu g)——插入》已给出。本文将分析从头部、中间和尾部对各个容器进行删除的性能。(转载请指明出于breaksoftware的csdn博客) 删除 头部删除 元素…
一文告诉你,如何使用Python构建一个“谷歌搜索”系统 | 内附代码
来源 | hackernoon编译 | 武明利责编 | Carol出品 | AI科技大本营(ID:rgznai100)在这篇文章中,我将向您展示如何使用Python构建自己的答案查找系统。基本上,这种自动化可以从图片中找到多项选择题的答案。有一件事我们要清楚&…

WatchStor观察:思科携EMC等合作伙伴 圈地数据中心市场
早在今年3月,思科在加利福尼亚州圣何塞市展会中展示了“统一计算系统”(Unified Computing System)之后,我们就明白,数据中心市场将会发生巨大改变,传统的以IBM、惠普、戴尔和Sun为主导的服务器电脑市场,将受到以思科为…
使用BabeLua3.x在cocos2d-x中编辑和调试Lua
BabeLua是一款基于VS2012/2013的Lua集成开发环境,具有Lua语法高亮,语法检查,自动补全,快速搜索,注入宿主程序内对Lua脚本进行调试,设置断点观察变量值,查看堆栈信息等功能。 如何安装 请参考《系…

ASA与PIX的区别
很多年来,Cisco PIX一直都是Cisco确定的防火墙。但是在2005年5月,Cisco推出了一个新的产品——适应性安全产品(ASA,Adaptive Security Appliance)。不过,PIX还依旧可用。我已听到很多人在多次询问这两个产品…
C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(ubuntu g++)——遍历和查找
相关环境和说明在《C拾趣——STL容器的插入、删除、遍历和查找操作性能对比(ubuntu g)——插入》已给出。本文将分析各个容器中遍历和查找的性能。(转载请指明出于breaksoftware的csdn博客) 遍历 从前往后 元素个数>15000 t…
买不到口罩怎么办?Python爬虫帮你时刻盯着自动下单!| 原力计划
作者 | 菜园子哇编辑 | 唐小引来源 | CSDN 博客马上上班了,回来的路上,上班地铁上都是非常急需口罩的。目前也非常难买到正品、发货快的口罩,许多药店都售完了。并且,淘宝上一些新店口罩库存写着非常多,但不发货&#…