bug诞生记——隐蔽的指针偏移计算导致的数据错乱
C++语言为了兼容C语言,做了很多设计方面的考量。但是有些兼容设计产生了不清晰的认识。本文就将讨论一个因为认知不清晰而导致的bug。(转载请指明出于breaksoftware的csdn博客)
class Base {
public:Base() = default;void set_v_b(int v_b) {_v_b = v_b;}int get_v_b() const {return _v_b;}
private:int _v_b;
};class Derived :public Base
{
public:Derived() = default;void set_v_d(int v_d) {_v_d = v_d;}int get_v_d() const {return _v_d;}
private:int _v_d;
};
Base是Derived的基类,前者拥有成员变量_v_b,后者拥有前者的_v_b和自己定义的_v_d。
我们分别构建一个Base和Derived对象数组
Base * build_base_list(size_t count) {Base *b_list = new (std::nothrow) Base[count];if (!b_list) {return nullptr;}for (size_t i = 0; i < count; i++) {b_list[i].set_v_b(static_cast<int>(i));}return b_list;
}Derived * build_derived_list(size_t count) {Derived *d_list = new (std::nothrow) Derived[count];if (!d_list) {return nullptr;}for (size_t i = 0; i < count; i++) {d_list[i].set_v_b(static_cast<int>(i));d_list[i].set_v_d(static_cast<int>(i));}return d_list;
}
我们再提供一个方法,用于遍历数组中对象的_v_b(Base基类定义的成员变量)。
void print_v_b(Base *b_list, size_t b_list_count) {if (!b_list) {return;}for (size_t i = 0; i < b_list_count; i++) {std::cout << "_v_b(" << i << "):" << b_list[i].get_v_b() << std::endl;}
}
然后我们对构建的两个数组分别调用print_v_b,以期望打印出各自的v_b。
const size_t count = 8;std::unique_ptr <Base, std::function<void(Base*)>> base_list(build_base_list(count),[](Base* p) {delete [] p;});std::cout << "base_list:" << std::endl;print_v_b(base_list.get(), count);std::unique_ptr <Derived, std::function<void(Derived*)>> derived_list(build_derived_list(count),[](Derived* p) {delete [] p;});std::cout << "derived_list:" << std::endl;print_v_b(derived_list.get(), count);
理论上,我们将看到两组相同的结果。因为base_list和derived_list中每个元素的_v_b是其在数组中的下标。然而结果是
base_list:
_v_b(0):0
_v_b(1):1
_v_b(2):2
_v_b(3):3
_v_b(4):4
_v_b(5):5
_v_b(6):6
_v_b(7):7
derived_list:
_v_b(0):0
_v_b(1):0
_v_b(2):1
_v_b(3):1
_v_b(4):2
_v_b(5):2
_v_b(6):3
_v_b(7):3
很明显,derived_list数组输出的元素信息不正确。
derived_list数组中的每个元素都是Base子类Derived的对象。理论上,对Derived对象,通过基类Base的方法访问,是可以获得正确数据的。那问题出在哪里?我们还要回到print_v_b方法中
void print_v_b(Base *b_list, size_t b_list_count) {if (!b_list) {return;}for (size_t i = 0; i < b_list_count; i++) {std::cout << "_v_b(" << i << "):" << b_list[i].get_v_b() << std::endl;}
}
我们看到第7行是通过数组下标的形式获取每个元素的。在C语言中,如果一个数组通过下标[]访问元素,其获取的元素实际地址是Head+index*sizeof(struct)。
我们分别看一个int型和long long型数组通过下标获取元素的取址值
const size_t count = 8;int integer_list[count];std::cout << "Head:" << integer_list << " sizeof(int):" << sizeof(int) << std::endl;for (size_t i = 0; i < count; i++) {std::cout << "integer_list[" << i << "] address:" << &integer_list[i] << std::endl;}long long longlong_list[count];std::cout << "Head:" << integer_list << " sizeof(int):" << sizeof(long long) << std::endl;for (size_t i = 0; i < count; i++) {std::cout << "longlong_list[" << i << "] address:" << &longlong_list[i] << std::endl;}
可以看到,虽然每次下标只是自增1,但是地址实际增加了每个元素的大小。
Head:0x7fffffffe900 sizeof(int):4
integer_list[0] address:0x7fffffffe900
integer_list[1] address:0x7fffffffe904
integer_list[2] address:0x7fffffffe908
integer_list[3] address:0x7fffffffe90c
integer_list[4] address:0x7fffffffe910
integer_list[5] address:0x7fffffffe914
integer_list[6] address:0x7fffffffe918
integer_list[7] address:0x7fffffffe91c
Head:0x7fffffffe900 sizeof(int):8
longlong_list[0] address:0x7fffffffe9a0
longlong_list[1] address:0x7fffffffe9a8
longlong_list[2] address:0x7fffffffe9b0
longlong_list[3] address:0x7fffffffe9b8
longlong_list[4] address:0x7fffffffe9c0
longlong_list[5] address:0x7fffffffe9c8
longlong_list[6] address:0x7fffffffe9d0
longlong_list[7] address:0x7fffffffe9d8
在print_v_b数组中,它默认认为数组中每个元素大小是Base对象的大小。然而derived_list数组中每个元素的是Derived对象大小。Derived类比Base类多一个元素_v_d,从而大小从Base对象的4字节变成了8字节。这样第7行中,每次下标移动实际只是移动了4字节,于是每个奇数次移动均移动到Derived对象的_v_d前,每个偶数次移动均移动到Derived对象的_v_b前。这就出现了上面的数据错乱的问题。
数组是C的遗产。为了兼容C,C++保留了很多C语言的印记,于是导致自身呈现出一些不清晰的表达。比如下面如下三种写法
- void print_t(T *t)
- void print_t(T t[])
- void print_t(T & t)
第3种写法,我们可以知道t是个对象。
第2种写法,我们可以知道t表达了一个数组。
第1中写法,则可以表达出t可以是一个数组,可以是一个对象。那么到底它是个组数还是对象?我们没法从语法上得知。
像本例中,使用者很有可能会把print_v_b的第一元素当成一个对象指针(当然第二个参数透露出其应该是一个数组,但是假如没有第二个参数呢?),那么他怎么也不会想到,对derived_list调用print_v_b会出错。
这从一个侧面可以说明,对于可以灵活表达的C++语言,我们需要采用一些易于理解的方式去设计API。
相关文章:
福利直投!这个活动承包你2020全年技术干货
CSDN技术公开课有奖评选开始啦~~听过课的小伙伴们,哪位讲师的分享让你获益匪浅?记得给TA投票哦!投票后获取入群方式,参与抽奖,奖品很丰厚哦~~进入付费时代,如今我们看似只要招招手,一切知识随手…

第四章 Controller接口控制器详解(5)——跟着开涛学SpringMVC
2019独角兽企业重金招聘Python工程师标准>>> 原创内容,转载请注明iteye http://jinnianshilongnian.iteye.com/ 4.15、MultiActionController 之前学过的控制器如AbstractCommandController、SimpleFormController等一般对应一个功能处理方法ÿ…
自动机器学习:团队如何在自动学习项目中一起工作?(附链接)
来源 | 数据派THU作者 | Francesca Lazzeri翻译 | 王琦责编 | Carol出品 | AI科技大本营(ID:rgznai100)去年11月,我写了一篇关于使用自动机器学习来进行AI民主化(democratization)的文章(见下面链接&#x…
C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(ubuntu g++)——插入
操作系统是ubuntu 18.04.1 server amd64,gcc是 7.3.0。编译产出是64位测试程序。(转载请指明出于breaksoftware的csdn博客) 因为加入测量,就会导致误差。我已经尽量将环境影响降低,但是还是难免有误差。大家可以通过文…

SSIS中的记录集目标
这一篇,我们来看看另外一个特殊的目标组件:记录集目标。它与DataReader目标有些类似,也是在内存中的。但与DataReader目标不同的是,它可以被下游任务使用。 它的使用也比较简单,我们一般指定一个变量来接收它的结果&am…

Leetcode: Maximum Depth of Binary Tree
题目:算出二叉树的最大深度 解决方案:(1)BFS (2)DFS (1)BFS 一层一层往下搜索,一直找到最深的点,这里由于节点的val是没有用的,所以可以用来存储当前节点的深度ÿ…
C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(ubuntu g++)——删除
相关环境和说明在《C拾趣——STL容器的插入、删除、遍历和查找操作性能对比(ubuntu g)——插入》已给出。本文将分析从头部、中间和尾部对各个容器进行删除的性能。(转载请指明出于breaksoftware的csdn博客) 删除 头部删除 元素…
一文告诉你,如何使用Python构建一个“谷歌搜索”系统 | 内附代码
来源 | hackernoon编译 | 武明利责编 | Carol出品 | AI科技大本营(ID:rgznai100)在这篇文章中,我将向您展示如何使用Python构建自己的答案查找系统。基本上,这种自动化可以从图片中找到多项选择题的答案。有一件事我们要清楚&…

WatchStor观察:思科携EMC等合作伙伴 圈地数据中心市场
早在今年3月,思科在加利福尼亚州圣何塞市展会中展示了“统一计算系统”(Unified Computing System)之后,我们就明白,数据中心市场将会发生巨大改变,传统的以IBM、惠普、戴尔和Sun为主导的服务器电脑市场,将受到以思科为…
使用BabeLua3.x在cocos2d-x中编辑和调试Lua
BabeLua是一款基于VS2012/2013的Lua集成开发环境,具有Lua语法高亮,语法检查,自动补全,快速搜索,注入宿主程序内对Lua脚本进行调试,设置断点观察变量值,查看堆栈信息等功能。 如何安装 请参考《系…

ASA与PIX的区别
很多年来,Cisco PIX一直都是Cisco确定的防火墙。但是在2005年5月,Cisco推出了一个新的产品——适应性安全产品(ASA,Adaptive Security Appliance)。不过,PIX还依旧可用。我已听到很多人在多次询问这两个产品…
C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(ubuntu g++)——遍历和查找
相关环境和说明在《C拾趣——STL容器的插入、删除、遍历和查找操作性能对比(ubuntu g)——插入》已给出。本文将分析各个容器中遍历和查找的性能。(转载请指明出于breaksoftware的csdn博客) 遍历 从前往后 元素个数>15000 t…
买不到口罩怎么办?Python爬虫帮你时刻盯着自动下单!| 原力计划
作者 | 菜园子哇编辑 | 唐小引来源 | CSDN 博客马上上班了,回来的路上,上班地铁上都是非常急需口罩的。目前也非常难买到正品、发货快的口罩,许多药店都售完了。并且,淘宝上一些新店口罩库存写着非常多,但不发货&#…

GlusterFS下如何修复裂脑文件?(续一)
关于网上一些修复GlusterFS裂脑文件的说明1、Fixing a GlusterFS split-brainhttps://inuits.eu/blog/fixing-glusterfs-split-brain在该文章中,删除无效副本时提供的方法如下:srv02$ sudo find /export/brick1/sdb1/ -samefile /export/brick1/sdb1/tes…

MySQL数据库环境使用全过程
在使用MySQL之前,需要建立数据库的环境来创建数据表,首先我们需要安装该数据库环境,即MySQL。1、下载MySQLMySQL的官方网站是http://www.mysql.org/,如图2-9所示:图2-9 MySQL官方网站当前稳定版本为5.1,我…
C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(Windows VirtualStudio)——插入
操作系统是Windows10 64bit,编译器是 Microsoft Virtual Studio Community 10。编译产出是64位测试程序。(转载请指明出于breaksoftware的csdn博客) 因为加入测量,就会导致误差。我已经尽量将环境影响降低,但是还是难免…
“夸夸机器人”App来了:变身百万粉丝大V,48万人给你的帖子点赞
来源 | mashable译者 | Kolen出品 | AI科技大本营(ID:rgznai100)我在Botnet上的第一条帖子获得了48万个赞。一款全新的社交媒体风格的应用为用户提供了生活在一个奇特网络虚拟世界的机会。在这个世界里,你将拥有数以百万计的粉丝,…

leetcode Reverse Linked List
Reverse a singly linked list 对于这种可以修改值的,把值逆序就可以了。。。。用vector存,然后逆序读。 都忘了指针怎么赋值初始化了。*p&head; 1 /**2 * Definition for singly-linked list.3 * struct ListNode {4 * int val;5 * Lis…
抗击新冠肺炎,如何进行实时动态时序图谱建模与分析?
作者 | 闭雨哲来源 | ThutmoseAI背景介绍新冠肺炎是一种具有最长达24天潜伏期的新型突发性传染疾病,这种特性给疫情防控带来了巨大的挑战,随着感染规模的不断扩增,简单的人为治理已不太奏效,使用“大数据”技术手段来辅助人为治理…
C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(Windows VirtualStudio)——删除
相关环境和说明在《C拾趣——STL容器的插入、删除、遍历和查找操作性能对比(Windows VirtualStudio)——插入》已给出。本文将分析从头部、中间和尾部对各个容器进行删除的性能。(转载请指明出于breaksoftware的csdn博客) 删除 …

关于服务器启动慢的问题
今天去了家医院的机房,走进去一看,TMD的医院就是有钱,全是光纤和千兆网络环境,全全是思科的三层交换机和路由器,HP的服务器。我们需要安装点东西,登录一台服务器,我一看配置,呵呵&am…

python依赖包exe文件安装问题
2019独角兽企业重金招聘Python工程师标准>>> 在使用python的exe程序安装依赖包的时候,经常会出现类似于下面的错误: python version 2.7 required,which was not found in the registry 可以使用如下代码解决该问题: # # script to register …
C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(Windows VirtualStudio)——遍历和删除
相关环境和说明在《C拾趣——STL容器的插入、删除、遍历和查找操作性能对比(Windows VirtualStudio)——插入》已给出。本文将分析各个容器中遍历和查找的性能。(转载请指明出于breaksoftware的csdn博客) 遍历 从前往后 travers…
技术战“疫”,贾扬清、李飞飞要给程序员直播讲AI技术!
「时势造英雄,英雄亦造时势。」在这场波及全球且看不见硝烟的疫情下,无数英雄日夜奋战,无论是身处一线的医护工作者、政府职能部门、志愿者,还是坚守在家的人民群众,都在尽自己所能,在行动!与此…

关于端口映射的一个命令
今天安装一个远程会诊的系统,由于是在不同和的地方,需要在路由器上作下映射,由于是要远程连接对方的服务器,所以要在对方的路由器上设置下Interface fastethernet0/0 Ip address 192.168.1.1 255.255.255.0 Duplex auto Speed aut…

elasticsearch简介
Elasticsearch是 面向文档型数据库,这意味着它存储的是整个对象或者 文档,它不但会存储它们,还会为他们建立索引,这样你就可以搜索他们了。你可以在 Elasticsearch 中索引、搜索、排序和过滤这些文档。不需要成行成列的数据。所以…

C++拾取——使用stl标准库生成等差、等比数列的方法
代码是思想的表达。阅读代码是一个猜测、求证的过程。这个过程非常费脑,所以人们都不喜欢啰啰嗦嗦的表达方式。于是在相同认知水平下,简洁高效的表达是喜闻乐见的。本文将抛砖引玉,通过一些案例讲解如何去简化代码。(转载请指明出…

利用NetBIOS名称与其他计算机通信
当某台计算机与网络中的其他计算机通信时,它是如何依据对方的计算机名称来得知其IP地址呢?名称解析的方法有以下几种: 检查NetBIOS名称缓存(NetBIOS name cache)广播直接向WINS服务器查询何谓NetBIOS名称:如…
编程语言性能实测,Go比Python更胜一筹?
作者 | Pawel Dziubałka, Sebastian Karasiewicz译者 | 泓技出品 | AI科技大本营(ID:rgznai100)互联网上有非常多的精彩代码,它们成了构建各种基础设施的基础。你正在阅读的这个平台同样也在致力于创建出色的代码。尽管普通用户一般不会注意…

mysql备份策略的制定
需要考虑的因素: 1. 数据库是不是都是innoDB引擎表 -》决定备份方式,热备或冷备 2. 数据量大小 -》逻辑备(量小)或物理备,全量或增量 3. 数据库本地空间是否充足 -》备份到本地或远程 4. 需要多快恢复 -》备份频率 小时…