当前位置: 首页 > 编程日记 > 正文

网红“AI大佬”被爆论文剽窃,Jeff Dean都看不下去了


作者 | 夕颜、Just
出品 | AI科技大本营(ID:rgznai100)

【导读】近日,推特上一篇揭露 YouTube 网红老师 Siraj Raval 新发表论文涉抄袭其他学者的帖子引起了讨论。揭露者是曼彻斯特大学计算机科学系研究员 Andrew M. Webb,他在 Twitter 上详细列举了Siraj Raval 抄袭的证据,包括内容观点、表格,甚至连方程式编号都照搬了原论文。

Siraj 论文链接:http://vixra.org/pdf/1909.0060v1.pdf
原论文:https://arxiv.org/pdf/1806.06871.pdf
所以在@sirajraval在昨天的直播中,他提到了他的“最新的神经量子比特论文”。我发现这篇文章其中很大一部分内容剽窃了 Nathan Killoran、Seth Lloyd 和其他共同作者的论文。在所附图片中,红色标记内容是 Siraj 的论文,绿色标记内容是原始论文(Nathan Killoran 等人的论文)
640?wx_fmt=png640?wx_fmt=png
可以看到, Siraj 与 Nathan Killoran 等人的论文存在大量相似之处,甚至图文表格都一模一样。
眼看事情败露,Siraj 迅速在 Twitter 道歉,承认了自己的剽窃行为。
640?wx_fmt=png
我看到有人指出我的神经量子比特论文涉嫌部分剽窃(partly plagiarized)。这是真的,我为此深表歉意。我在 1 周内完成了这个视频和论文,以跟上我每周 2 个视频的时间表。我本意是启发其他人进行研究。以后我会放慢脚步,并保证内容更加深思熟虑。

同时,Siraj 表示他已经从他的网站和 YouTube 上删除了这篇论文和相关视频。

640?wx_fmt=png640?wx_fmt=png

但是 Andrew M. Webb 并不买账,他对 Siraj 的回应表达了不满,表示“部分剽窃”的说法是虚假的,后者的论文剽窃的是 90% 的内容。他还喊话 Siraj 的粉丝,像这样的论文很可能是别人或一整支团队花费一年甚至更多的时间才有的成果,而不是一个人 1 周之内做出来的东西。

Andrew 还对 Siraj 的论文内容进行了暗讽,“你能解释下在你剽窃的版本中,“quantum gate(量子门)”和“复数希尔伯特空间(complex Hilbert space)”这两个专业术语是如何变成“quantum door”和“complicated Hilbert space”的么?你知道这些术语是什么意思么?”

Twitter 下也有人站出来现身说法,控诉自己的劳动成果也曾被 Siraj 如法炮制:
640?wx_fmt=png
他对我们的项目做了完全相同的事情(剽窃)。我们 4 个人花了几个月做的事情,好像变成他做的了,用他的闲暇时间东拼西凑,就为了完成他忙碌的 YouTube 日程安排。
当然,也有人表示仍然不相信 Siraj 是个骗子,毕竟每个人都会做错事。
但更多的人是像 Reddit 上这位网友一样信念崩塌:
之前,我还以为这个人是个天才,因为他比我的教授了解更多的科目。但是看完他的一两个视频后,我就知道,这对盲目跟随他的学生来说是最大的骗局。他要花 3 个月的时间来学习课程,甚至花了将近一年的时间才弄清最基础的东西。
还有人调侃,Siraj 简直就是机器学习领域的川普......

一个机器学习网红老师的“发家史”
640?wx_fmt=png
据了解,Siraj Raval 本人是线上教育网站((www.theschool.ai) )的创始人,其在简介中也称自己是一名数据科学家、AI 教育者,说唱歌手、作家、演讲者,其在 YouTube 上拥有近 70 万粉丝。
他在 YouTube 上讲 AI 课程的内容,其中一个视频的最高观看量有 100 万。
640?wx_fmt=png
尽管 Siraj 本人发表过论文,但某种程度上,网友认为他并不是一个专业研究学者。
事情发生后,虽然网上一片倒地开骂Siraj,但也有冷静的推特网友表示,如果  Siraj 以后改过自新,以后把 YouTube 视频的重点放在讲解更多科学家的研究上也许能挽回他的声誉,因为很多科学家都乐于支持那些有利于研究成果曝光的工作,这会让所有参与方更多地受益。
还有网友总结了此事件的教训:不要试着成为你不能成为的那种人。出于教育目的,他不必“发表”论文。想促进研究吗?制作“阅读和解释论文”的视频就好了,我觉得 Siraj 确实不需要通过“做研究”来赢得声誉。
640?wx_fmt=png

学术剽窃风波不断,如何“正本清源”?

这件事引起了大量关注,Jeff Dean 等人也在推特上对此事进行了转发,让事情进一步发酵。
事已至此,关于被剽窃的论文本身已不是重点,而是转移到了学术研究与非专业领域专家之间的矛盾。在专业的学术领域,网红或者说“外行”对学术传播起到的作用究竟是利大于弊,还是弊大于利?
事实上,这次事件只是冰山一角,关于学术造假、学术剽窃、学术不端背后,还有着更为深层次的痼疾。近年来,这些话题也时不时地出现在新闻头条中。
比如,在 2019 年计算机视觉领域两大顶会 ICCV与CVPR 双双爆出学术不端风波,南开大学程明明教授组被 ICCV 2019 接收的论文受到抄袭质疑,有人指出其摘要部分与另一篇发表于CVPR 2018 的论文摘要相似度非常之高。
640?wx_fmt=png
虽然最后 ICCV 鉴定两篇论文的相似度仅为 3%,认定不构成抄袭,但程明明承认学术不端行为确实存在,也再次重申了对这种行为的重视,表示今后将加强对论文的把控。
另一起学术不端风波涉及 CVPR 2019 接收的一篇论文,研究者 Jason Antic 指认这篇论文剽窃了自己的研究成果 Deoldify。640?wx_fmt=png
有趣的是,在被罗列出证据指认抄袭后,剽窃者提出了将 Jason Antic 的名字加入作者的行列中,列在第三位的解决方案。这波操作别说原作者不同意,学术研究界也拒绝这种无理也气壮的行为,纷纷声援 Jason。最后,剽窃者不得不以删除相关论文资料并注销各类账号了事。
以上述三起事件为例,虽然剽窃者在指认证据面前纷纷道歉,也遭受了声誉和研究事业上的损失,一定程度上维护了学术界的“纯净”,但是在实质性惩罚上,比如在顶会上发表论文受限等措施却没有跟上。可以预见,如果没有一个合理的奖惩措施,剽窃者仅是道歉、删稿就草草了事,以后类似事件恐怕还会继续上演。
总之,还 AI 学术界一片净土,社会各界还需努力。你觉得应该如何应对这些学术顽疾呢?欢迎在留言区出谋划策。

(*本文为 AI科技大本营原创文章,载请微信联系 1092722531

精彩推荐



2019 中国大数据技术大会(BDTC)再度来袭!豪华主席阵容及百位技术专家齐聚,15 场精选专题技术和行业论坛,超强干货+技术剖析+行业实践立体解读,深入解析热门技术在行业中的实践落地。

即日起,限量 5 折票开售,数量有限,扫码购买,先到先得!

640?wx_fmt=png

推荐阅读

  • 有了这套模板,再不担心刷不动LeetCode了

  • Google图嵌入工业界最新大招,高效解决训练大规模深度图卷积神经网络问题

  • Python可视化解析MCMC

  • 爬取B站视频排名第一《祖国大好河山》1W+弹幕,得出一份词频词云图

  • 技术领域有哪些接地气又好玩的应用?

  • Python新工具:用三行代码提取PDF表格数据

  • 国产嵌入式操作系统发展思考

  • 2019 年诺贝尔物理学奖揭晓!三得主让宇宙“彻底改观”

  • 公链故事难再续?

640?wx_fmt=png

你点的每个“在看”,我都认真当成了AI

相关文章:

数位dp(求1-n中数字1出现的个数)

题意:求1-n的n个数字中1出现的个数。 解法:数位dp,dp[pre][now][equa] 记录着第pre位为now,equa表示前边是否有降数字(即后边可不能够任意取,true为没降,true为已降);常规的记忆化搜…

TensorRT Samples: MNIST API

关于TensorRT的介绍可以参考: http://blog.csdn.net/fengbingchun/article/details/78469551 以下是参考TensorRT 2.1.2中的sampleMNISTAPI.cpp文件改写的实现对手写数字0-9识别的测试代码,各个文件内容如下:common.hpp:#ifndef FBC_TENSORR…

免费学习AI公开课:打卡、冲击排行榜,还有福利领取

CSDN 技术公开课 Plus--AI公开课再度升级内容全新策划:贴近开发者,更多样、更落地形式多样升级:线上线下、打卡学习,资料福利,共同交流成长,扫描下方小助手二维码,回复:公开课&#…

Gamma阶段第一次scrum meeting

每日任务内容 队员昨日完成任务明日要完成的任务张圆宁#91 用户体验与优化:发现用户体验细节问题https://github.com/rRetr0Git/rateMyCourse/issues/91#91 用户体验与优化:发现并优化用户体验,修复问题https://github.com/rRetr0Git/rateMyC…

windows 切换 默认 jdk 版本

set JAVA_HOMEC:\jdk1.6.0u24 set PATH%JAVA_HOME%\bin;%PATH%转载于:https://www.cnblogs.com/dmdj/p/3756887.html

TensorRT Samples: GoogleNet

关于TensorRT的介绍可以参考&#xff1a; http://blog.csdn.net/fengbingchun/article/details/78469551 以下是参考TensorRT 2.1.2中的sampleGoogleNet.cpp文件改写的测试代码&#xff0c;文件(googlenet.cpp)内容如下&#xff1a;#include <iostream> #include <t…

Visual Studio Code Go 插件文档翻译

此插件为 Go 语言在 VS Code 中开发提供了多种语言支持。 阅读版本变更日志了解此插件过去几个版本的更改内容。 1. 语言功能 (Language Features) 1.1 智能感知 (IntelliSense) 编码时符号自动补全&#xff08;使用 gocode &#xff09;编码时函数签名帮助提示&#xff08;使用…

资源 | 吴恩达《机器学习训练秘籍》中文版58章节完整开源

整理 | Jane出品 | AI科技大本营&#xff08;ID&#xff1a;rgznai100&#xff09;一年前&#xff0c;吴恩达老师的《Machine Learning Yearning》(机器学习训练秘籍&#xff09;中文版正式发布&#xff0c;经过一年多的陆续更新&#xff0c;近日&#xff0c;这本书的中文版 58…

js字符串加密的几种方法

在做web前端的时候免不了要用javascript来处理一些简单操作&#xff0c;其实如果要用好JQuery, Prototype,Dojo 等其中一两个javascript框架并不简单&#xff0c;它提高你的web交互和用户体验&#xff0c;从而能使你的web前端有非一样的感觉&#xff0c;如海阔凭鱼跃。当然&…

Vue开发入门看这篇文章就够了

摘要&#xff1a; 很多值得了解的细节。 原文&#xff1a;Vue开发看这篇文章就够了作者&#xff1a;RandomFundebug经授权转载&#xff0c;版权归原作者所有。 介绍 Vue 中文网Vue githubVue.js 是一套构建用户界面(UI)的渐进式JavaScript框架库和框架的区别 我们所说的前端框架…

TensorRT Samples: CharRNN

关于TensorRT的介绍可以参考&#xff1a; http://blog.csdn.net/fengbingchun/article/details/78469551 以下是参考TensorRT 2.1.2中的sampleCharRNN.cpp文件改写的测试代码&#xff0c;文件(charrnn.cpp)内容如下&#xff1a;#include <assert.h> #include <str…

Python脚本BUG引发学界震动,影响有多大?

作者 | beyondma编辑 | Jane来源 | CSDN博客近日一篇“A guide to small-molecule structure assignment through computation of (1H and 13C) NMR chemical shifts”文章火爆网络&#xff0c;据作者看到的资料上看这篇论文自身的结果没有什么问题&#xff0c;但是&#xff0c…

C++中public、protect和private用法区别

Calsspig : public animal,意思是外部代码可以随意访问 Classpig : protect animal ,意思是外部代码无法通过该子类访问基类中的public Classpig : private animal ,意思是告诉编译器从基类继承的每一个成员都当成private,即只有这个子类可以访问 转载于:https://blog.51cto.…

TensorRT Samples: MNIST(Plugin, add a custom layer)

关于TensorRT的介绍可以参考&#xff1a;http://blog.csdn.net/fengbingchun/article/details/78469551 以下是参考TensorRT 2.1.2中的samplePlugin.cpp文件改写的通过IPlugin添加一个全连接层实现对手写数字0-9识别的测试代码&#xff0c;plugin.cpp文件内容如下&#xff1a…

AutoML很火,过度吹捧的结果?

作者 | Denis Vorotyntsev译者 | Shawnice编辑 | Jane出品 | AI科技大本营&#xff08;ID&#xff1a;rgznai100&#xff09;【导语】现在&#xff0c;很多企业都很关注AutoML领域&#xff0c;很多开发者也开始接触和从事AutoML相关的研究与应用工作&#xff0c;作者也是&#…

tomcat6 配置web管理端访问权限

配置tomcat 管理端登陆 /apache-tomcat-6.0.35/conf/tomcat-users.xml 配置文件&#xff0c;使用时需要把注释去掉<!-- <!-- <role rolename"tomcat"/> <role rolename"role1"/> <user username"tomcat" password"…

@程序员:Python 3.8正式发布,重要新功能都在这里

整理 | Jane、夕颜出品 | AI科技大本营&#xff08;ID&#xff1a;rgznai100&#xff09;【导读】最新版本的Python发布了&#xff01;今年夏天&#xff0c;Python 3.8发布beta版本&#xff0c;但在2019年10月14日&#xff0c;第一个正式版本已准备就绪。现在&#xff0c;我们都…

TensorRT Samples: MNIST(serialize TensorRT model)

关于TensorRT的介绍可以参考&#xff1a; http://blog.csdn.net/fengbingchun/article/details/78469551 这里实现在构建阶段将TensorRT model序列化存到本地文件&#xff0c;然后在部署阶段直接load TensorRT model序列化的文件进行推理&#xff0c;mnist_infer.cpp文件内容…

【mysql错误】用as别名 做where条件,报未知的列 1054 - Unknown column 'name111' in 'field list'...

需求&#xff1a;SELECT a AS b WHRER b1; //这样使用会报错&#xff0c;说b不存在。 因为mysql底层跑SQL语句时&#xff1a;where 后的筛选条件在先&#xff0c; as B的别名在后。所以机器看到where 后的别名是不认的&#xff0c;所以会报说B不存在。 这个b只是字段a查询结…

C++2年经验

网络 sql 基础算法 最多到图和树 常用的几种设计模式&#xff0c;5以内即可转载于:https://www.cnblogs.com/liujin2012/p/3766106.html

在Caffe中调用TensorRT提供的MNIST model

在TensorRT 2.1.2中提供了MNIST的model&#xff0c;这里拿来用Caffe的代码调用实现&#xff0c;原始的mnist_mean.binaryproto文件调整为了纯二进制文件mnist_tensorrt_mean.binary&#xff0c;测试结果与使用TensorRT调用(http://blog.csdn.net/fengbingchun/article/details/…

142页ICML会议强化学习笔记整理,值得细读

作者 | David Abel编辑 | DeepRL来源 | 深度强化学习实验室&#xff08;ID: Deep-RL&#xff09;ICML 是 International Conference on Machine Learning的缩写&#xff0c;即国际机器学习大会。ICML如今已发展为由国际机器学习学会&#xff08;IMLS&#xff09;主办的年度机器…

CF1148F - Foo Fighters

CF1148F - Foo Fighters 题意&#xff1a;你有n个物品&#xff0c;每个都有val和mask。 你要选择一个数s&#xff0c;如果一个物品的mask & s含有奇数个1&#xff0c;就把val变成-val。 求一个s使得val总和变号。 解&#xff1a;分步来做。发现那个奇数个1可以变成&#x…

html传參中?和amp;

<a href"MealServlet?typefindbyid&mid<%m1.getMealId()%> 在这句传參中&#xff1f;之后的代表要传递的參数当中有两个參数第一个为type第二个为mid假设是一个參数就不用加&假设是多个參数须要加上&来传递

实战:手把手教你实现用语音智能控制电脑 | 附完整代码

作者 | 叶圣出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;导语&#xff1a;本篇文章将基于百度API实现对电脑的语音智能控制&#xff0c;不需要任何硬件上的支持&#xff0c;仅仅依靠一台电脑即可以实现。作者经过测试&#xff0c;效果不错&#xff0c;同时可以依据…

C++/C++11中左值、左值引用、右值、右值引用的使用

C的表达式要不然是右值(rvalue)&#xff0c;要不然就是左值(lvalue)。这两个名词是从C语言继承过来的&#xff0c;原本是为了帮助记忆&#xff1a;左值可以位于赋值语句的左侧&#xff0c;右值则不能。 在C语言中&#xff0c;二者的区别就没那么简单了。一个左值表达式的求值结…

Could not create the view: An unexpected exception was thrown. Myeclipse空间报错

转载于:https://blog.51cto.com/82654993/1424339

Banknote Dataset(钞票数据集)介绍

Banknote Dataset(钞票数据集)&#xff1a;这是从纸币鉴别过程中的图像里提取的数据&#xff0c;用来预测钞票的真伪的数据集。该数据集中含有1372个样本&#xff0c;每个样本由5个数值型变量构成&#xff0c;4个输入变量和1个输出变量。小波变换工具用于从图像中提取特征。这是…

快速适应性很重要,但不是元学习的全部目标

作者 | Khurram Javed, Hengshuai Yao, Martha White译者 | Monanfei出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;实践证明&#xff0c;基于梯度的元学习在学习模型初始化、表示形式和更新规则方面非常有效&#xff0c;该模型允许从少量样本中进行快速适应。这些方…

面试题-自旋锁,以及jvm对synchronized的优化

背景 想要弄清楚这些问题&#xff0c;需要弄清楚其他的很多问题。 比如&#xff0c;对象&#xff0c;而对象本身又可以延伸出很多其他的问题。 我们平时不过只是在使用对象而已&#xff0c;怎么使用&#xff1f;就是new 对象。这只是语法层面的使用&#xff0c;相当于会了一门编…