当前位置: 首页 > 编程日记 > 正文

GitHub 遭抵制!AI 代码生成神器竟成“抄袭工具”?

整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

上周,微软、GitHub、OpenAI 三方联手推出的 AI 代码生成神器 GitHub Copilot 一经官宣便引起巨大关注:试问哪个开发者不想要这么一位“虚拟程序员”来解放自己的双手?

因此即使目前 GitHub Copilot 处于并不完美的技术预览版阶段,许多开发者们还是迫不及待地体验尝试。

可这一试,试出问题来了:GitHub Copilot 生成的代码为何这么眼熟,就连注释都“原汁原味”,这是抄袭吗?

真 · 雷神之“

其实有关 GitHub Copilot 直接复制代码的问题,微软早在官宣时就曾回应:“只有 0.1% 的情况下,GitHub Copilot 提供的代码建议中可能包含一些来自训练集的字符或片段。”

但微软口中的这个“0.1% 的情况”,已经出现了。

一位开发者 @mitsuhiko 在推特上公布了他的发现:让 GitHub Copilot 生成快速平方根倒数算法(Fast Inverse Square Root),结果出来的代码竟与《雷神之锤 3》中那段“传奇代码”一模一样!(注:快速平方根倒数算法也被称为平方根倒数速算法,此算法由于出现在《雷神之锤3》源代码中被人们所熟知。)

这段代码无疑是“抄袭”:不仅包含了快速平方根倒数算法中至今都无人理解的神奇数字“0x5f3759df”,就连当年《雷神之锤 3》开发者对这串数字的吐槽都保留得“原汁原味”。

如此一来,GitHub Copilot “抄袭代码”不仅实锤,还是真 · 雷神之“锤”,无法开脱,由此引发的代码版权问题也愈演愈烈。

GitHub Copilot 算是 GPL 协议中规定的衍生作品吗?

在 GitHub Copilot 直接复制快速平方根倒数算法这个过程中有个矛盾点,即这段代码是遵循 GNU GPL 2.0 协议进行开源的,而 GitHub Copilot 却要在未来扩展为付费服务提供。

(注:GNU GPL 2.0 协议要求任何包含该开源许可证的衍生作品,即使仅有几行代码,也必须免费提供全部源代码以及修改和分发它们的权利。)

在此基础上,就产生了一个巨大争议:这个现象表示 GitHub Copilot 在训练过程中必定使用过 GPL 协议下的代码,那么机器学习系统产生的作品,甚至机器学习系统本身,都算是 GPL 协议中规定的衍生作品吗?

  • 如果答案是“否”,那是不是说明开发者可以利用 GitHub Copilot 来“清除”代码的 GPL 协议,从此再也无需遵循该协议

  • 如果答案是“是”,那么不仅 GitHub Copilot 应该免费开源,整个 GitHub 都要成为一个开源项目:据 GitHub 博客中“在 GitHub Copilot 的早期开发过程中,作为内部试用的一部分,近 300 名员工在日常工作中使用了它”的说法,这些员工很有可能已经将 GitHub Copilot 生成的代码整合到 GitHub 的方方面面,那么 GitHub 就也应该是个开源项目。

为此,长期关注版权保护问题以及开源和自由软件的有力推动者 Julia Reda 写了一篇文章并坚定认为:GitHub Copilot 并未侵犯开发者的版权

她指出,简单地阅读和处理信息并不需要版权许可。举个例子,如果你去书店,从书架上拿一本书开始阅读,在这个过程中你是没有侵犯任何版权的,而人工智能这类数字技术的训练过程就是如此,它们需要大量内容数据。

Julia Reda 在文中表示:“版权和数字技术之间的确因此会有许多冲突,所幸政策制定者和法院早就意识到:如果每个技术副本都需要许可,那么数字技术将完全无法发展使用。

早在 2001 年,欧盟就允许这种作为技术过程一部分的临时性复制行为不受版权限制,尽管当时反对的声音颇多。

后来到 2019 年,欧盟研究协会更是要求欧洲版权法明确许可所谓的文本和数据挖掘,即永久存储受版权保护的作品以实现自动化分析。也就是说,根据欧洲版权法,无论使用何种许可协议,抓取 GPL 许可的代码或任何其他受版权保护的作品都是合法的。

此外,Julia Reda 还认为机器自动生成的代码不能视为衍生作品

  • 首先,有人认为即使复制受版权保护作品的最小摘录也构成侵犯版权,这很不合理。按这种说法,就算不提 GitHub Copilot 从训练数据中复制的短代码片段本来就不太可能达到原创标准,如果两个或多个开发人员在各自的程序中使用相同的基本代码,岂不是会产生无穷无尽的争议?

  • 其次,版权法只适用于智力创作——没有创作者,就没有作品。也就是说像 GitHub Copilot 这样的机器生成代码根本不符合版权保护的条件,因此也并不是衍生作品。

争议颇多,甚至有开发者决定退出 GitHub

即便 Julia Reda 如此主张,但广大开发者对此并不买账。GitHub Copilot 的版权争议引发了很多人对 Github 的不满,甚至有开发者因此决定退出 GitHub:

“我认为这是对版权持有人权利的严重侵犯,因此我不能继续依赖 GitHub 的服务。”

也有开发者批评 GitHub Copilot 将免费代码用作商业 AI 应用的资源:

“GitHub Copilot 自己也承认,他们接受过大量 GPL 代码的训练,所以我不知道为什么这不是一种将开源代码转化为商业作品的形式。”

那么对此你有什么看法吗?

参考链接:

  • https://juliareda.eu/2021/07/github-copilot-is-not-infringing-your-copyright/

  • https://news.ycombinator.com/item?id=27736650

  • https://twitter.com/mitsuhiko/status/1410886329924194309

更多精彩推荐
Windows 11 上手机!小米 8、一加 6T、微软 Lumia 950 XL 都可以运行深度学习教你重建赵丽颖的三维人脸Openpose+Tensorflow 这样实现人体姿态估计 | 代码干货点分享点收藏点点赞点在看

相关文章:

LAMP的安装及Xcache的配置

LAMP是LinuxApacheMySQLPHP的简称,意指以Linux作为服务器的操作系统,以Apache的HTTPD作为Web服务器,以PHP作为动态网页的解释器,以MySQL作为后端数据库管理系统,由此而搭建起来的一套Web服务器系统。为方便起见&#x…

Windows Server 2003 AD升级到Windows Server 2008 AD的方法及详细步骤

前言: Windows Server 2008 是现在企业比较流行的服务器操作系统,安全性高,配置灵活、方便,集成了Hyper-V虚拟化功能,能够充分发挥硬件的性能。Windows Server 2008改写了底层的网络传输代码,理论上&#x…

ASP.NET2.0 ReportingServices使用详解

ASP.NET2.0 ReportingServices使用详解 作者:清清月儿 主页:http://blog.csdn.net/21aspnet/ 时间:2007.4.9本文先做个简单介绍,更多关于ReportingServices的文章见后续。 1.打开BIDS,这是报表开发工具 2.新建项目 3.选择…

输出程序运行的时间(精确到微秒)

对于要求性能的代码&#xff0c;输出程序运行的时间还是很有必要的&#xff0c;而且需要较高的精确度&#xff0c;下面这个代码段就实现了此功能 注意&#xff1a;只限于Linux下使用&#xff0c;因为<sys/time.h>的缘故 1 #include <sys/time.h>2 #include <ios…

售前比售后机器人控制逻辑更复杂,仅凭大规模数据后发优势难赶超!

实现人与机器的自然交互&#xff0c;一直以来都是全世界人类的共同愿望&#xff0c;无数科学家倾尽毕生精力致力于实现这个目标。语言&#xff0c;作为人与外界交流最有效的工具&#xff0c;成为机器智能的重点研究对象&#xff0c;而对话型机器人则成为实现人机交互最早的突破…

JAVAEclipse:could not find the main class,program will exit!

JAVAEclipse:could not find the main class,program will exit! 遇到这个错误主要是当前的工程的jdk与eclipse的版本配置不匹配造成的&#xff0c;修改方法如下&#xff1a; 在当前工程点右键选择Properties->Java Compiler->选中Enable project specific settings->…

ASP.NET2.0 文本编辑器FCKeditor的冰冷之心 【月儿原创】

ASP.NET2.0 文本编辑器FCKeditor的冰冷之心 作者&#xff1a;清清月儿 主页&#xff1a;http://blog.csdn.net/21aspnet/ 时间&#xff1a;2007.4.9 FCKeditor是目前最好的html文本编辑器&#xff0c;如果还不明白的话看了下图就知道了效果图: 那么为什么说是FC…

转:strcat与strcpy与strcmp与strlen

转自&#xff1a;http://blog.chinaunix.net/uid-24194439-id-90782.html strcat 原型&#xff1a;extern char *strcat(char *dest,char *src);用法&#xff1a;#include <string.h>功能&#xff1a;把src所指字符串添加到dest结尾处(覆盖dest结尾处的\0)并添加\0。说明…

2021 EdgeX中国挑战赛盛大开幕,英特尔赋能开发者,助力创新方案落地

2021年7月12日&#xff0c;北京中关村论坛隆重举行。论坛上&#xff0c;英特尔研究院副总裁、英特尔中国研究院院长宋继强博士&#xff0c;北京市科委、中关村管委会高科技产业促进中心主任徐剑发表致辞并联合Linux基金会、VMware威睿等单位代表共同宣布2021 EdgeX中国挑战赛开…

构建安全的 ASP.NET 应用程序

最近开发的系统因为用到Asp.net的安全性方面的东西&#xff0c;所以拼命看MSDN&#xff0c;E文看着有点慢&#xff0c;还好现在在MSDN 中文网站中很多文章都有了翻译&#xff0c;所以今天索性在MSDN中文网站上找了一把&#xff0c;还真有。有感兴趣的朋友可以看看&#xff0c;不…

.NET2.0隐形的翅膀,正则表达式搜魂者【月儿原创】

.NET2.0隐形的翅膀&#xff0c;正则表达式搜魂者 作者&#xff1a;清清月儿 主页&#xff1a;http://blog.csdn.net/21aspnet/ 时间&#xff1a;2007.4.14 本文实现了&#xff1a;只能输入1个数字只能输入n个数字只能输入至少n个数字只能输入m到n个数字只能输入数…

连华为都在研究的计算机视觉,到底有多牛?

去年&#xff0c;华为在CCF-GAIR 大会上介绍了在人工智能领域的愿景&#xff0c;华为为了实现这个战略目标&#xff0c;从中梳理出深耕基础研究、打造全栈方案、投资开放生态和人才培养、解决方案增强、内部效率提升五大方向&#xff0c;以此打造无所不及的AI&#xff0c;构建万…

JS 点击弹出图片/ 仿QQ商城点击左右滚动幻灯片/ 相册模块,点击弹出图片,并左右滚动幻灯片...

1&#xff0c; 点击弹出图片 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns"http://www.w3.org/1999/xhtml"><head><meta ht…

Nginx+Tomcat实现反向代理与动静分离

1. 什么是动静分离 所谓动静分离就是通过nginx&#xff08;或apache等&#xff09;来处理用户端请求的静态页面&#xff0c;tomcat&#xff08;或weblogic&#xff09;处理动态页面&#xff0c;从而达到动静页面访问时通过不同的容器来处理。 2. 为什么做动静分离 Nginx处理静态…

白话经典算法系列之七 堆与堆排序

堆排序与高速排序&#xff0c;归并排序一样都是时间复杂度为O(N*logN)的几种常见排序方法。学习堆排序前&#xff0c;先解说下什么是数据结构中的二叉堆。二叉堆的定义二叉堆是全然二叉树或者是近似全然二叉树。二叉堆满足二个特性&#xff1a;1&#xff0e;父结点的键值总是大…

.NET2.0抓取网页全部链接【月儿原创】

.NET2.0抓取网页全部链接 作者&#xff1a;清清月儿 主页&#xff1a;http://blog.csdn.net/21aspnet/ 时间&#xff1a;2007.4.18 该方法经过对各大门户网站测试结果是抓取率100%&#xff01; 效果图 后台代码&#xff1a; using System;using System.Data;…

腾讯会议又一黑科技,屏蔽超过 200 种会议噪声是如何做到的?

作者 | 伍杏玲出品 | AI 科技大本营&#xff08;ID:rgznai100&#xff09;远程会议已成为我们常规的工作沟通方式&#xff0c;在线交流打破时间、空间的限制&#xff0c;给予我们便利之际&#xff0c;也屡遭尴尬&#xff1a;忘记静音&#xff0c;一边听会一边敲键盘&#xff0c…

zabbix之日志文件监控

一、日志item介绍 下面介绍zabbix另一个“重量级”的功能——日志文件监控&#xff0c;它最主要的是监控日志文件中有没有某个字符串的表达式&#xff0c;对应日志轮转与否&#xff0c;zabbix都支持。 在配置Item的时候&#xff0c;Type选择Zabbix agent (active)&#xff…

深度学习三巨头共同发文,聊聊深度学习的过去、现在与未来

作者|Yoshua Bengio,Yann LeCun,Geoffrey Hinton译者|香槟超新星出品|AI科技大本营(ID:rgznai100)人工神经网络领域的研究是基于对人类智能的观察而来&#xff1a;人类智能从高度并行的网络中产生&#xff0c;这些网络由结构相对简单的非线性神经元组成&#xff0c;通过调整连接…

ASP.NET2.0图片格式转换【月儿原创】

ASP.NET2.0图片格式转换 作者&#xff1a;清清月儿 主页&#xff1a;http://blog.csdn.net/21aspnet/ 时间&#xff1a;2007.4.20 说明&#xff1a;本文实现了图片格式随意转换&#xff08;下拉框选择&#xff09;&#xff1b;点击FileUpload立即显示图片&#xf…

org.apache.hadoop.fs-ChecksumException

当ChecksumFileSystem出现问题时抛出 1 package org.apache.hadoop.fs;2 3 import java.io.IOException;4 5 /** Thrown for checksum errors. */6 public class ChecksumException extends IOException {7 private long pos;8 public ChecksumException(String descriptio…

Linux下显示硬盘空间的两个命令

1.df -h &#xff0c;用于显示目前所有文件系统的可用空间及使用情况&#xff0c;示例如下&#xff1a; [rootmsg45 ~]# df -h Filesystem Size Used Avail Use% Mounted on /dev/mapper/vg_msg45-lv_root 50G 15G 33G 31% / tmpfs …

C#对Microsoft.VisualBasic My对象兰台妙选【月儿原创】

C#对Microsoft.VisualBasic My对象兰台妙选 作者&#xff1a;清清月儿 主页&#xff1a;http://blog.csdn.net/21aspnet/ 时间&#xff1a;2007.4.24 1.添加引用 2.引用Microsoft.VisualBasic 命名空间 3.所有的My对象应用皆出自以下类库&#xff0c;本文仅抛砖…

AIoT的发展路上,英特尔如何通过边缘计算掀起产业变革

你知道吗&#xff1f;到明年&#xff0c;仅我国的物联网连接规模将达到70亿&#xff0c;而全世界的人口也不过刚刚达到这个数字。物联网的爆发意味着什么&#xff1f;相信每个人都有着不同的答案&#xff0c;对于我国的14亿人口而言&#xff0c;即将全面到来的物联网红利不仅能…

Xbox One 游戏欣赏: Xbox Fitness 太极拳游戏

早就听说Xbox One中带有太极拳&#xff0c;这是我一直想练的&#xff0c;终于找到“死人定制”的师傅了。因为看书很难练&#xff0c;找不到联系场所&#xff0c;要么就要花价格不菲的学费。Xbox 360中的型可塑2012游戏中&#xff0c;包含了一个游戏章节就是Taiji&#xff0c;但…

Android美工坊:Selector选择器的使用

Android selector选择器可以让你切换自定义的背景风格&#xff0c;比如button、ListView、或者布局点击时候的背景切换等&#xff0c;都需要用到它 背景可以是自定义到颜色&#xff0c;或者图片资源 首先需要在你的res目录下创建drawable文件夹&#xff0c;然后在里面创建一个s…

C#中判断空字符串的3种方法性能分析【月儿原创】

C#中判断空字符串的3种方法性能分析 作者&#xff1a;清清月儿 主页&#xff1a;http://blog.csdn.net/21aspnet/ 时间&#xff1a;2007.4.28 3种方法分别是&#xff1a;string a"";1.if(a"")2.if(aString.Empty)3.if(a.Length0) 3种方法都是…

微软职位内部推荐-SDEII

微软近期Open的职位:Title: Software Development Engineer 2Group: Bing Client, Search Technology Center Asia, BingWork Location: Beijing/Suzhou, China Group OverviewSearch Technology Center Asia (STCA)STCA was founded in year 2005 and is now starting the sec…

WAIC剪影:AI的未来,关乎星辰大海

“天文学&#xff0c;是像数学一样的基础学科&#xff0c;而越是基础学科&#xff0c;就越难直接应用。”“我们没有想过盈利&#xff0c;这些技术目前来看也不太可能直接应用到其他领域。”“不管是优图还是腾讯公司层面&#xff0c;不是做的每件事情都要考虑它的经济价值或者…

用Swift实现一款天气预报APP(三)

这个系列的目录&#xff1a; 用Swift实现一款天气预报APP&#xff08;一&#xff09; 用Swift实现一款天气预报APP&#xff08;二&#xff09; 用Swift实现一款天气预报APP&#xff08;三&#xff09; 通过前面的学习&#xff0c;一个天气预报的APP已经基本可用了。至少可以查看…