OpenAI 以 10 亿美元出售「灵魂」,网友热评不再「Open」
编译 | 禾木木
出品 | AI科技大本营(ID:rgznai100)
OpenAI 如何以 10 亿美元的价格出售其灵魂:GPT-3 和 Codex 背后的公司并不像它声称的那样开放。
当金钱成为障碍时,最好的意图可能会被破坏。
近日,一篇“How OpenAI Sold its Soul for $1 Billion”在 Reddit 上成为了网友热议的话题。
Alberto Romero 的一篇文章追溯了 OpenAI 从非营利实体成为“营利上限”实体的历史和发展,为了金钱出卖了自己原有的“为人类造福”的宗旨。
OpenAI 成立于 2015 年,是一家非营利性研究机构,它的愿景是构建出安全、对人类有益的通用人工智能(AGI),由伊隆 · 马斯克、Sam Altman 等人宣布出资 10 亿美元成立。
短短4年时间,OpenAI 已经成为全世界最具盛名的 AI 研究机构。
2019 年,OpenAI 转变成了一家名为 OpenAI LP 的营利性公司,由名为 OpenAI Inc 的母公司控制。这时的 OpenAI 成为了一家「利润上限」机构,将投资回报限制在原始金额的 100 倍。也就是说,如果你投资 1000 万美元,最多你会得到 10 亿美元。看起来回报率不错。
在这种结构改变几个月后,微软宣布注资 10 亿美元。OpenAI 与微软的合作关系是基于一个重要的前提,即微软有权将 OpenAI 的部分技术商业化。正如我们在 GPT-3 和 Codex 上看到的那样。今年 5 月末,微软的官方网站便报道了他们用 GPT-3 的技术赋能内部商业产品,为用户服务。
当 OpenAI 因金钱关系与大型商业公司达成合作协议,还能相信他会信守承诺吗?从最初的愿景出发开发展人工智能吗?
AI Lab 金钱为上
OpenAI 是一个人工智能研究实验室,但它的雄心和自身所拥有的资源相比天差地别。必须获取足够的资源支持,其中,金钱始终是排在了第一位。
在 GPT-3 论文横空出世之后,外界的一个流行围观方式就是帮他们算成本,据估计 OpenAI 训练 GPT-3 耗费了 1200 万美元——仅仅是用于训练。
GPT-3 是一个大规模语言模型,光参数量就已达到 1750 亿。如果没有交易,他们很难获得这么雄厚的研究经费。所以当 OpenAI 需要投资的时候,发现微软当时正等着给自己提供云计算服务。于是他们和拥有云服务的微软形成了合作,至于代价,就是一种未公开的,将其系统商业化的晦涩许可。
这样,一方可以获得计算资源,一方可以达到盈利,真是一个双赢的结果。
早在,2020年2月时,MIT Technology Review 记者 Karen Hao 的一篇调查文章探究了微软与 OpenAI 的合作。披露了 OpenAI 与公开宣称的内容与内部的运营方式存在不一致之处,为什么一家以确保所有人拥有更美好未来为愿景的公司突然决定为「stay relevant」吸收大量私有资金?从非盈利到盈利的转变引发了公众甚至公司内部的强烈批评。
艾伦人工智能研究所负责人 Oren Etzioni 表达了怀疑的态度:我不同意非盈利组织无法具备竞争力的观点…… 如果规模更大、资金更充裕就能做得更好,那么今天 IBM 仍将是世界第一。
曾为 Vice News 撰稿的 Caroline Haskins 则不相信 OpenAI 仍会忠于它的使命:「人类从未因为依靠风投机构而变得更好。」
从技术角度来看,OpenAI 当前的研究方向重点是需要更大算力与更大数据驱动的神经网络,这就需要很多金钱的支持。只有比肩科技巨头的投入才能在这条道路上走下去。但正如 Etzioni 所说的,金钱并不是在 AI 领域里实现最先进成果的唯一途径,有时需要创造性地思考新的想法,而不是靠堆更多的算力,或是更多的数据。
OpenAI 是如何沉沦的?
GPT-2、GPT-3「危险」语言生成器
2019 年初,已经成为营利性公司的 OpenAI 发布了一个强大的语言生成模型——GPT-2,能够生成接近人类的自然语言文本。尽管 GPT-2 在当时是一个巨大的飞跃,但研究人员认为其像一只“危险的怪兽”,所以不能开源出来。工程师们担心 GPT-2 会被用来生成假新闻、垃圾信息和误导信息。
但在不久之后,OpenAI 又认为不存在明显被滥用的证据,因而将其开源出来。
罗格斯大学教授 Britt Paris 曾表示:「这看起来就像是 OpenAI 在利用人工智能可能给人类社会带来的恐慌。」大多数人把 GPT-2 的报道视为一种宣传策略,他们认为该系统其实并不像 OpenAI 声称的那样强大。从营销的角度来看这确实可以吸引注意力,但 OpenAI 否认了这些指控。
如果 GPT-2 没有 OpenAI 宣称的那么强大,那为什么要让它看起来比实际更危险呢?如果它真的性能强大,为什么仅仅因为「没有发现被滥用的有力证据」而完全开源?无论如何,OpenAI 似乎都没有遵循自己的道德标准。
2020 年 6 月,GPT-3 随后以 API 的形式向外界提供。OpenAI 似乎认为这个比 GPT-2 大 100 倍,更强大的新系统足够安全,可以与世界分享。他们设置条款逐个审查每个访问请求,但他们仍然无法控制系统最终用于什么目的。
他们甚至在文章中承认, 如果 GPT-3 落入坏人之手可能会发生一些问题。例如“误导性信息、垃圾邮件、网络钓鱼、滥用法律、政府内容,学术欺诈、社会工程,再到性别、种族和宗教偏见。”
他们认识到了这些问题,但仍然决定让用户付费测试。并且通过 API 发布,为什么要通过 API 发布它而不是开源模型?OpenAI 回答说,这是为他们正在进行的AI 研究、安全和政策努力提供资金。
一句话总结就是:“负责”保护人类免受 AI 伤害的公司决定让人们使用一个能够制造虚假信息和危险偏见的系统,这样他们就可以负担昂贵的维护费用。看起来这并不是什么「对所有人有益的价值」。
所以,当时社交网络上出现 GPT-3 有害的讨论就是顺理成章的了。Facebook 人工智能负责人 Jerome Pesenti 写了一条推文,在推文中举了一个例子,谈到 GPT-3 可能会生成加剧种族与性别歧视的文本。
在一项利用 GPT-3 独特性的尝试中,UC Berkeley 的计算机系学生 Liam Porr 让系统写了一篇能提高写作效率的文章,并将其分享了出来。这篇文章骗过了很多人,甚至登上了 Hacker News 的榜首。试想,如果像他这样没有恶意的学生都能够设法用 AI 写的文章骗过所有人,一群怀有恶意的人会用它做什么?比如传播假新闻?
除了传播假新闻,另一个危害是传播人类无法区分的假新闻。这一点也被 OpenAI 在一篇文章中认可、甚至强调了:
人类在检测 GPT-3 175B 生成的较长文章时的平均准确率仅略高于 52%。这表明,GPT-3 能够继续生成人类难以区分的、长度约为 500 字的新闻文章。
Copilot 潜在的法律问题
Codex and Copilot,侵权了吗?
几周前,OpenAI、GitHub和微软联合发布了 Copilot ,这是一个基于 Codex 之上的 AI 结对编程助手。
然而,却引来了强烈批评,因为 Copilot 是用 GitHub 公共存储库的开源代码盲目训练的。
以为用户在 Hacker News 上指出了使用 Copilot 可能存在的法律问题,比如:
AI 生成的代码属于我还是 GitHub?
生成的代码用什么许可证?
如果生成的代码侵权,谁来担责或采取法律行动?
GitHub 首席执行官 Nat Friedman 回答说成果属于操作者,但是其他问题并未回应。
另外,著名开源开发者 Armin Ronacher 也在 Twitter 上分享过 Copilot 抄袭大量受版权保护代码的例子。
还有用户称,「有直接证据表明 Copilot 直接复制了 GPL 的大量代码。证明这是在商业环境中使用的非常危险的工具。」
不过,最让人想不通的是,Copilot 是在数千名开发人员生成的开源代码上训练的,然后GitHub 或 OpenAI 又将这一系统出售给相同的开发人员使用。
对此,程序员兼游戏设计师 Evelyn Woods说,「这感觉就像是当面嘲笑开源。」
我们还能寄希望于 OpenAI 吗?
OpenAI 现在的真实愿景到底是什么?
他们是不是与微软紧密相连,以至于忘记了自己「为人类进步」而奋斗的初衷?还是说他们真的以为自己拥有最好的工具和人才来践行这条路线,即使将灵魂出卖给一个大型科技公司也在所不惜?我们是否真的愿意让 OpenAI 按照它的愿景来构建未来?还是说我们希望我们的愿景更加多样化,并将其与经济利益分离?
OpenAI在迈向更加复杂的人工智能道路上占据了主导地位,当然,也有许多其他有潜力的机构在做相关的工作,这些机构并没有与金钱产生直接的联系,因而也受到了外界广泛的关注。
就目前来看,大型科技公司的目标似乎是并不是建立一个满足科学好奇心的通用人工智能,也不是建立一个最安全、最负责、最道德的人工智能。他们的首要任务是赚钱!他们会不惜一切做到这一点,即使这意味要走上一条模糊的道路,而我们大多数人都会避开这一道路。
OpenAI 的联合创始人马斯克甚至也认同这些批评:
马斯克:我觉得 OpenAI 应该再开放一点。
OpenAI 已经不再“Open”
在 Reddit 上,Alberto Romero 的文章也引起了网友的讨论。
网友纷纷称:OpenAI 早已应该更名为“ClosedAI”。
也许 OpenAI 公司扔在坚持他们最初的使命,但他们不能为了达到目的不择手段。因为这些手段可能会损害更高的目的。
我们想要 AGI 吗?从科学的角度来看,答案不可能是否定的。人们对于科学的好奇心是没有极限的,然而,我们应该时刻评估潜在的危险。核聚变是非凡的,但核弹不是。
我们想不惜一切代价实现 AGI 吗?从道德的角度来看,答案不可能是肯定的。这些快速发展的技术将对我们所有人产生影响,所以我们应该注意到这个问题。
我们正在快速地更新这些深刻改变人们生活的技术。但是,如果只关心自己的利益和目标,无论是 OpenAI 还是其他人,最后都应该对后果承担很大的责任。
对此,你怎么看呢?
参考链接:
https://onezero.medium.com/openai-sold-its-soul-for-1-billion-cf35ff9e8cd4
https://www.reddit.com/r/MachineLearning/comments/pizllt/d_how_openai_sold_its_soul_for_1_billion_the/
https://news.ycombinator.com/item?id=27676939
https://www.technologyreview.com/2020/02/17/844721/ai-openai-moonshot-elon-musk-sam-altman-greg-brockman-messy-secretive-reality/
https://www.theverge.com/2019/11/7/20953040/openai-text-generation-ai-gpt-2-full-model-release-1-5b-parameters
https://syncedreview.com/2019/11/05/openai-releases-1-5-billion-parameter-gpt-2-model/
本文由AI科技大本营翻译,转载请注明出处。
相关文章:

IBM IMM默认ID 及修改默认IP 方法
默认ID: http://192.168.70.125 用户名:USERID 密码:PASSW0RD (数字0) BIOS 下更改IP方法:(另一种可进IMM 进行修改,此处不再介绍) 本文转自easy80851CTO博客,原文链接:http://blog.51cto.com/6…

squid 优化指南
很多squid 优化只限于在 squid参数和系统参数上面的调整。但是这个实在只是细枝末节的事情,只要不是太弱智的配置导致无法缓存,squid的性能不会有太大差距,也就提高10%左右,只有实际的业务针对squid 进行一些调整,squi…

Android TextView
2019独角兽企业重金招聘Python工程师标准>>> 1、TextView不用获取焦点也能实现跑马灯 public class MarqueeTextView extends TextView { Override protected void onFocusChanged(boolean focused, int direction, Rect previouslyFocusedRect) { if(focused) …

人脸识别模型的动手实践!
作者:宋志龙 来源:Datawhale人脸识别已经成为生活中越来越常见的技术,其中最关键的问题就是安全,而活体检测技术又是保证人脸识别安全性的一个重要手段,本文将向大家简单介绍活体检测,并动手完成一个活体检…

Pyqt5学习系列
最近在学习Pyqt5做界面,找到了一个非常棒的博主的学习系列 在此记录下来: http://blog.csdn.net/zhulove86/article/category/6381941

编程方式刷新Squid缓存服务器的五种方法
网站进行内容更新是常有的事情,当被缓存的资源更新时,前端Squid 缓存服务器内容也必须要相应的更新,否则用户就可能会看到过期的数据。当没有程序支持时就需要每次登录到服务器上执行刷新操作,在服务器数量小的的时候这种方式还可…

Android 实时文件夹
实时文件夹是一种用来显示由某个ContentProvider提供的数据信息的桌面组件。要创建一个实时文件夹,必须要有两个方面的支持。 1,要定义一个用来创建实时文件夹的Activity。 2,所指定数据信息URI的ContentProvider必须支持实时文件夹时文件夹查…

《新程序员002》图书正式上市! 从“新数据库时代”到“软件定义汽车”
20年前,伴随着互联网打开信息化大门,技术人成为新时代的开拓者。在时代的召唤下,CSDN于2001年推出国内首个面向IT人员的专业杂志——《程序员》,成为一代代开发者的技术启蒙。20年后的今天,人工智能、云计算、大数据等…

Xtrabackup bug记录
xtrabackup 2.1.2 2.1.3 均出现以下问题: 123xtrabackup: warning: Log block checksum mismatch (block no 191401143 at lsn 3946288081920):expected 800836998, calculated checksum 800832263xtrabackup: warning: this is possible when the log block has n…

RHEL5上配置VNCSERVER
VNC一个远程显示系统,管理员通过它不仅仅可以在运行程序的本地机上察看桌面环境,而且可以从 Internet上的任何地方察看远程机器的运行情况,而且它具有跨平台的特性。 Linux 要使用远程桌面需要安装VNC,Centos5,RHCE5 已经自带了VN…

勒索软件层出不穷,Veeam “3-2-1-1-0”助力构建数据防护
随着 AI、IoT、云原生等前沿技术的发展,近年来勒索病毒的攻击手段不断升级,赎金也越来越高:例如今年美国最大燃油管道受攻击导致美国17个州和华盛顿特区进入紧急状态,2020 年 Ripple20 0day 漏洞曝光,波及数亿台联网设…

大数据架构和模式(一)——大数据分类和架构简介
概述 大数据可通过许多方式来存储、获取、处理和分析。每个大数据来源都有不同的特征,包括数据的频率、量、速度、类型和真实性。处理并存储大数据时,会涉及到更多维度,比如治理、安全性和策略。选择一种架构并构建合适的大数据解决方案极具挑…

Windows 7 开发新特性
10月25日在西安举行的Windows 7 社区发布活动中我讲了Session1 -- Windows 7 概览。参会的人员达到62人,这个参加人数超过了我的预期,非常开心. 主要讲了一下内容: 一 构建于稳固的基础平台 1 . 改进的基础平台 兼容性: 兼容基于Windows Vista构建的应用程序与设备 …

GitHub 的 AI 编程工具漏洞高达 40% ,再次陷入争议……
整理 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 在近日发表的一篇论文中,研究人员对 GitHub Copilot 人工智能编程辅助工具进行了深入调查。结果发现,仍处于测试预览阶段的 Copilot 具有高达 40% 的错误代码率,意味…

centos中mysql重置密码
1 . 用空密码方式使用root用户登录 MySQL; mysql -u root 2. 修改root用户的密码; mysql> update mysql.user set passwordPASSWORD(’新密码’) where User’root’; mysql> flush privileges; mysql> quit 3. 重新启动MySQLÿ…

Centos 内存占满 释放内存
2019独角兽企业重金招聘Python工程师标准>>> 一台服务器,今天用 free -m 查看,发现内存跑满了。 再 top,然后按下shiftm,也就是按内存占用百分比排序,发现排在第一的进程,才占用0.9%,…

Android开发实践:为什么要继承onMeasure()
首先,我们写一个自定义View,直接调用系统默认的onMeasure函数,看看会是怎样的现象: 12345678910111213141516171819202122package com.titcktick.customview; import android.content.Context; import android.util.AttributeSet;…

Android_CodeWiki_01
记录常用代码片,以备不时之需..wkakak,开始: 1、 精确获取屏幕尺寸(例如:3.5、4.0、5.0寸屏幕) 1 public static double getScreenPhysicalSize(Activity ctx) { 2 DisplayMetrics dm new Displ…

centos vnc配置笔记
1.首先查询是否安装VNC Serverrpm -qa |grep vnc如果有类似于:vnc-server-的值返回说明已经安装了vnc-server如果没有安装采用yum安装yum -y install vnc2.配置VNC用户如果以root登录的话,输入vncpasswd Password:Verify:设置root用户的VNC登录用户名和密…

普通大学生和大厂的距离有多长?
随着夏季的离去,金九银十招聘季已经悄然而至,现在正处于大厂招聘高峰期,是找工作的好时机。对于程序员这个行业来说,进大厂意味着高工资、高福利以及巨大的晋升空间,这是普通公司无法提供的,因此࿰…

ovirt官方安装文档 附录F
附录F:在单独的机器上安装Websocket代理 websocket代理允许用户通过noVNC和SPICE HTML5控制台连接到虚拟机。noVNC客户端使用websocket传递VNC数据。但是,QEMU中的VNC服务器不提供websocket支持,因此必须在客户端和VNC服务器之间放置一个webs…

CentOS重启启动Apache,VNC
centos 重启 apache #service httpd restart 重启 VNC #service vncserver restart 重启mysql # /etc/init.d/mysqld start 重启nginx #/usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf

调侃 -- 刚入职时的单纯
借个漫画调侃下刚入职时傻傻的想法当然也不是说排斥加班,既然选择了这个行业,也做好了加班的准备还好现在的公司不怎么加班,相比某些企业简直不能算是加班对于哪些上班好几年的老员工,下班后仍能坚持在工位上做下去,我…

AI市场扩大催生多样化标注需求
爱数智慧创始人兼CEO张晴晴在服贸会论坛上做主题分享 9月3日,由中国信通院云计算与大数据研究所,亚太工程组织联合会主办的《2021中国智能产业论坛》在2021服贸会上成功举办,论坛现场,北京爱数智慧创始人兼CEO张晴晴做《多模态标…

五、DNS与bind
DNS服务可以为用户提供域名和IP之间的自动转换。通过DNS,用户只需输入机器的域名即可访问相关的服务,而无需使用那些难以记忆的IP地址。DNS帮助用户在互联网上寻找路径,在互联网上的每一个计算机都拥有一个唯一的地址,称作IP地址。…

Nutch 二次开发之parse正文内容
关于nutch的基础知识能够參考lemo的专栏 nutch支持二次开发,为了满足搜索的准确率的问题,考虑只将网页正文的内容提取出来作为索引的内容,相应的是parse_text的数据。我使用的事nutch1.4 版本号,在cygwin下运行crawl命令进行爬取。…

翼方健数曹华:构建数据和计算互联网的必由之路
智能时代,数据无疑是最活跃的生产要素,它将决定未来的生产力和生产关系。其中,共享和保护数据,促进数据流通,并最大化数据价值是业内技术发展所关注的焦点。 诞生在这一背景下的隐私计算技术正在蓬勃发展,…

vi常用命令以及 冒号输入
按i进入输入模式 输入: 按ESC结束输入 按:w保存退出 pageup上翻页 pagedown下翻页 :w保存 :q!不保存 :wq保存离开 i o a编辑模式 ESC一般模式 dd 删除光标所在整行 yy 复制光标所在整行

Zabbix(六):项目实战之--自动发现nginx调度器及后端web服务集群、自定义参数监控...
项目: 1.自动发现nginx调度器及后端apache构建的web服务集群; 2.使用自定义参数监控调度器上nginx服务的相关统计数据及速率数据; 3.使用自定义参数监控后端apache服务的相关统计数据及速率数据;(选做) 4.制定出nginx调度器及后端…

ONNX 浅析:如何加速深度学习算法工程化?
AlphaGo击败围棋世界冠军李世石以来,关于人工智能和深度学习的研究呈现井喷之势。各种新的算法和网络模型层出不穷,令人眼花缭乱。与之相随的,深度学习的训练和推理框架也在不断的推陈出新,比较著名的有:微软的CNTK、G…