机器学习新闻综述:2019年AI领域不得不看的6篇文章
作者 | Limarc Ambalina
翻译 | 火火酱,编辑 | Carol
出品 | AI科技大本营(ID:rgznai100)
在这篇机器学习新闻综述中,我们将回顾一些2019年以来在人工智能各个领域广泛传播或产生影响的重大新闻。此外,我们还将简要介绍一些有意思的人工智能应用程序,几款2019年发布的游戏,以及一些机器学习项目的开源数据集资源。
自动驾驶汽车
1、特斯拉最新自动驾驶致死案与之前事故相似
文章链接:
https://www.wired.com/story/teslas-latest-autopilot-death-looks-like-prior-crash/
2019年对于特斯拉来说可以算是多事之秋了,该公司在这一年里遭遇了不少不幸。最引人注目的是,2019年5月,一场涉及特斯拉Model 3的悲剧事故导致驾驶员死亡。事故发生时,汽车启动了自动驾驶功能,在没有采取任何规避措施的情况下,直接撞上了一辆停在路边的卡车。这起事故导致人们对公路上常见的自动驾驶汽车的安全性产生了怀疑。
特斯拉Model 3:致命事故中的自动驾驶系统
https://www.bbc.com/news/technology-48308852
2、Waymo:“完全无人驾驶的Waymo就要来了”
文章链接:
https://techcrunch.com/2019/10/09/·waymo-to-customers-completely-driverless-waymo-cars-are-on-the-way
Waymo是自动驾驶汽车行业中另一家大型企业,该公司在去年推出了自己的自动驾驶汽车,消息一经发布便登上了新闻头条。严格来讲,Waymo隶属于谷歌的母公司Alphabet。它给其打车软件的所有用户发送了一封电子邮件,邮件中提到:您下一次的Waymo之旅或许会是完全自主的无人驾驶之旅。
自然语言处理 (NLP)
3. Open AI发布GPT1 1.5B
文章链接:
https://openai.com/blog/gpt-2-1-5b-release/
自然语言处理(NLP)领域中最大的事件之一就是在2019年11月发布的GPT2 1.5B。GPT2是来自于Open AI的文本生成神经网络,由于其生成自然语音文本的惊人能力而成为世界各地的头条新闻。一些作者甚至能够使用GPT2创建完整的文章,该技术吸引了许多在机器学习领域有影响力的人和多位著名科学家的关注。
NLP:
https://lionbridge.ai/articles/natural-language-processing-101/
使用GPT2创建完整的文章:
https://lionbridge.ai/articles/this-entire-article-was-written-by-an-ai-open-ai-gpt2/
Open AI曾经也发布过旧版本的神经网络,但是GPT2 1.5B是迄今为止的最强迭代。
在这篇文章中,Open AI解释了其5个主要发现:
1. GPT2的输出具有说服力和可信度。
2. 可以对GPT2神经网络进行微调以防滥用。
3. 合成文本检测极具挑战性。
4. 迄今为止,还没有能够证明滥用的有力证据。
5. 仍需制定出防止偏见的标准。
合成媒体
4. 美国众议院就深度伪造(Deepfake)的风险举行听证会
文章链接:
https://lionbridge.ai/articles/deepfakes-a-threat-to-individuals-and-national-security/
深度伪造(Deepfake)是2019年最大的机器学习主题之一。Deepfake所取得的全所未有的发展导致了对该技术的广泛滥用和公众的恐惧。因此,为了解和应对该技术可能会带来的威胁,美国情报委员会于2019年6月就Deepfake和AI相关问题召开了公开听证会。
视频链接:
https://youtu.be/lArPEDS0GTA
这篇文章总结了每位演讲者提出的核心观点、Deepfake的潜在风险以及其解决方法和对策。
相关文章:
众议院情报委员会将举行有关Deepfake和AI问题的公开听证会
https://intelligence.house.gov/news/documentsingle.aspx?DocumentID=657
一起来看看2020年的Deepfake。
https://lionbridge.ai/articles/a-look-at-deepfakes-in-2020/
5. Replica Studio简介
合成声音和音频是一项新兴产业,并在去年取得了飞跃性发展。Replica Studios是一家语音合成公司,该公司在2019年引起轰动,吸引了很多数据科学家、名人和对使用他们的软件感兴趣的游戏开发工作室的注意。
这种病毒式传播源自于是一段令人印象深刻的概念验证(proof-of-concept)视频,其中展示了桑达尔·皮查伊(谷歌的CEO)、杰夫·贝佐斯(亚马逊的CEO)、阿诺德·施瓦辛格、凯文·哈特、摩根·弗里曼、大卫·艾登堡、史努比·道格、艾伦·德杰尼勒斯,甚至是《The Witcher》中里维亚的合成语音。
视频链接:https://youtu.be/f4DgHI9J3U8
令人印象深刻的是,Replica Studios仅需几分钟的语音录音就可以合成任何语音副本。在一次采访中,Replica的首席执行官什里亚斯·尼瓦斯(Shreyas Nivas)说,这项技术已经到达了“合成声音与真实声音无法区分并且可以与人类声音媲美”的水平。
什里亚斯·尼瓦斯采访链接:
https://lionbridge.ai/articles/how-synthetic-voice-actors-rival-human-actors-an-interview-with-replica-studios/
数据集
6. Google如何通过Google Dataset Search来引领数据搜索
文章链接:
https://lionbridge.ai/articles/how-google-is-leading-the-quest-for-data-with-google-dataset-search/
获取训练数据是目前阻碍人工智能进步的重要因素之一。特别是在深度学习中,许多模型需要不止数千个,而是数百万个训练数据实例。因此,许多数据科学家和学生转而使用Kaggle这样的数据集聚合器,并依赖于社区提供的开源数据。为了改善对开源数据的访问,谷歌发布了一款仅用于发布和下载数据集的搜索引擎。
虽然Google Dataset Search在2019年仍处于测试阶段,但谷歌在1月23日宣布已索引了近2500万个数据集,该搜索引擎正式退出测试阶段。
2019年发布的有意思的人工智能应用程序和资源
Talk To Transformer——开源AI的GPT2 1.5B的用户友好型实现。任何人都可以使用:只需输入一个自定义提示、一篇文章的标题或一首歌的首句歌词,就可以看看文本生成神经网络会为你带来什么结果。
Talk To Transformer:https://talktotransformer.com/
Google Dataset Search——如上面第6篇文章中提到的,这是由谷歌提供的免费数据集搜索引擎。你可以在上面搜索开源的数据集,并学习如何通过搜索引擎爬取自己的资源。
Google Dataset Search:
https://datasetsearch.research.google.com/
AI Dungeon 2——一款文字冒险游戏,玩家的每一个决定都会带来独特的故事情节。在GPT2的驱动下,这款游戏可以有无数种可能,所有的故事都是不同的。点击以下链接查看示例:
https://lionbridge.ai/articles/creative-ai-the-storytelling-of-ai-dungeon/
AI Dungeon 2:https://play.aidungeon.io/
Ultimate Dataset Aggregator——来自Lionbridge AI的数据集聚合器,包括数百个开源数据集,跨越几十个用例和主题(包括计算机视觉、并行文本、生命科学、金融等等)。页面随着新数据集的不断更新而更新。
Ultimate Dataset Aggregator:
https://lionbridge.ai/datasets/ultimate-dataset-aggregator-for-machine-learning/
人工智能是世界上发展最快的行业之一,2020年肯定会有更多关于机器学习的重大新闻。希望以上提到的人工智能文章能激发你的兴趣。
原文:
https://hackernoon.com/machine-learning-news-roundup-6-essential-ai-articles-of-2019-gbw331i
(*本文由 AI 科技大本营编译,转载请联系微信1092722531)
【end】
◆
精彩推荐
◆
《原力计划【第二季】- 学习力挑战》正式开始!
即日起至 3月21日,千万流量支持原创作者更有专属【勋章】等你来挑战
推荐阅读
明天9点40直播 |「远程办公」专题线上峰会精彩继续
我用Python算出了同事的身份证号码 | 原力计划
被高估了的测试驱动开发?
看完就能独自把集群搭起来!Hadoop HDFS完全分布式环境搭建以及技术详解
Java 老矣,尚能饭否?2020 Java 生态系统报告出炉
36万美元套利!3 个步骤揭秘黑客DeFi闪电贷操盘全过程
你点的每个“在看”,我都认真当成了AI
相关文章:

GDB attach到进程
要调试守护进程等已经启动的进程或是调试陷于死循环的进程可以使用attach命令 格式 attach pid C语言代码 #include <stdio.h> int main(void) { int marks[10]; int i; for(i0;i<12;i) { scanf("%d",&marks[i]); …

Chrome使用技巧和编辑框拖动怪问题。
常用快捷键:ctrlshiftt 重新打开刚关闭的网页ctrlh 打开历史记录ctrl 放大。ShiftEscape 查看任务管理器据说Chrome能调整编辑区大小,我没发现。倒发现Chrome一个问题,选中编辑框中的文字,一直拖动鼠标&a…

Linux中断研究
2019独角兽企业重金招聘Python工程师标准>>> 研究linux系统,不管是做驱动、协议栈还是进程调度等等,都离不开中断。这说明,要想编写正确的linux代码,不了解中断是不行的。 话说曾几何时,在大学的课堂里&…
linux环境内存分配原理
Linux的虚拟内存管理有几个关键概念: Linux 虚拟地址空间如何分布?malloc和free是如何分配和释放内存?如何查看堆内内存的碎片情况?既然堆内内存brk和sbrk不能直接释放,为什么不全部使用 mmap 来分配,munm…
大脑芯片公司Neuralink计划在人脑内植入芯片,他们到底想干什么?
作者 | James Murphy翻译 | 火火酱,编辑 | Carol出品 | AI科技大本营(ID:rgznai100)说实话,科幻电影在遇到Neuralink时也不得不甘拜下风。2019年7月,埃隆马斯克(Elon Musk)宣布,他的公司正在研发…

判断链表是否存在环(及其延伸)
有一个单链表,其中可能有一个环,也就是某个节点的next指向的是链表中在它之前的节点,这样在链表的尾部形成一环。问题:1、如何判断一个链表是不是这类链表?2、如果链表为存在环,如果找到环的入口点…

iOS跳转到各种系统设置界面
定位服务 定位服务有很多APP都有,如果用户关闭了定位,那么,我们在APP里面可以提示用户打开定位服务。点击到设置界面设置,直接跳到定位服务设置界面。代码如下: //定位服务设置界面 NSURL *url [NSURL URLWithString:…

Linux内存管理大图(第三稿)
网友画的还不错就转了 ,该作者一共画了3版 v0.1 v0.2 v0.3 原文地址:http://bbs.chinaunix.net/thread-2018659-1-1.html

VNC的安装与使用
VNC的安装与使用。 说明:文章内容比较简单,献给那些初学者作为参考。 文章分为两部分,第一部分为VNC简介,第二部分为VNC的安装与使用。 文章为小弟结合书籍与小弟的实际操作总结出来的,如有错误与疏漏之处…
百度「AI战疫」:首次开源肺炎CT影像分析AI模型,让诊断从分钟到秒
自疫情爆发以来,多家科技公司纷纷加入了抗击疫情的战役中。 其中,排查疫情是这场战役的重中之重,而 CT 影像已成为新冠肺炎筛查和病情诊疗的重要依据。 然而,在当前疫情诊疗的关键时期,存量患者和新增患者总体数量庞…

Linux_DNS服务器
目录 目录DNS DNS ServerServerSite Master DNS ServerForward DomainReverse Resolution Slave DNS ServerForward lookupReverse lookupSplit DNS ServerDNS DNS(Domain Name System,域名系统),在Internet上作为域名和IP地址映射的一个分布式数据库&am…
多场景下的AI疫情防控“天网”:解读云边端联动下的全栈AI技术
在全民抗疫的特殊时期下,伴随着春运返潮,企业陆续复工,从重点防控的机场、火车站等场所,到学校、企业、社区等密集型场所,都是不能忽视的地点。除了人工逐一测量体温排查外,我们还发现,在人员复…

DHCP配置与DHCP中继代理2
实验二:<?xml:namespace prefix o ns "urn:schemas-microsoft-com:office:office" />Step1、配置DHCP中继代理1) 打开“管理工具”→“路由和远程访问”窗口,启用路由和远程访问,按向导提示完成操作。<?xml:namespac…

查看CPU是i386架构和x86_64架构
查看处理器是32位还是64位 #cat /proc/cpuinfo 检查flags行中有没有lm标记,lm是Long Mode的简写,表示支持64位模式。 #getconf LONG_BIT 输出:32 #getconf WORD_BIT 输出:32 32位的系统中int类型和long类型一般都是4字节&…

malloc一次性最大能申请多大内存空间
受用户态内存地址空间的限制。64 位系统下分配几个 T 不成问题。 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:zz matrix链接:http://www.zhihu.com/question/20836462/answer/22833295来源:知乎考…

MD5算法之C#程序
MD5算法比较特别,最适合用汇编语言来写,好多高级语言对之无能无力或效率极低。 比如我最开始尝试用Python和Euphoria编写,发现不太容易。相比而言,C#作为C家簇 中新兴的一门.net语言,功能比较全面。花了一晚上的工夫终…

unix环境汇编语言常用工具
汇编器 MASM:微软的汇编器不支持unix NASM:unix环境下兼容微软平台 GAS:GNU 的免费软件包,unix环境下最流行跨平台汇编器 安装GNU汇编器 检查binunits RedHat #rpm -qa |grep binunits Debian #dpkg -l|grep binunit 下载地…
用Python远程登陆服务器的最佳实践
来源 | Python编程时光(ID: Cool-Python)在使用 Python 写一些脚本的时候,在某些情况下,我们需要频繁登陆远程服务去执行一次命令,并返回一些结果。在 shell 环境中,我们是这样子做的。$ sshpass -p ${pass…

Exchange Server 2013 LAB Part 4.内部客户端访问
关于Exchange服务器内部客户端访问的更详细介绍,请参考Exchange Server 2010链接:http://xutonglin.blog.51cto.com/8549515/1390715每个组织在AD林中都至少有一台客户端访问服务器和一台邮箱服务器。另外,每个AD站点中都必须至少有一台客户端…

VirtualBox安装64位Linux
VirturlBox安装64位的Linux 原因 virtualbox 本身不带 64 位支持,它的 64 位支持依赖于通过cpu虚拟技术把cpu的64位指令直接映射过去。 所以,要支持64位必须: 1.你的cpu支持64位。 2.你的cpu支持虚拟化,并且你的bios支持把cpu虚…
6个步骤,告诉你如何用树莓派和机器学习DIY一个车牌识别器!(附详细分析)...
作者 | Robert Lucian Chiriac翻译 | 天道酬勤,编辑 | Carol出品 | AI科技大本营(ID:rgznai100)几个月前,作者开始考虑让汽车能够具备检测和识别物体的能力。他很喜欢这个主意,因为已经见识到了特斯拉的能力…

推荐bpython
可能很多人都对ipython比较熟悉,但是我这里要推荐的是bpython,我发现用起来更加顺手。详细的信息可以从其官方网站上获得。下面介绍几个主要的feature(使用系统为Linux):1. 语法高亮:2. 自动提示࿰…

几个定制 iTerm2 的 tip
重装 Mac 才想起来很多配置没有备份过, 找起来麻烦, 所以记一下 按文本开头搜索命令 一个是 Bash 里按上下键直接查找历史, 匹配开头相同的内容最开始是我朋友在 Matlab 下用到提到想要这个方案, 一起找了结果真有于是记录一下配置: ➤➤ cat ~/.inputrc "\e[A":hist…

从1的补码说起计算机的数制
字节换算 bit(b)位 字节(byte)8位 -128~127 0~255 半字2字节16位 -32768~32767 0~65,535 字(word)4字节32位 -2147483848~2147483647 0~4,294,967,295 双字8字节64位 -9223372036854775808~9223372036854775807 0~18,446,744…

类:认识类的继承
先新建一个 VCL Forms Application 工程, 代码中就已经出现了两个类:一个是 TForm 类; 一个是 TForm1 类; TForm1 继承于 TForm.TForm 是 TForm1 的父类; TForm1 是 TForm 的子类. Codeunit Unit1;interfaceuses Windows, Messages, SysUtils, Variants, Classes, Graphics, C…
机器会成为神吗?
作者 | Roman Wiligut翻译 | 天道酬勤,编辑 | Carol出品 | AI科技大本营(ID:rgznai100)看着科技的飞速发展,我们越来越想知道,到底科技发展有没有极限呢?在我看来,没有。至少在我们的…

1、Linux汇编——初识汇编
2019独角兽企业重金招聘Python工程师标准>>> 前序 本来想Qt能继续坚持下来,可是绕了一大圈,最终还是选择回到学期伊始的Linux汇编编程上来。鉴于图书馆只能借到这本书,虽然不厚,但是内容还是比较实用丰富,作…

汇编语言调用Linux系统调用
首先查找系统调用文件 #find / -name unistd.h /root/linux/include/unistd.h /usr/include/linux/unistd.h /usr/include/sys/unistd.h /usr/include/bits/unistd.h /usr/include/unistd.h 查看系统调用值 /root/linux/include/unistd.h #define __NR_setup 0 /* use…
为什么说Transformer就是图神经网络?
作者 | Chaitanya Joshi译者 | Kolen出品 | AI科技大本营(ID:rgznai100)前言有些工程师朋友经常问我这样一个问题:“图深度学习听起来很棒,但是现在是否有非常成功的商业案例?是否已经在实际应用中部署?”除…

IIS日志清理CMD版,VBS版,JS版,WSH版
IIS日志清理之IIS日志生成系统(CreateIISLog.vbs) 创建文件夹Function CreateFolder(Folder)On Error Resume NextSet FSO CreateObject("Scripting.FileSystemObject")FSO.CreateFolder(Folder)If Err>0 ThenErr.ClearCreateFolder FalseElseCreateFolder Tr…