当前位置: 首页 > 编程日记 > 正文

人工智能写手,好用吗?

640?wx_fmt=jpeg


作者 | 王树义

来源 | 玉树芝兰(ID:nkwangshuyi)

1、印象

之前给学生上课的时候,我介绍过利用循环神经网络,仿照作家风格进行创作的机器学习模型。不过,那模型写出来的东西嘛……

640?wx_fmt=jpeg

我的评价是:望之,不似人语。


因为这种限制,人们并没有把“机器写作”当成一回事儿。总觉得机器要写成那种以假乱真的高度,可能还需要等上很久远的一段时间。

然而,这世界变化快。

2、工具

早上,我尝试了一个新工具。

一个在线编辑器界面里,输入或长或短的一段话,然后按一下 Tab 键。

后面的内容,机器就帮你自动逐步填充。


640?wx_fmt=jpeg


填充的过程里,系统每次给你3个备选方案,这样你可以控制写作思路的走向。

当然,你也可以根本不管其他选项,一直走默认路径。机器照样文思泉涌。

最后生成的文章,是这个样子的。

640?wx_fmt=jpeg

其中,第一段落是我自己随便瞎写的。后面高亮段落,都是电脑模型自己编出来的。不但标点符号、语法修辞用得有鼻子有眼儿,就连我那段里根本没有提到过的创始人,都跳了出来长篇大论。

3、尝试


大家也可以通过下面的链接进行尝试,智能写作编辑器的链接:

https://transformer.huggingface.co/

不知道你尝试过后的感觉是什么。反正我觉得,以后学校里的英文写作课,怕是没有办法判作业了。原本需要学生花半个小时完成的任务,现在他可以轻点几下按键,就能搞定交差。更要命的是,从原理来讲,查重系统面对这种作品,是无效的。


640?wx_fmt=jpeg

因为这并非抄袭。机器每一次的“创作”,几乎都能保证是全新的。

4、原理

你一定想知道这背后的原理吧?其实,在我们之前的教程里,我多次给你介绍过它。就是目前最火的自然语言模型架构——Transformer。


640?wx_fmt=jpeg

(上图来自于经典之作“Attention is All You Need”)

我们详细介绍过使用方法的 BERT ,当初用的就是这种技术,才产生了野蛮霸榜的效果。不过咱们用的这个编辑器,底层并不是 BERT ,而是我们之前提及的 GPT 2。

大多数人提到它的时候,介绍往往不是那么正面。并不是因为 GPT 2 这种技术不够好。而是因为它“太好了”。好到足够让人眼馋。好到开发者决定,不开放训练数据集、代码、甚至模型参数……


640?wx_fmt=jpeg

要知道,在当今这样一个开源开放的趋势下,这么做会招致多少非议。当时 OpenAI 做出这种决定和解释,有人便认为是出于饥饿营销的目的,赚眼球。但是,你刚刚自己尝试过语言生成模型的威力之后,还会保持这么单纯的想法吗?

5、威胁

仅举一例。互联网上,假新闻是一个非常严重的问题。原先,用机器造假新闻出来,成本固然低,但专业人士还是很容易通过语言特征和统计规律来识别的。


640?wx_fmt=jpeg

而一旦,假新闻不但生产成本低廉,分分钟可搞定,还完全具备了真新闻的语言特征,要分辨出来,就不容易了。假新闻有可能多点大规模爆发,因从众和沉默螺旋等社会心理机制,对大众轻易造成误导。

面对这种潜在威胁,我们真的已有完善的应对之策吗?正因为这种威胁实际存在,数据伦理才愈发成为重要的研究课题。


640?wx_fmt=jpeg

如果你做数据科学研究,这个方向大有可为。

6、魔盒

风险是显著的。而技术的进步与发展,真的能够因为一家机构决定“不开放模型”的举措,就能停滞吗?

当然不会。OpenAI 因为压力,不断释放出更为强大的开源模型。目前开放的预训练模型版本,达到了 774M 个参数。距离完全版本模型的释放,也就是临门一脚的事儿了。


640?wx_fmt=jpeg

曾经,普通人即便拿到了这种开源工具,也需要一定的门槛,才能使用。


640?wx_fmt=jpeg

然而“有好事者”,在整合包装了若干种主流的 Transformer 模型之后,降低了 GPT2 机器写作的门槛。于是,就有你看到的这个编辑器了。

7、波澜

我把 GPT2 自动写作的结果,发到了朋友圈。


640?wx_fmt=png

(图来源于作者发布的朋友圈)”第一段落是作者自己随便瞎‌写的。后面高亮段落,都是电脑模型自己编出‌来的。不但标点符号、语法修辞用得有鼻子有‌眼儿,就连我那段里根‌本没有提到过的创始人‌,都跳了出来长篇大论‌。"


惊艳之余,小伙伴想到的,主要是以下两个问题:

  • 什么时候出中文的?

  • 能否和写字机器人配合使用?


我看后很无语。好在这一位的留言,让我看到了光明的一面:

以后英语老师出阅读题,可方便多了。

(*本文为 AI科技大本营转载文章,转载请联系作者)


福利时刻



入群参与每周抽奖~

扫码添加小助手,回复:大会,加入福利群,参与抽奖送礼!

640?wx_fmt=jpeg

大会5折优惠票倒计时 2 天! 团购还享立减优惠,倒计时 2 天!此外,伯克利大学名师精髓课程移师北京。《动手学深度学习》作者、亚马逊首席科学家李沐线下亲授「深度学习实训营」,免费GPU资源,现场还将限量赠送价值85元的配套书籍一本,先到先得。原价1099元,限时专享CSDN 独家福利价199元识别海报二维码,即刻购票~

640?wx_fmt=jpeg

推荐阅读

  • 2019 AI ProCon日程出炉:Amazon首席科学家李沐亲授「深度学习」

  • 玩嗨的2亿快手“老铁”和幕后的极致视觉算法

  • 与旷视、商汤等上百家企业同台竞技?AI Top 30+案例评选等你来秀

  • 从不温不火到炙手可热:语音识别技术简史

  • 入门大爆炸式发展的深度学习,你先要了解这6个著名框架

  • 用Python的算法工程师们,编码问题搞透彻了吗?

  • Python冷知识,不一样的技巧带给你不一样的乐趣

  • 我是如何通过开源项目月入 10 万的?

  • 撬动百亿台设备,让物联网“造”起来!

  • 程序员离无人值班有多远?

640?wx_fmt=png

你点的每个“在看”,我都认真当成了喜欢

相关文章:

表单系列之input number总结

各浏览器表现 <input type"number" /> chrome 除数字字符&#xff0c;只可输入e和.IE 除数字字符&#xff0c;其他字符均可输入&#xff0c;无报错Firefox 除数字字符&#xff0c;其他字符均可输入&#xff0c;但会报错移除箭头 //谷歌去除箭头 input::-webki…

Android中Service深入学习

概述 1、当用户在与当前应用程序不同的应用程序时&#xff0c;Service可以继续在后台运行。 2、Service可以让其他组件绑定&#xff0c;以便和它交互并进行进程间通信。 3、Service默认运行在创建它的应用程序的主线程中。 Service的使用主要是因为应用程序里面可能需要长时间地…

卷积神经网络(CNN)的简单实现(MNIST)

卷积神经网络(CNN)的基础介绍见http://blog.csdn.net/fengbingchun/article/details/50529500&#xff0c;这里主要以代码实现为主。CNN是一个多层的神经网络&#xff0c;每层由多个二维平面组成&#xff0c;而每个平面由多个独立神经元组成。以MNIST作为数据库&#xff0c;仿照…

Tensorflow源码解析5 -- 图的边 - Tensor

1 概述 前文两篇文章分别讲解了TensorFlow核心对象Graph&#xff0c;和Graph的节点Operation。Graph另外一大成员&#xff0c;即为其边Tensor。边用来表示计算的数据&#xff0c;它经过上游节点计算后得到&#xff0c;然后传递给下游节点进行运算。本文讲解Graph的边Tensor&…

物联网成网络安全防护新重点!

在昨天的 2019 北京网络安全大会上&#xff0c;工信部负责人表示&#xff0c;我国面向 5G 和车联网将建设网安防护体系&#xff0c;提升监测预警和应急响应能力。其中物联网设备已成为网安防护新重点。为什么工信部会这么重视物联网&#xff1f;物联网开发者的现状又是如何呢&a…

【分享】Java的几个重要词语

Java 是一种解释型语言,由SUN公司开发,基本上属于一个完全面向对象的语言&#xff0c;并且语言的设计仍然以简捷为重点。初学Java肯定会被一些名词给弄晕了&#xff0c;现在集中几个解释一下下。1、JVMJVM是Java Virtual Machine&#xff08;Java虚拟机&#xff09;的缩写&…

64位Ubuntu上编译32位程序操作步骤

1. 确认主机为64位架构的内核&#xff0c;应该输出为adm64&#xff0c;执行&#xff1a;$ dpkg --print-architecture2. 确认打开了多架构支持功能&#xff0c;应该输出为i386&#xff0c;执行&#xff1a;$ dpkg --print-foreign-architectures如果没有&#xff0c;…

分布式事务中间件 Fescar—RM 模块源码解读

2019独角兽企业重金招聘Python工程师标准>>> 前言 在SOA、微服务架构流行的年代&#xff0c;许多复杂业务上需要支持多资源占用场景&#xff0c;而在分布式系统中因为某个资源不足而导致其它资源占用回滚的系统设计一直是个难点。我所在的团队也遇到了这个问题&…

二维码检测哪家强?五大开源库测评比较

作者 | 周强来源 | 我爱计算机视觉&#xff08;ID&#xff1a;aicvml&#xff09;二维码已经进入人们的日常生活中&#xff0c;尤其是日本Denso Wave公司1994年发明的QR码&#xff0c;由于其易于检测、写入信息量大、提供强大的纠错机制&#xff0c;应用最为广泛&#xff0c;可…

linux 内核 出错-HP 方案

2019独角兽企业重金招聘Python工程师标准>>> SUPPORT COMMUNICATION - CUSTOMER ADVISORY Document ID: c03456595 Version: 1 Advisory: Red Hat Enterprise Linux 6 - "P4-Clockmod: Warning: EST-Capable CPU Detected" Messages Logged in /var/log…

Windows7 64bit VS2013 Caffe test MNIST操作步骤

在http://blog.csdn.net/fengbingchun/article/details/49849225中用Caffe对MNIST数据库进行训练&#xff0c;产生了model。下面介绍下如何将产生的model应用在实际的数字图像识别中。用到的测试图像与http://blog.csdn.net/fengbingchun/article/details/50573841中相同&#…

记住这35个英文单词,你就可以在RPA界混了!

无论是想玩转RPA&#xff08;机器人流程自动化&#xff09;&#xff0c;还是有意了解、进入这项行业&#xff0c;只有先了解该领域的专有名词&#xff08;行业术语&#xff09;&#xff0c;才能为之后的活动提供更多的可能。UiBot现为您编译整理了这份机器人流程自动化术语表&a…

福利 | 送你一张通往「2019 AI开发者大会」的门票

2019 AI开发者大会(AI ProCon 2019)是由中国IT社区CSDN主办的AI技术与产业年度盛会。多年经验淬炼&#xff0c;如今蓄势待发&#xff1a;2019年9月6-7日&#xff0c;大会将有近百位中美顶尖AI专家、知名企业代表以及千余名AI开发者齐聚北京&#xff0c;进行技术解读和产业论证。…

收缩日志文件夹

-- MSSQL2005 USE mastergo DECLARE dbname sysname;SET dbnameBSV100;-- 清空日志EXEC (DUMP TRANSACTION [dbname] WITH NO_LOG); -- 截断事务日志&#xff1a;EXEC (BACKUP LOG [dbname] WITH NO_LOG); -- 收缩数据库文件(如果不压缩,数据库的文件不会减小EXEC (DBCC SHR…

腾讯AI开源框架Angel 3.0重磅发布:超50万行代码,支持3种算法,打造全栈机器学习平台...

出品 | AI科技大本营&#xff08;ID&#xff1a;rgznai100&#xff09;【导语】2019年8月22日&#xff0c;腾讯首个AI开源项目Angel正式发布3.0版本。Angel 3.0尝试打造一个全栈的机器学习平台&#xff0c;功能特性涵盖了机器学习的各个阶段&#xff1a;特征工程&#xff0c;模…

路印协议受邀参加澳洲新南威尔士政府孵化器Haymarket HQ分享论坛

2019年2月15日&#xff0c;澳洲新南威尔士政府孵化器Haymarket HQ和Next Genius 社区联合举办了区块链解决方案分享论坛&#xff0c;路印协议CMO周杰受邀介绍当前交易所现状和路印协议的去中心化解决方案。参与此次论坛的还有区块链开发人员、企业家和去中心化技术爱好者&#…

一步一步指引你在Windows7上配置编译使用Caffe(https://github.com/fengbingchun/Caffe_Test)

之前写过几篇关于Caffe源码在Windows764位上配置编译及使用过程&#xff0c;只是没有把整个工程放到网上&#xff0c;最近把整个工程整理清理了下&#xff0c;把它放到了GitHub上。下面对这个工程的使用作几点说明&#xff1a;1. 整个工程Caffe在Windows7 64位VS2013下编译…

演示:思科IPS在线模式下Inline Interface Mode的响应行为(区别各个防御行为)

演示&#xff1a;思科IPS在线模式下Inline Interface Mode的响应行为演示目标&#xff1a;科IPS在线模式下InlineInterface Mode的响应行为。演示环境&#xff1a;仍然使用图5.16所示的网络环境。演示背景&#xff1a;在VLAN3的主机192.168.4.2上发起对主机192.168.4.1的漏洞扫…

【笔记】重学前端-winter

本文为&#xff1a;winter 发布在极客时间 【重学前端】系列课程的的笔记和总结支持正版哦: https://time.geekbang.org/col... 导语 如果深入进去了解&#xff0c;你会发现&#xff0c;表面上看他们可能是一时忘记了&#xff0c;或者之前没注意但实际上是他们对于前端的知识体…

如何用知识图谱挖掘商业数据背后的宝藏?

这是一个商业时代&#xff0c;一个数据为王的时代&#xff0c;也是一个 AI 迎来黄金发展期的时代。据史料记载&#xff0c;商业在商朝已初具规模。斗转星移&#xff0c;时光流转&#xff0c;到 2019 年&#xff0c;商业形式已发生翻天覆地的变化&#xff0c;但是商业的本质——…

通过define _CRTDBG_MAP_ALLOC宏来检测windows上的code是否有内存泄露

VS中自带了内存泄露检测工具&#xff0c;若要启用内存泄露检测&#xff0c;则在程序中包括以下语句&#xff1a; #define _CRTDBG_MAP_ALLOC #include <crtdbg.h> 它们的先后顺序不能改变。通过包括 crtdbg.h&#xff0c;将malloc和free函数映射到其”Debug”版本_malloc…

java.sql.SQLException: Data truncation: Truncated incorrect DOUBLE value

mysql 报这个异常&#xff1a;java.sql.SQLException: Data truncation: Truncated incorrect DOUBLE value update 表名 set col1 ? and col2 ? where id ? 改为&#xff1a; update 表名 set col1 ? , col2 ? where id ? 用逗号隔开

在Ubuntu14.04 64位上编译CMake源码操作步骤

在Ubuntu上通过apt-get install安装CMake并不是最新版的&#xff0c;这里记录下在Ubuntu上通过源码安装CMake的操作步骤&#xff1a;1. 卸载旧版CMake&#xff0c;执行以下命令&#xff1a;apt-get autoremove cmake如果卸载不掉&#xff0c;则通过执行以下命令删除&…

一份贪心算法区间调度问题解法攻略,拿走不谢

作者 | labuladong来源 | labuladong&#xff08;ID:labuladong&#xff09;【导读】什么是贪心算法呢&#xff1f;贪心算法可以认为是动态规划算法的一个特例&#xff0c;相比动态规划&#xff0c;使用贪心算法需要满足更多的条件&#xff08;贪心选择性质&#xff09;&#x…

css:z-index

针对position: absolute;解决position:relative;z-index固定定位层级显示问题转载于:https://blog.51cto.com/13507333/2352775

折半查找函数(from 《The C Programming Language》)

该函数用于判定已排序的数组array中是否存在某个特定的值value。这里假定数组元素以升序排列&#xff0c;如果数组array中包含value&#xff0c;则函数返回value在array中的位置&#xff08;介于0~n-1之间的一个整数&#xff09;&#xff1b;否则&#xff0c;该函数返回-1。 在…

C++中的explicit关键字介绍

C中的关键字explicit主要是用来修饰类的构造函数&#xff0c;被修饰的构造函数的类&#xff0c;不能发生相应的隐式类型转换&#xff0c;只能以显示的方式进行类型转换。类构造函数默认情况下声明为隐式的即implicit。隐式转换即是可以由单个实参来调用的构造函数定义了一个从形…

Redis的集群模式

集群 即使使用哨兵&#xff0c;此时的Redis集群的每个数据库依然存有集群中的所有数据&#xff0c;从而导致集群的总数据存储量受限于可用存储内存最小的数据库节点&#xff0c;形成木桶效应。由于Redis中的所有数据都是基于内存存储&#xff0c;这一问题就尤为突出了尤其是当使…

刚上线就报名2000人!8位大牛免费讲座,再不报名就满额了!

今年是CSDN的第20年&#xff0c;我们已经不再满足解决你的技术问题&#xff0c;还要帮你解决人生大事&#xff01;为了让你飞黄腾达&#xff0c;我们特别邀请到了8位大牛老师进行直播&#xff0c;他们已经实现了成为技术总监、创业、财富自由的梦想&#xff0c;这场直播&#x…

排序算法之插入排序

插入排序一般分为直接插入排序和二分插入排序。一、直接插入排序&#xff1a;直接插入排序又可以分为前插和后插&#xff0c;不过虽然是这样分&#xff0c;只是寻找地点的方向不一样而已。“前插”就是从头开始找合适的位置&#xff0c;“后插”就是从后面开始找合适的位置。直…