当前位置: 首页 > 编程日记 > 正文

清华团队让 AI 写诗“更上一层楼”,诗歌图灵测试迷惑近半数玩家

作者 | 黄珊

来源 | 数据实战派

比特币

外挖无穷洞,机神犹未休。
卡中窥币影,池里验沙流。
屡载吸金主,孤深渍盗求。
方知区块链,本是古来游。

这首诗歌来自一支清华团队开发的古诗 AI。它的创作才华可不仅限于此。再看下面这首诗:

夜过虹桥机场

卢浦斜晖里,西楼醉客行。
影侵双塔晚,灯落一城明。
空客还频顾,航灯未可惊。
空留城市夜,月映水帘星。

你仍可以在文采上对它有所挑剔,但不得不承认的是,这至少是一个不会离题万里的 AI,尤其还是颇具难度的古诗生成。在这一点,它已经超越此前的作诗 AI。

论文名:Controllable Generation from Pretrained Language Models via Inverse Prompting(https://arxiv.org/pdf/2103.10685.pdf)

github:https://github.com/THUDM/InversePrompting

现有预训练模型的通病:文章本天成,“可控” 偶得之?

人类的诗歌创作活动是否有规律可循,还是完全由灵感支配?有一派理论认为,“文章本天成,妙手偶得之”。即好的诗歌、好的文学创作好的文章本是天生而成,只是人灵感所至偶然所得罢。当然,很多情况下所谓灵感,也要那些文学素养高,有深厚的文学基础的人才能抓得住。

对于 NLP 算法来说,它们还远远未到达这个境界。如上文所言,仅仅是不要搞 “离题创作”,就已经十分艰难。

在自然语言处理领域,作诗这一任务被归类为生成任务。目前,解决生成任务的 “当红炸子鸡” 非属预训练模型不可。

即便如此,此前的大部分预训练模型在生成符合题意的句子上仍力不从心。

这支清华团队同样经历过这种坎坷。有一次,他们从知乎摘了一个问题去提问模型 —— 说什么瞬间让你想留住这一刻?模型最终生成的句子非常通顺,但是,如你所见,这些句子并未真正回答这个问题,也就是说,这个问题和答案关联性非常弱。

我和男朋友在一起两年。我去国外留学,他留在国内。一人在国外,寂寞心酸都是真的。念书的时候,觉得常在一起没什么,两个人一起努力,吵吵闹闹就过来了。我一直这样想,以至于到了高中,到了最后几个月,我都觉得他就是我行走的小弟。其实最快乐的时候,就是一起在外头的 “孤儿院” 里。

这是一个普遍存在于预训练语言模型中的现象。

符合题意、答为所问的能力,正决定了一个 NLP 算法能不能产生现实应用价值。因为你一定不想和一个 AI 进行一段鸡同鸭讲的对话。

为了解决这个问题,团队成员提出了一个全新的文本可控生成方法 Inverse Prompting,显著提升了对预训练语言模型生成结果的控制能力,使得生成内容的质量大幅超越了一些传统方法,在问答和诗歌等生成任务中接近人类水平,并首次实现根据现代题材创作古体诗。

通过这个方法优化以后,上面这个问题的回答有了立竿见影的改变:

一瞬间想到高二的时候,那天下午在操场晒了一中午太阳,和同学一起在楼下打球,下午的夕阳徐徐洒下来,我们三个人一起站在走廊上,倚着栏杆可以面对着夕阳。一直想留下那一瞬间,可惜我以后再也没有遇到过那样的时光。

Inverse Prompting 可以让回答和问题关联性更强,即更好地利用 Prompt 的信息来控制所生成的内容。举个简单的例子,如果我们想知道如何在考试中取得好成绩,我们可以将 “问题:如何在考试中取得好成绩?答案:” 输入给模型,让模型去预测后面的语句,这里输入文本就称作 Prompt (提示文本)。

这时,模型可能会给出 “认真复习很重要。”、“上课仔细做笔记。” 这样的答案。为了评估这些答案的质量,Inverse Prompting 将这些答案反向输入给模型,让模型去预测问题的出现概率。比如将 “‘认真复习很重要。’回答了问题” 输入给模型让它计算‘如何在考试中取得好成绩?’的出现概率。

Inverse Prompting 使用原始语言模型本身生成的内容来进行改善,使得原先预训练模型在不需要进行参数精调的情况下就可以评估生成文本和 Prompt 之间的关联性(Likelihood),进而提供了更好的可控性。

最终,团队将 Inverse Prompting 应用在了多种预训练模型上(包括拥有 30 亿参数的大规模中文预训练语言模型),实现了在多种生成任务(诗歌、问答)上对于基线模型算法的大幅超越,并在图灵测试中达到了接近人类的表现。

比如,在长篇问答任务(类似于 Quora 或知乎的问题回答)中, Inverse Prompting 方法在各个方面都比 Prompting 方法和此前最先进的汉语预训练模型 CPM 模型得分高得多。除此以外,Inverse Prompting 方法可以大展拳脚的生成任务还包括宋词的生成甚至图像的生成任务上。

Inverse Prompting 虽然可以用来计算 Prompt 与生成内容的关联性,然而它依然依赖于从大量的生成内容中挑选高质量结果,比如为了生成一首质量不错的诗歌,可能需要预先生成上千首诗歌,这意味着使用预训练模型进行大量的计算。

Inverse Prompting + self-training,AI 写诗上 “双保险”

中国古典诗歌生成是特定领域长文本生成任务中的 “明珠”,它与现代汉语有着非常不同的表现形式和修辞用法。即便对于最先进的人工智能模型来说,生成有意义的中国古典诗都是非常困难的。

在各种超大规模的预训练文本语料中,诗词都只占其中非常小的一部分。因此,直接使用预训练语言模型对输入的 Prompt 进行计算,只有较小概率能够产生诗词类的输出。

为了提高模型输出中国诗歌概率,团队找到的解决方案是:在生成诗词语句的过程中,放松对于 Perplexity 得分的要求,增加 Beam Search 中的随机性,然后采用诗词规则及 Inverse Prompting 控制生成语句的格式及质量,使其满足中国古典诗歌的格律规范。

Inverse Prompting 原理示意图

传统的作诗模型大多基于古诗词进行模型的训练,因此它们虽然能够像真实的古代诗人一样作唐诗宋词,但却由于缺乏近现代的知识,难以将这种作诗能力应用在当今的现实场景之中。

然而基于 Inverse Prompting 的作诗则不同,它起到的作用更像是将预训练语言模型中学习到的作诗能力调取出来,不会受限于题材,因此可以达到一些先前模型难以达到的能力,比如用古体诗为现代题材作诗。

比如开头那篇虹桥机场,显然,虹桥机场是非常现代的概念,从未出现在古诗中,但预训练语言模型从新闻语料中学到了 “虹桥机场” 及其相关的核心特征,进而结合 Inverse Prompting 将作诗的能力发挥出来,从而完成了这样一个全新的作诗命题。这其中,诸如虹桥、夜、灯、月映水帘星、卢浦这样的意象已经到位了,细细读来竟还有一种孤独感和忧伤感。

基于 Inverse Prompting 的开放域传统中国诗词的生成过程

上文中提到,Inverse Prompting 可以帮助一个语言模型无需精调就能控制文本的生成质量,在符合格式、稳定出诗的情况下得到一些佳句。比如说,通过计算关联度从随机生成的 1000 首诗歌中,挑选出其中质量最高的诗歌。

此时,如果要再改进优质诗歌生成的可能性呢?

这是该研究中的另一个重要贡献:结合 self-training 的强化学习框架(类似于 AlphaGo-Zero 中所采用的方法),将高质量诗歌的生成结果反馈给模型并加以调整,相当于让模型自己朝着生成优质诗歌的方向去训练。如此循坏,便能在 Inverse Prompting 的基础上进一步提高优质诗句的生成概率,降低所需的计算量和候选内容生成量。

基于搜索的强化学习框架原理示意图

如上图所示,其中,生成器会负责生成大量的诗句 candidate,用 scorer 去判断这些诗句的好坏、search 出比较好的诗歌之后,能够得到的较优质的诗歌 sample,它们会比经过比生成器直接生成的要好,再用这些优质的诗歌 sample 去重新 finetune 生成器。

但是,基于搜索的强化学习框架之下,有一个难点在于,如何评判什么样的诗歌算 “好诗”?

团队认为,如果符合格律要求的情况下,能够反映诗歌主旨的诗,便可认为是一首好诗。即,使用诗歌内容去预测标题、能够从内容反推出标题的诗歌,以及在判断两句诗歌是否属于同一首诗、诗内的诗句相互之间被判断属于同一首诗,而诗内诗句与其他诗歌的诗句判断不属于同一首诗的,都算好诗。

最终,结合了 Inverse Prompting 和 self-training 为模型赢得了 4.40 的平均总分。

新的诗歌图灵测试

基于此次的研究成果,团队还进行了一次有趣的诗歌图灵测试实验。在这个诗歌图灵测试实验中,人类玩家需要对模型生成的诗歌和人类生成的诗歌进行分辨。

测试总共生成了 1500 首诗歌,并为每次测试随机显示在内的 5 对诗歌(真实古诗 + 生成古诗)。370 个玩家产生的 1,656 个游戏记录显示,45.2% 的用户难以辨别模型生成的诗歌。这一结果表明,结合了 Inverse Prompting 和 self-training 方法的诗歌生成质量,对于普通的在线用户来说可能接近人类水平。

现在,这个面向所有人开放的诗歌图灵测试应用:https://wudao.aminer.cn/turing-test/v1/。

这个诗歌图灵测试中,你可以选择不同的挑战难度。

Easy 模式将会展现 5 组诗歌(包括标题、作者及内容),每组包括 1 首由诗人创作的诗歌和 1 首 AI 创作的诗歌,你需要选择你认为的由人创作的诗歌。所有组选择完成后,你将会得知有多少组结果正确。

此外还有 Hard、Lunatic、Extra,测试难度依次增加。例如,Hard 模式将会展现 10 组诗歌(包括标题及内容),每组包括 1 首由诗人创作的诗歌和 2 首 AI 创作的诗歌,且每组回答限时 60 (绝句)/90 (律诗) 秒。

这个过程或许能丰富你对于诗歌这一古老文艺创作的理解,甚至收获 AI 作诗创造创造出来的新的审美情趣。

当然,正如人类作诗的水平也不能说到达顶峰一样,Inverse Prompting 方法的奏效,不会是作诗 AI 的终点。

虽然 Inverse Prompting 的预训练模型能够很好地理解题材内容,并用诗词的方式将其表现出来,但它能否真正学习到人类对于诗歌韵律乃至意境的形而上的思考与追求?

这仍是一个未解之谜。

至少在著名科幻作家刘慈欣的笔下,情况不太乐观。他写过一篇名为《诗云》的科幻短篇故事,探讨的是技术和艺术,尤其是技术对艺术的解构问题 —— 即人类文明中的美学追求是可以用计算来实现的吗?

故事描述了一种神级文明,人类在这种神级文明眼中好比杂草尘埃。

正当人类主角在某种垃圾焚化装置中拼命挣扎时,口袋里掉出了几篇古诗抄录纸,精巧而工整的字符矩阵意外引发神的注意。神借此学习了汉语的数据库以及有关地球历史的一切知识,很快边制作出了 “诗云”—— 一个可以统计出来符合审美的最优解的强大计算机器,但最后,由于无法鉴别出有价值的诗歌,所有的诗歌在诗云中盘旋。

体验过诗歌图灵测试之后,你又会如何书写 “诗云” 故事的新结尾?

更多精彩推荐
赠书 | 读懂生成对抗神经网络 GAN,看这文就够了搏一搏,单车变摩托!华为天才少年耗时四月将自行车强势升级为自动驾驶基于微软开源深度学习算法,用 Python 实现图像和视频修复点分享点收藏点点赞点在看

相关文章:

js中Dom元素及获取方法

DOM基础对象documentdocument.documentElement html部分document.head document.titledocument.body body部分获取元素对象方法document.getElementById(); 通过id找到对象document.getElementsByTagName(); 通过标签名找到对象并放到数组集合中document.getElementsByNam…

JavaBean简单及使用

一、JavaBean简介 JavaBean是使用Java语言开发的一个可重用的组件,在JSP的开发中可以使用JavaBean减少重复代码,使整个JSP代码的开发更简洁。JSP搭配JavaBean来使用,有以下的优点: 1.可将HTML和Java代码分离,这主要是为…

华为发布《AR洞察与应用实践白皮书》,提出用5G点燃AR,用AR照亮5G

[中国,深圳,2021年06月17日] 今日,在华为共赢未来5GAR全球峰会(Better World Summit)上,华为运营商BG首席营销官蔡孟波,发表了主题演讲《5GAR,让梦想照进现实》,提出用5G…

C#中虚函数,抽象,接口的简单说明

虚函数:由virtual声明,它允许在派生类中被重写,要重写方法,必须先声名为virtual public class myclass { public virtual int myint() { 函数体;} } class myclass1:myclass { public override int myint() { 函数体1&…

【开源】博客园文章编辑器4.0版发布

源起 最近个人时间多起来了; 于是打算持续写一点东西; 前面写了两篇关于riot.js的东西; 被博客园的领导移出首页了; 原因之一是排版不整齐; 确实是不整齐,这我认, 然而,我自己可是博…

C#中Timer组件用法

Timer组件是也是一个WinForm组件了,和其他的WinForm组件的最大区别是:Timer组件是不可见的,而其他大部分的组件都是都是可见的,可以设计的。Timer组件也被封装在名称空间System.Windows.Forms中,其主要作用是当Timer组件启动后&am…

微软全球副总裁洪小文:应对数字化转型挑战,跨界共创正当时

2021年6月16日,以“跨界共创”为主题的第四届微软亚洲研究院创新论坛在北京举办。今年,大会讨论的主题围绕“跨界创新”,数十家来自不同行业的企业代表,与微软亚洲研究院的计算机科学家就跨领域融合创新、共创精神推进数字化转型、…

Away3d 骨骼动画优化

很多朋友说Away3D 的骨骼数限制在32根,确切的说应该是Stage3D 的限制。在 AGAL2.0之前 VC寄存器是128个,每个vc常量寄存器最大只能容纳4位,transform占用一个4*4的矩阵,所以如果把一个transform存进vc里面,需要到4个寄…

postgresql中COPY的用法

一.测试创建表:[postgrescacti ~]$ cat test.sql CREATE TABLE weather ( city varchar(80), temp_lo int, temp_hi int, prcp real,date date);二.导入test.sql文件生成表:testdb01> \i test.sql***(Single step mode: verify command)*************…

C#中虚方法重载

在C#中,进行虚方法的重载有些体会,现与大家分享。 首先请大家看看下面的例子, using System; abstract public class contact { public virtual string prinf() { return ("这是虚方法"); } } publi…

Unity 4.x游戏开发技巧集锦(内部资料)

2019独角兽企业重金招聘Python工程师标准>>> Unity 4.x游戏开发技巧集锦(内部资料)淘宝书店地址:http://item.taobao.com/item.htm?spma1z10.3.w4002-6661947338.36.FdOZqM&id40302732808试读样章下载地址:http:/…

百度CTO王海峰阐释AI融合创新,降低门槛,按下产业智能化加速键

6月17-18日,第五届未来网络发展大会在南京隆重开幕。大会由中华人民共和国科学技术部、中国工程院、中国科学技术协会、江苏省人民政府指导,南京市人民政府主办,以“努力成为世界主要科学中心和创新高地的使命担当”为主线,邀请国…

[LeetCode系列]最大连续子列递归求解分析

本文部分参考Discuss: LeetCode. 步骤1. 选择数组的中间元素. 最大子序列有两种可能: 包含此元素/不包含. 步骤2. 步骤2.1 如果最大子序列不包含中间元素, 就对左右子序列进行步骤1. 步骤2.2 如果最大子序列包含, 则结果很简单, 就是左子列的最大后缀子列(即包含左子列最后一个…

C#中的多线程编程

C#是.Net平台的通用开发工具,它能够建造所有的.Net应用。在.Net中所有线程都运行在应用程序域(AppDomain)中,这也许让你想到Win32进程,实际上它们还是有很大的不同。应用程序域提供了一种安全而通用的处理单元,公共语言运行库可使…

关于机器学习,不可不知的15个概念

‍‍作者:布奇昆托(Butch Quinto)来源:大数据DT(ID:hzdashuju)有监督学习有监督学习是利用训练数据集进行预测的机器学习任务。有监督学习可以分为分类和回归。回归用于预测“价格”“温度”或“…

常用API(Object、String、StringBuffer、用户登陆注册)

常用API 今日内容介绍 u Object u String u StringBuilder 第1章 Java的API及Object类 在以前的学习过程中,我们都在学习对象基本特征、对象的使用以及对象的关系。接下来我们开始使用对象做事情,那么在使用对象做事情之前,我们要学习一些API…

WMI列出磁盘配额

using System; using System.Management; namespace DiskQuota { /// <summary> /// Class1 的摘要说明。 /// </summary> class Class1 { /// <summary> /// 应用程序的主入口点。 /// </summary> [STAThread] static void Main(string[] args) { try…

VS2013 编译使用 stlport

1. 下载stlport. 下载地址:http://sourceforge.net/projects/stlport/ 2. 解压到一个目录下面, 我的是解压到D:\project_kuku\program\library\STLport-5.2.1 3. 打开vs2013的命令行工具, 在目录:C:\Program Files\Microsoft Visual Studio 12.0\Common7\Tools\Shortcuts\ 下…

盛夏海边,用Python分析青岛哪些景点性价比高

作者 | 志斌来源 | 志斌的python笔记头图 | 付费下载于 IC Photo在经过几年的热潮之后&#xff0c;人工智能AI算法已经在各行各业广泛使用了。例如在工业制造中&#xff0c;利用人工智能监测仪器仪表、人员的违规与高危行为&#xff1b;利用图形AI算法进行材料质检&#xff1b;…

EnterLib PIAB又一个BUG?

在《这是EnterLib PIAB的BUG吗&#xff1f;》一文中我们讨论了PIAB关于抽象基类的BUG&#xff0c;今天又发现了一个新的问题。问题的起因源于《IoCAOP的简单实现》这篇文章&#xff0c;因为文中给出的解决方案仅仅支持构造器注入&#xff08;Constructor Injection&#xff09;…

【SQL Server】系统学习之一:表表达式

本节讨论的相关内容包括&#xff1a;视图、派生表、CTE、内联表值函数 场景&#xff1a;如果要查询一组数据&#xff08;例如聚合数据&#xff0c;也就是几个表聚合在一起的数据&#xff09;&#xff0c;这些数据并未在数据库中以表的形式存在。 1、视图&#xff1a;通常用来分…

C语言中字符数组和字符串指针分析

写下面的测试程序&#xff1a;#include <stdio.h> int main(int argc, char *argv[]){char day[15] "abcdefghijklmn"; char* strTmp "opqrstuvwxyz";printf("&day is %x\n",&day); printf("&day[0] is %x\n",&…

这篇论文,透露谷歌团队构想的“未来搜索”

作者 | 青苹果来源 | 数据实战派头图 | 付费下载于 IC Photo传统的信息检索&#xff08;IR, Information Retrieval&#xff09;系统&#xff0c;并不直接回应信息需求&#xff0c;而仅提供对内容的参考。排序&#xff08;Ranking&#xff09;是该范式的关键组成部分。这样的检…

selenium+python自动化81-html报告优化(饼图+失败重跑+兼容python23)

优化html报告 为了满足小伙伴的各种变态需求&#xff0c;为了装逼提升逼格&#xff0c;为了让报告更加高大上&#xff0c;测试报告做了以下优化&#xff1a; 测试报告中文显示&#xff0c;优化一些断言失败正文乱码问题新增错误和失败截图&#xff0c;展示到html报告里优化点击…

C#的多线程机制

一.多线程的概念 Windows是一个多任务的系统&#xff0c;如果你使用的是windows 2000及其以上版本&#xff0c;你可以通过任务管理器查看当前系统运行的程序和进程。什么是进程呢&#xff1f;当一个程序开始运行时&#xff0c;它就是一个进程&#xff0c;进程所指包括运行中…

知乎 CTO 李大海:创业公司如何拥抱开源

由计算机学会主办的 CCF C 活动近日走进知乎。知乎合伙人兼 CTO 李大海、搜狗 CEO 王小川、华东师范大学教授王伟在内的企业界、学界技术代表齐聚&#xff0c;带来一场精彩的技术分享盛宴。 围绕「创业公司如何拥抱开源」的分享主题&#xff0c;知乎合伙人兼 CTO 李大海首次披…

如何居中一个浮动元素?

2019独角兽企业重金招聘Python工程师标准>>> 1.<!DOCTYPE html> <html> <head> <meta charset"UTF-8"> <title>center</title> <style type"text/css"> .p{ position:relative; float:left; left:50…

javascript promise编程

在loop中使用promise: https://stackoverflow.com/questions/17217736/while-loop-with-promises 转载于:https://www.cnblogs.com/kidsitcn/p/7745973.html

bzoj1295

考虑到这道题n&#xff0c;m都很小&#xff0c;我们考虑先穷举起点i 下面我们要做的是找出移走k个障碍后&#xff0c;点i所能到的最大距离 我们可以把这个问题转化为判定性问题 对于一对点i,j,如果他们之间存在一条路径&#xff0c;障碍数&#xff08;包括起点终点&#xff09;…

C#程序可将文本文件藏于位图中,也可导出

//使用方法&#xff1a; // BmpSafe.exe /file2bmp (input BMP) (input file to hide) [output file] //BmpSafe.exe /bmp2file (data BMP) [output file] using System; using System.IO; using System.Drawing; public class Bitmap24Writer { protected Bitmap bmp; …