据业内人士吴俣的说法,所谓自动撰稿机器人,广义的说也可称为“文本生成”。它的写稿方式之一是抽句子——找一堆句子,拼成一篇文章。写稿机器人“张小明”就是利用这项技术实现基于体育直播文字的体育长文自动生成,从而走在技术前列。
写诗机器人,也不例外。“目前写诗机器人主要基于深度学习技术,对它来说,学习样本越大越有规律可循,学起来效果也更好。”在万小军看来,机器人写诗其实是个“编码与解码”过程,编码过程对用户输入信息进行语义编码,解码过程则逐词生成得到每行诗。研究人员先搜集成千上万首诗,利用诗的标题或关键词作为输入,训练深度学习模型生成相对应的诗句。充分学习训练后,机器人会摸索出一套作诗的规律,按照主题需要解码输出第一句诗,然后把这句诗与输入的关键词合并作为新的输入,就可解码得到第二句,如此循环便可得到一首完整的诗。
“人工智能特别擅长写这种有规律的、被条条框框约束的内容,在一些简单重复性的脑力劳动中,它具有一些先天优势。”万小军称。
能否取代人类——分工协作
创作型人工智能的优势是执行简单、重复性的创作输出,而人类可以聚焦更富创造性的智力劳动
日本研发的人工智能创作了科幻小说《电脑写小说的那一天》,不仅骗过了所有人类评审,还成功入围日本微小说文学奖;谷歌人工智能还可进行绘画创作,有画作被拍出了8000美元高价……当智能机器人大行其道,人类会不会真如霍金所言“大难来临”?
“让机器具有思维与情感、学会推理和归纳,短时间还做不到。”万小军以“小南”举例,在教小南写稿过程中,遇到的一个难点就是可供学习的样本不够丰富,训练语料较为缺乏。而且,因为缺乏情感表达和思维能力,它写出的作品大多平铺直叙,不够生动。如果仅看几篇没有太大问题,看多了难免会感觉单调、枯燥。
写诗机器人同样存在类似的问题。万小军说,得益于近年来深度学习技术的进步,机器人写诗水平有了质的飞跃——由于古诗中留有大量写景诗,它们尤其擅长写景抒情。这些诗普通人猛一看“嗯,不错,挺美”,但若让对古诗颇有研究的专家审视,便免不了一番品评。另外,它或许可以模仿得有模有样,但若交给它一个从未遇过的主题,就很难胜任了。
不仅行文相对单一,“小冰”“小南”们即便写出了美文,也不知道自己写的是啥,更谈不上陶醉其中自我欣赏。“记者写稿时很清楚他在写什么,知道自己要表达的语义信息。”万小军说,机器人不然,虽然它把每一个句子都写出来了,但内容是什么,它不知道也无法理解,这是人和机器最大的不同,对写诗机器人来说同样适用。
关于这点,知乎专栏作者萧瑟曾在《当AI邂逅艺术:机器写诗综述》一文中有过这样的描述:机器诗歌生成的工作,起始于20世纪70年代。但在计算机诞生之前,就有好事者弄了个高频诗歌词语转盘,转到哪个词就记录下来,然后连起来形成一首“诗”。这种诗自然会出现类似“苹果吃姑娘,残红杀马特”这样逻辑不通、不伦不类的句子。当然,也可能偶然搞出佳句。
虽然前路依旧漫漫,但随着深度学习技术的发展和数据积累,人工智能的春天已渐行渐近。“就写稿机器人而言,目前它仅能做到将一个基本的新闻事实描述清楚;一些深度、调查类报道还必须依赖记者完成。创作型人工智能的优势是执行一些简单、重复性的创作输出,人类可以集中精力聚焦一些更富创造性的智力劳动,构建一种和谐的分工协作关系。”万小军说。(记者 沈慧)