有一天,也许比我们想象的要早,基于AI的生成系统将使业余作家能够以专业的方式表达自己,从而使基本上每个人都可以成为作家。 图01:我们的语言和文字反映了我们所生活的社会。[Hans Springinklee German撰写的《圣杰罗姆》,1522年木刻]我们可能没有意识到,但是AI已经在写我们可能已经读过的故事。 多年以来,机器一直在编写库存摘要。最近,也进行了。接下来是长篇小说和小说吗?在加利福尼亚大学圣克鲁斯分校,人工智能研究员Snigdha Chaturvedi(斯尼格达·查图尔韦迪)和她的团队正在设计自然语言处理构建模块,有一天它将使机器能够讲述长篇的故事。尽管目前该技术令人印象深刻,但距离该目标还有很长的路要走。通过他们的研究,我们可以开始更好地了解自然语言生成技术将如何成为我们生活的一部分。 图02:人工智能已经在撰写我们可能已经读过的故事,例如小联盟体育比赛摘要。 语言是一面镜子 如果要尝试标记到目前为止AI写作的进展,我们会发现我们处于不可思议的低谷阶段:至少在涉及比股票宣传或棒球统计更复杂的故事方面。就像近乎人类的机器人一样,其怪异的美学使人们感到排斥,人工智能写作同样可以表现为非人类、粗糙,有时甚至是奇特或虚假的话题。语言成为AI研究如此具有挑战性的领域有很多原因。查图尔维迪说:"语言是我们所生活的社会的镜子。" "因此,问题在于,当计算机科学家设计试图理解语言的算法时,他们通常不会考虑语言理解的社会方面。人类所说或所做的大多数事情都由两个标准定义:他们的个体和与他人的关系。" 查图尔韦迪解释说:"人与人之间的关系在解释他们的举止或言语方面起着非常重要的作用。" "如果您了解人际关系,您就能更好地解释人类行为。所有这些因素都与情境有关,至少在当前实例中,人工智能一直在与之抗争。人工智能在专门知识的特定领域可能无情地发挥作用,例如象棋、围棋和扑克之类的游戏。在这些情况下,上下文问题几乎无关紧要。压制这些竞争战略游戏的AI通常甚至不会考虑对手。只需查看当前快照并以数学上最佳的方式进行操作即可。从计算和策略的角度来看,这很难做到,而在人类大脑根本无法达到的水平上进行操作。但是,人类擅长理解上下文。如果人工智能要实现其冠军所想象的潜力,就必须在这一领域取得进步。 查图尔韦迪说:"在建模或理解人际关系方面已经开展了一些工作,但这是有限的。" "这项工作面临两个主要挑战。首先是超越自然语言处理中大多数先前科学工作中使用的二进制关系这一主要概念。在这种二元关系范式中,您假定关系只能是两种类型。例如,使用诸如Facebook之类的社交媒体数据的人假定用户是朋友还是不是朋友。因此,只有两种可能性。因此,这些关系的二进制性质。他们不认为人际关系的概念更为细微。这是因为从计算角度,从自然语言处理角度来看,开发这种细微差别的概念更具挑战性。但是,如果您考虑现实世界中的关系,它们不是二元关系。真实的社会关系可以有多个方面。例如,两个人可以是朋友或家庭成员,也可以是恋爱关系。它们可以是正式的或非正式的关系。人们可能处于上司与上司的关系,等等。" 查图尔韦迪说。 二进制对工程师如何开发计算技术具有开创性意义。从零开始思考是一切以某种方式开始的地方。二进制模式继续渗透软件的行为方式,例如,查图尔韦迪在Facebook中识别关系的粗略框架中。真正的关系更加细微差别,这又回到了问题的难度:我们的各种关系不仅差别细微和非二元关系,而且每个人的关系及其独特的星系关系,可能与另一个人截然不同。千篇一律的方法不可能使任何人满意。真正的了解至少需要更大的关系世界的上下文和细微差别,以及一个人的较小和独特的世界。 此外,还有其他问题:"这项工作的另一个主要挑战是将人际关系的不断发展或变化纳入其中。人际关系并不会保持不变,而是会随着时间而变化。例如,你在七岁时与之成为朋友的人可能与你现在与之成为朋友的人有很大的不同。在分析故事时,这一点尤为重要,因为各个角色之间关系的变化才使故事变得有趣。" 查图尔韦迪说。语境挑战:这个故事如何结束? 那么,如何开始在AI故事讲述中解决上下文?查图尔韦迪(Chaturvedi)和她的团队承担的一个研究领域是帮助机器确定故事的良好结局的挑战。"我们正在尝试解决的技术问题是,给了您一个故事和两个结尾选项,但是两个选项中只有一个是正确的或更合乎逻辑的,而另一个则只是一个糟糕的结局。对于人类来说,这将是一个非常容易解决的问题。" Chaturvedi说。"而且人类真的很擅长识别两个结局中的哪一个更明智,因为在大多数情况下,另一种选择简直是荒谬的。在这个项目中,我们希望了解计算机系统或AI算法识别明智选项的难易程度。如果计算机可以解决此问题,这意味着它对文本的连贯性和常识知识以及使技术明智的原因有一定的了解,等等。因此,事实证明,设计这样的AI系统并非易事。" 这是一个显而易见的构建块,首先要使机器发展理解力,以某种有意义的方式理解故事,然后潜在地发展自己的故事。毋庸置疑,这对写作专业人士具有重大意义。Chaturvedi说:"因此,这是一个具有挑战性的研究问题,因为确定好结局或明智的结局需要了解使故事之类的文本保持一致或明智的原因。" "如果仔细考虑一下,这是一个非常开放的领域问题。 例如,很难雇用一个能够编写所有规则的人,这些规则可以告诉我们什么使一段文本连贯。这可能是因为,作为人类,我们甚至不知道在判断一段文字是否连贯时会考虑哪些因素。" 为了评估一致性,Chaturvedi和她的研究团队考虑了三个因素。首先,故事的结局需要遵循事件的逻辑顺序。第二,完整的故事必须具有理性的情感轨迹:主角发生的事情必须是有道理的。最后,结局必须与故事主题保持一致。Chaturvedi说:"我们提供了一个可以将所有这三个因素结合在一起的系统……并判断结局是否与故事一致。" "我对该项目感到非常兴奋,因为它使我有机会思考总体上的文本连贯性和故事。这激发了我去解决一个更具挑战性的问题,即设计AI系统以生成整个故事。" Chaturvedi在小组研究中描述了下一步:"我们正在尝试使机器与人类协作以产生简短的故事。因此,从本质上讲,故事是由机器生成的,但是人类正在与它合作或指导它生成特定类型的故事。好吧,从研究的角度来看,自动讲故事通常是一项非常具有挑战性的任务。它要求AI系统不仅要说出良好的语法和正确的英语句子,而且还必须将它们绑在一起以形成连贯的故事。生成的故事需要在主题上保持一致。它应该有一个有趣的情节,带有目标,规则,关系等的角色。这个故事应该让人感动。它应该具有特定的道德价值观,某些结局,等等。换一种说法,故事的产生需要大量的计划和思考。这些挑战已经很长时间以来吸引了AI专家的关注。" "最近,对讲故事的兴趣重新产生,尤其是在自然语言处理领域,随着某种类型的学习算法(称为深度学习算法)的问世而出现。这些更新,更高级的算法的问题在于,与传统的自然语言处理生成系统相比,它们的可控性较差。在我们的工作中,我们希望通过将人类用户带入循环,从而在商店再生过程中拥有更多控制权。更具体地说,用户将告诉系统他们希望看到故事旁边发生的特定事件,并且系统必须一次生成一个句子的故事。这类似于在Bandersnatch中非常成功的交互式讲故事的想法,这是在Netflix上播出的《黑镜》。人工智能和伟大的计算小说 2016年,函馆未来大学的松原仁志带领一个团队经过了第一轮日新新闻文学奖的评选。Hase法官认为这本小说结构合理,但缺乏其他方面,例如人物描述。中篇小说被称为"计算机撰写小说的日子",根据史密森尼杂志的丹尼·刘易斯的报道,它是通过以下过程编写的: 首先,人类设计师编写了自己的中篇小说并将其提炼成其基本组成部分:单词,句子以及基本结构。根据这些参数,计算机使用一种算法从原始作品中重新混合了新的中篇小说。它与例如在我们的短信中建议自动完成的技术重叠。显然,考虑到这种基本的方法,我们距离争夺主要文学奖的机器还有很长的路要走。 图03:与争夺主要文学奖的机器相距甚远。我们更处于工具开发阶段。 通常,AI系统不擅长生成较长的文本。在最佳状态下,他们可以创建少量与故事中存在的现有内容保持一致的内容。但是,AI顺序生成的文本越多-其原始文本与它自己生成的内容之前的设定叙述越远,其连贯性就越差。它似乎更像是一个智能的句子生成器,而不是作家。 "我们正在使用基于深度学习的系统,该系统以难以理解而臭名昭著。在很高的层次上,深度学习模型是一组复杂的数学表示形式,例如矩阵和向量,它们相互交互以提供所需的输出。尽管这种复杂性使其功能极为强大,但数学表示法甚至使人类专家或科学家也难以破译该系统的工作原理。" Chaturvedi说。"现在,由于我们不了解这些模型的工作原理,因此越来越难以命令他们去做特定的事情,例如指示他们生成特定的故事情节。在我们的工作中,我们通过具有专用于此信息的特定且重要的组件来指导模型合并人为监督。因此,本质上,主要的技术挑战是如何教这些系统注意用户在说什么,用户希望在故事中发生什么?在制作故事时,他们如何整合这些信息?" 这是深度学习模型提出的另一个更普遍的限制,甚至是风险。我们人类无法理解它们或对其进行逆向工程。通过释放大量数据来创建自己的模型,可以释放他们的力量和潜力。但这将引擎变成了一个黑匣子,我们只有有限的代理才能理解,而在某些方面,要进行调整则要少得多。与过去的物理或机械系统,甚至与人类更传统地编写的软件不同,我们不完全了解正在发生的事情。AI写作的应用 至少在目前,目前用于撰写有关金融或体育故事的AI系统在本质上是有限的。Chaturvedi说:"有几家公司对自动识别新闻故事,新闻稿等中的关键事件并将其转换为故事,以便人们或算法读者可以使用它感兴趣。" "在此过程中,基本上有两个步骤。第一步,训练AI模型以自动从新闻稿和此类文档中提取相关事件。不幸的是,这些AI系统的输出…不一定是优美自然的格式。它通常以可以很容易地存储在数据库中的表的形式出现,但是不一定以易于阅读的方式传达全部信息。所以,第二步是将这些类似表格的事件数据转换为看起来自然的英语句子或故事。这是当前的商用AI系统并不十分擅长的步骤,在此过程中需要大量的人工。" 这些故事是使用模板生成的。"您可以将模板视为人工或半自动生成的句子或带有空位的简短故事。机器的工作是获取模板,但是它必须选择与其正在使用的上下文相关的模板。然后,一旦选择了模板,其任务就是在这些插槽中填充相关内容。这些僵化的模板通常无法产生流畅的,人性化的散文:至少就目前而言,它们不能(例如)释义。因此,此类模板化AI故事通常类似于复制粘贴的文本。Chaturvedi说:"实际上,当这些系统输出基于模板的生成的文本时,会有人进入系统并对其内容进行平滑处理。" 人工智能写作系统具有大量市场应用的潜力。Chaturvedi说:"专业作家可以使用它们来获得有关下一次创作的想法。" "您可以想象有更多像[Netflix]的Bandersnatch这样的电影,但它们将在…的帮助下制作,而不是完全由人类作家撰写。它们也可以用于改进现有的计算机游戏。这样的系统的交互性质可以使它们在培训和教育领域非常成功。例如,您可以使用这样的系统来教孩子有关语言连贯性和讲故事的知识。AI产生的故事也可以用来协助记者制作新闻故事。" 因此,尽管当今AI写作的最新技术还很粗糙,但查图尔维迪(Chaturvedi)看到了一条改进文本生成的道路。这是否意味着合格的小说不会很快由AI生成?"这将需要一些时间。当前,系统通常试图生成短文本,并且这些文本限于特定类型的域。对于生成更长的故事,我认为我们可能要等几十年才能拥有完全由AI系统生成的故事,并拥有由AI系统生成的小说," Chaturvedi说。"问题在于,当人们像写小说一样写长文件时,他们会想到该文件的叙事计划或故事情节。当他们写一个句子时,是根据他们之前写的内容,以及他们对整个文档的想法。" Chaturvedi说。一切都回到了环境的挑战。机器甚至无法记住之前的整个故事,甚至它本身编写的故事的整个部分的上下文。 图04:有一天,也许比我们想象的要早,基于AI的生成系统将使业余作家能够以专业的方式表达自己,从而使基本上每个人都可以成为作家。 但是,Chaturvedi认为,还有一个实际的未来,即使新颖的写作距离很遥远,这项AI研究也将不断发展,为创意专业人士提供有用的工具。" AI写作无疑将使专业作家的工作更加轻松。它不仅会为不正确,模棱两可或难以阅读的内容提供建议,而且还会为作家提供创意,并帮助他们清除作家的障碍。 "有一天,也许比我们想象的要早,基于AI的生成系统将使业余作家能够以专业的方式表达自己,从而使基本上每个人都可以成为作家。而且,在新闻业等领域,这种AI系统将能够大大减少记者的工作量,使他们能够集中精力收集事实和具有新闻价值的资料。Chaturvedi说:"这当然也将帮助他们加快编写故事的过程,从而为用户提供更多实时新闻。" |