• QQ空间
  • 回复
  • 收藏

实现与逝者跨时空对话 AI光会模仿原声还不够

东方头条 2019-11-05 15:20:45 科技

“如果有个直达天堂的电梯,我一定不顾一切去看你。”日前火爆抖音的这首神曲唱出了不少人对已逝亲人的怀念之情。如果有可以和已逝亲人进行跨时空对话的“黑科技”,相信对活着的人不啻为一种巨大慰藉。而随着人工智能技术的发展,与逝者的跨时空对话或有可能实现。百度董事长兼CEO李彦宏曾表示,人工智能让每个人说的每句话、干的每件事,甚至记忆、情感、意识都能以数字化的形式存储下来放在网盘或者其他云端,思维方式也可以被机器学习,并且通过技术进行还原,与后人进行跨越时空的对话。

模拟和逝者对话 国内外均有尝试

“这种模拟已逝的人与后人进行对话的事情在国内外都有过尝试。”天津大学智能与计算学部博士生导师王龙标教授介绍,2011年3月11日日本大地震,许多人的生命就此定格在那个瞬间。由于灾难发生得非常突然,很多遇难者都没有留下只言片语,这让不少遇难者家属悲痛欲绝,情感上难以接受。日本就找了一些科研人员,收集遇难者生前保存的声音,模仿逝者的口吻写了遗书,并且通过语音合成技术,还原出逝者的声音并且读给家属听。家属听了以后都非常感动,觉得了却了自己的一个心愿,很多人也因此放下悲伤,鼓起勇气,勇敢去面对未来的人生。

在国内比较广为人知的尝试就是2016年,在张国荣诞辰60周年纪念活动上,百度语音技术团队公布了一段“张国荣”与粉丝的对话实录视频。张国荣作为一个时代的巨星,影响了千万粉丝,当熟悉的声音响起,很多粉丝当场落泪,“张国荣”最后一句“永远站在光明的角落,我只希望你们开心快乐地生活”也一扫很多粉丝心头多年的阴霾。这段视频是百度语音技术团队通过机器和人工双重搜索全网张国荣的原声和采访资料后,合成的张国荣生前的声音,并且在录制视频之前征集粉丝想法,与粉丝一起完成的“互动”视频。这段“来自哥哥”但又“不是哥哥”的语音回复,音质完全来自于本人,但内容又并不能在任何一段张国荣生前的语音记录中找到,是一封根据逝者生前讲话风格编写的,来自2016年的“答粉丝信”。

“以上的这些尝试都只停留在模仿逝者语音、语言方式层面。”王龙标说,已逝者说的内容基本上都是科研人员事先编辑好的内容,虽然目前在技术上计算机也能自动生成文本和文字,但是模仿的效果还不是很理想。比如像日本那个案例,目的就是鼓励生者更好的生活下去,如果内容编辑不当,反而会适得其反。因此这些尝试,都不是真正意义上和后人“对话”。

做到原音重现 需收集大量数据

为了让逝者原音重现,技术公司利用大数据与深度学习、语音合成技术,将张国荣在影视、电台和各种渠道留存下来的原声进行建模,并通过合成带有一定情感的声音模型合成了这封“答粉丝信”。通过语音合成技术实现了规模化的语料生产和自动化的数据标注,并充分发掘了深度学习技术在大数据上的处理能力,极大地扩展了语音合成系统所能使用的合成语料库的体积,使得语音合成系统包含了一定的情感,且更接近张国荣原声。

“无论是已经能够实现的模拟逝者单方面的说话,还是未来要想实现的跨时空对话,目前的技术首先都离不开逝者生前大量的数据收集。”王龙标说,计算机要学习某个人,必须要先大量收集这个人的各种信息,在这个人生前就要把他写的文字、声音、图像、脑信号等通过各种形式保存下来。比如模仿写作风格,必须要收集他以前写过的书信、文章等,模仿一个人的语言,就需要通过录音了解他的口音、发音习惯、习惯用语、语言逻辑等。数据收集得越全,机器会模拟得越相似,这就和夫妻相一样,夫妻朝夕相处久了,会潜移默化地在行为方式、语言习惯等方面高度相似。百度相关负责人曾表示,张国荣的“答粉丝信”原音重现,之所以仍存在一些顿挫感,出现某些字词发音略不自然等情况,部分原因是受到相关情景语料缺失的限制。

在收集大量数据的基础上,一般来说,模拟逝者语言需要语音合成、机器学习、自然语言处理等技术。如果要想做成更有感情的语言,还需要情感计算。具体来说,就是把情感因素通过计算机的方法识别和表达出来,比如这个人的语言、写的文字、各种肢体动作都代表什么情感,然后让机器去模仿并生成情感,写具有情感的文章,生成具有情感的语言,或者表达一些具有情感的肢体动作。

实现隔空对话 脑科学研究不可少

要实现对话,语音对话技术也必不可少,这就需要机器对对方的语言进行判断识别,并且理解、自动生成文本。目前比较常见的智能音箱应用的就是语音对话技术。不过很多时候,这些智能音箱回答的问题似是而非,只有回答对于那些设定好的问题,如天气预报、打开电视机、放一首歌曲等问题的时候,这些智能音箱才能准确地完成对话和指令。王龙标表示,要想实现机器和人之间良好的互动,就需要机器能模仿人的思维和情感,这样才能让机器的回答更聪明一些,更个性化,而不是千篇一律的答案。

据报道,目前瑞典科学家正进行研究,通过在大脑植入微型装置,让使用者得以上载及下载自己的思想。王龙标表示,目前的情感计算,大部分是基于数据驱动的机器学习技术。如果想实现真正意义上的模拟人的意识、情感,还涉及到脑科学的范畴。不过人的大脑非常复杂,目前对人的意识、情感感知、理解与产生的生理机制的研究还非常粗浅,因此获取人的意识、情感并且记录保存下来目前还很难做到。此外,人的情感是非常复杂的。让机器认识情感并且能够拥有情感,并且在对话中通过对方的话语进行判断,和对方进行情感的交流,这在目前阶段还无法实现得很好,也是科研人员努力的方向。

让逝者精神永生 或面临伦理风险

虽然保存一个人的信息似乎可以让他精神永生,并能给生者带来极大的安慰,但是这种做法也存在一定的风险。王龙标表示,不排除有些人会恶意利用这些逝者的信息,为了达到自己的某种目的,模仿逝者的声音,同时把自己的意图加入进去,假冒逝者的想法去操控活着的人。

此外,这种通过人工智能实现的“精神永生”还可能涉及到伦理问题。这有点像克隆技术,如果未来可以通过芯片技术达到模拟逝者思维的目的,甚至通过基因编辑的方式去保存复制人的思维,这些做法就很可能赋予机器人自主意识。机器人可能会有自己的思想、喜怒哀乐等情感,那么这种具备他人意识的机器人是否会面临伦理风险呢?而且当这些机器人被赋予了“生命”,其脱离控制又该如何处理?目前机器人的伦理标准还未明确,但当技术足够先进,这方面的伦理风险也会加剧,如何应对是我们需要充分考虑的问题。