从服务视障人士到大众“有声”阅读,AI 如何赋能内容创作?传媒
“这真的是机器人读的吗?”这是很多人听到由微软智能语音合成平台制作的有声小说《红楼梦》时的第一反应。因为在有声书中,林黛玉的声音略带微愠,贾宝玉言语委屈,而旁白则字正腔圆,这些声音不仅非常逼真堪比真人,而且还通过多种音色和多种语言风格,表现出不同的角色和不同的语境。
有声读物并不是新鲜事物,很早就有各种读屏软件可以实现从文字到声音的转换,但最大问题就是从断句到语气,一听便知是“电脑音”,非常生硬,体验并不好。而随着人工智能技术的进步,科学家和工程师们正在努力让 AI 的声音充满感情和表现力。尤其是对于视障人士来说,声音是他们感受世界的最重要方式,有温度的声音对于他们不仅是感知世界,更是陪伴。
?
?近日,在“2020国际残疾人日”之际,微软与周迅 AI 语音红丹丹公益项目发起人——鹿音苑文化传播公司以及来自微软及各界的150余名志愿者,将共同创作的首批人工智能有声内容,包括鲁迅、老舍、萧红、朱自清等作家的一系列经典作品、红丹丹文化期刊,正式捐赠给北京市红丹丹视障文化服务中心的“心目图书馆”。?
?
据悉,这些作品都是基于微软 Azure 云认知服务语音合成平台 Speech Studio 及其丰富的 AI(人工智能)语音创作的,其中包括著名艺人周迅授权的定制声音、红丹丹视障人士播音员董丽娜授权的定制声音,以及多个微软智能语音合成平台声音(如晓晓、云野等)。
“微软晓晓”到“AI 周迅”让声音有温度
对于视障人士来说,日常的“阅读”主要是通过触摸盲文书、听读屏软件或真人朗读的有声书等方式。但遗憾的是,这几种方式都存在一定的局限性。
比如,盲文书的数量非常有限,而且制作成本高、阅读时间长;读屏软件声音不够自然,机械音很难产生共情和共鸣,长时间聆听也容易疲劳;真人录音虽然效果很好,但制作周期长、成本高,即使是志愿者可以免费献声和免费制作,但录制制作完成一本有声书,最快也要花上两三个月的时间。
早在十几年前,微软就开始与中国最大的视力障碍人群公益组织——北京市红丹丹视障文化服务中心进行合作,为其提供技术和产品支持,共同探索用技术服务视障人群。尤其是在2014年,微软 AI 语音团队和红丹丹一起,为视障人士在微软 Azure 上搭建了云端有声读书馆——“心目图书馆”。
微软的科学家和工程师们利用微软的 AI 智能语音技术平台,将文字合成有声电子读物产品,利用技术可以大批量地、自动化地的将电子书转变为有声书,不仅大大减少人工录制的人力和时间成本,也成倍丰富了视障人士有声阅读内容的来源。
“声音是视障人士获取知识、陶冶情操、丰富精神世界的重要方式。微软人工智能语音技术声音动听、语音自然,帮助我们降低了有声内容创作成本,心目图书馆的馆藏越来越丰富。应用微软文字转语音技术后,红丹丹能够合成一本有声书的效率大大提高,而且能够7*24小时不间断生成。”红丹丹创始人郑晓洁表示。
随着微软 AI 语音技术不断更新迭代,2019年,微软利用微软神经网络语音合成技术打造了自然的人工智能声音如“晓晓”。而此次,微软又与一直热心公益事业的著名演员周迅合作,通过定制她的 AI 声音,更加高效率地服务于视障人群。
“微软语音技术合成的 AI 声音非常自然、人性化、富有情感,最终呈现出来的周迅 AI 语音特别有说服力。我们非常荣幸能通过捐赠用周迅定制声音生成的有声读物,帮助视障朋友学习和成长。除了贡献公益事业,也很欣喜从中获得了促进娱乐业数字化转型,优化生产流程方式的更多思考。”周迅 AI 语音红丹丹公益项目发起人、鹿音苑音乐文化传播公司联合创始人曾宇表示。
据悉,通过“心目图书馆”,视障人士可以随时随地通过移动设备收听和下载有声读物,目前,该图书馆已经覆盖全国105所视障人士学校。
逼真一分需百倍付出
声音背后的微软“黑科技”