迄今最复杂人工智能语音模型创建 可模仿人的原声

古生榕
导读 Meta已经研制出了全球最复杂的人工智能语音模型。根据英国脸书母公司元宇宙平台公司表示,目前研制出来的语音生成人工智能能够模仿任何人的声音。
Meta已经研制出了全球最复杂的人工智能语音模型。根据英国脸书母公司元宇宙平台公司表示,目前研制出来的语音生成人工智能能够模仿任何人的声音,也包括逝者的声音,不过由于担心这项先进的技术会被滥用,Meta宣布不会对该技术进行公开。Meta公司的深度学习人工智能研究人员表示,这款软件采用的是流匹配的方法,性能要比当前最为先进的生成式语音系统使用的扩散模型更加优秀。结果显示这款人工智能音频更容易理解,单词的错误率为1.9%,远远低于竞争对手的5.9%。
在对真人声音进行模拟的相似度也更高,速度快了将近20倍。Meta还对新的voicebox的多种用途进行了介绍,其中就能够帮助一些具有视力障碍的人士来听到朋友或者亲人的信息,或者允许非母语的人使用自己的声音翻译成自己所要说的话,目前这款软件能够说出6种语言分别为英语,法语,西班牙语,德语,波兰语和葡萄牙语。Mate多次强调这款应用存在着滥用的风险,目前并不会对其进行公开,将会为人工智能社区开放并且分享研究,这将有助于推动人工智能的快速发展。

标签: 人工智能语音,模型创建

版权声明:本文由用户上传,如有侵权请联系删除!