我们提供甘肃网站维护服务,以实惠、方便、快捷著称!一次服务,终身朋友! ·付款帐号 ·联系我们
甘肃网站维护
网站维护热线: 网站维护咨询热线 网站维护:
网站建设: 网站建设
首页
维护介绍
维护套餐
案例分享
维护申请
维护反馈
维护知识
行业动态
联系我们
建站服务请点这里>>
网站维护申请
当前位置:首页 > 行业动态

微软的新人工智能VALL-E可以用3秒的音频模拟任何人的声音

来源:维护啦 作者:www.weihula.com 人气: 2023-1-11
内容提示:微软研究人员宣布了一种名为VALL-E的新文本转语音人工智能模型,当给它一个三秒钟的音频样本时,它便可以模拟一个人的声音。
    微软研究人员宣布了一种名为VALL-E的新文本转语音人工智能模型,当给它一个三秒钟的音频样本时,它便可以模拟一个人的声音。一旦它学会了一种特定的声音,VALL-E就可以合成这个人说任何话的音频——而且是以一种试图保留说话者的情绪语调的方式。

    这是文本语音系统朝着更自然的声音迈出的重要一步。它的创造者推测,VALL-E可用于高质量的文本转语音应用、语音编辑,在这种情况下,一个人的录音可以从文本记录中进行编辑和修改(让他们说一些他们原来没有说过的话),当与GPT-3等其他生成性人工智能模型相结合时,还可以进行音频内容创作。

    微软称VALL-E为「神经编解码语言模型」,它建立在一项名为EnCodec的技术之上,Meta在2022年10月宣布了这项技术。与其他通常通过操纵波形合成语音的文本到语音方法不同,VALL-E从文本和声音提示中生成离散的音频编解码码。它基本上分析了一个人的声音,通过EnCodec将该信息分解成离散的组件,并使用训练数据来匹配它所「知道」的那个声音如果在三秒钟的样本之外说其他短语会是什么声音。

    微软在一个由Meta组建的名为LibriLight的音频库上训练VALL-E的语音合成能力。它包含了6万小时的英语语音,来自7000多名发言者,大部分来自LibriVox公共领域的有声读物。

    VALL-E示例网站:https://valle-demo.github.io/

【声明】本文章系本站编辑转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请与本站联系,我们将在第一时间删除内容!
上一篇 上一篇:网易与央视网达成合作,搭建网络春晚元宇宙分会场
下一篇 下一篇:京东科技发布“产业回暖”计划 让利数亿元助力中小企业上云
返回行业动态
维护动态 网站维护案例 更多动态 维护动态
积木人展览展示
海德睿工程
创际门窗
天津雷公
利君云商
维护动态 行业动态 更多动态 维护动态
谷歌悄然删去人工智能团队网页中
谷歌Colab推出数据科学助手
天价域名再现:ai.com挂牌
京东云发布八大领先智算产品 五
全球开源大模型榜单揭晓,阿里通
维护动态 网站维护知识 更多动态 维护动态
网站中木马了怎么办,怎么清除?
企业建设网站的好处
网站维护的工作内容有哪些?
制作网站需要关注这些核心要素
网站优化中十分影响排名的是什么
网站维护申请 网站维护申请点此进入 网站维护意见反馈 反馈意见

网站维护电话咨询

返回顶部
关于我们 | 案例分享 | 维护套餐 | 维护申请 | 意见反馈 | 维护知识 | 行业动态 | 联系方式
2025 © 网站维护 www.weihula.com 版权所有