亚马逊开发出有史以来最大的文本转语音模型

2024-04-30 15:25:01运营推广108

2 月 18 日消息，亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型，该模型拥有最多的参数，并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文，详细描述了模型的开发和训练过程。

亚马逊开发出有史以来最大的文本转语音模型

近年来，像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。然而，人工智能也在逐步融入其他主流应用领域。在这个新项目中，研究人员尝试通过增加参数数量和扩充训练数据集来提升文本转语音应用的能力。

据IT之家了解，这个名为“可扩展流式文本转语音模型”（BASE TTS）的新模型拥有 9.8 亿个参数，并使用 10 万小时的录音（来自公共网站）进行训练，其中大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例，使其能够正确发音一些常见的表达，例如“au contraire” 和 “adios， amigo”。

亚马逊团队还测试了使用较小数据集的模型，希望能从中发现人工智能领域所说的“涌现能力”。这种能力是指人工智能应用，无论是大型语言模型还是文本转语音模型，突然突破到更高智能水平的现象。他们发现，对于文本转语音应用而言，这种飞跃发生在参数量达到 1.5 亿的中型数据集上。

研究人员还指出，这种飞跃涉及一系列语言属性，例如使用复合名词、表达情感、使用外语词、应用语音学和标点符号以及正确强调句子中的关键词等能力。

研究团队表示，出于对潜在滥用风险的担忧，BASE TTS 将不会向公众开放，他们计划将其作为学习应用，并期望将学到的知识应用于改善文本转语音应用的整体音质。

本站内容来源于网络，并不代表本站立场！版权归原作者所有，侵权请联系删除，转发请注明来源，文章内容仅供参考。
本文链接： http://www.doyin.net/yunyingtuiguang/32999.html

上一篇：亚马逊竞价广告优化软件有哪些？调整完之后多久生效？

下一篇：亚马逊可以从国内发货吗？卖家如何发货？

热门文章

2024年最新版抖音直播间送礼物价格表大全抖音直播间礼物价格分别是多少？本文对直播间礼物价格进行了汇总整理，大家可以按ctrl+F搜索查看。抖音礼物价格表大全注：10钻-1元 - 小额礼物： - 爱心...
v课堂-抖音火花标识获取方式是什么？抖音火花标识怎么打开？抖音火花标识是平台对创作者的一种认可，通常与创作者的粉丝数量、互动率以及内容质量等因素有关。抖音作为全球领先的短视频社交平台，不仅为用户提供了丰富...
福州自助餐排行老铁们，大家好，相信还有很多朋友对于福州自助游和福州市区必去景点的相关问题不太懂，没关系，今天就由我来为大家分享分享福州自助游以及福州市区必去景点的问...
2024年最新版抖音pk段位积分对照表打pk是一种常见的抖音直播间玩法，抖音直播打pk也是分段位的，下面整理了2024年最新版抖音pk段位积分对照表。 2024年抖音PK的段位积分对照表如下：青铜等级：...
抖音pk一万分等于多少人民币_怎么玩_在抖音平台上面也推出了各种各样的活动，不少抖音达人都不知道应该怎么去玩转，比如说抖音的pk玩法，如果赢得了比赛，获得了一万分，那么它大约等于多少钱的人民...
天津到大连的轮渡表大家好，如果您还对天津船票网上订票不太了解，没有关系，今天就由本站为大家分享天津船票网上订票的知识，包括天津到大连的轮渡表的问题都会给大家分析到，还望...
抖音顶部导航栏怎么移除频道？抖音怎么关闭多余的频道？抖音顶部导航栏怎么移除频道？抖音怎么关闭多余的频道？抖音作为一款流行的短视频分享和社交平台，其顶部导航栏提供了多种频道供用户选择，以便于快速访问感兴...
抖音胜仔是怎么火的身价多少？抖音胜仔一年能挣多少钱在抖音上，网络红人有很多，可能你不经意间的一个视频就能把你推上热门，成为网络红人，不过有些网红在一段时间消失了，想要在红起来还是比较难得，说到胜仔应该...