当前位置：移动技术网 > 科技>人工智能>ai动态 > 爱数智慧发布中文普通话真·萌童声TTS开源数据集

爱数智慧发布中文普通话真·萌童声TTS开源数据集

2019年11月26日 | 移动技术网科技 | 我要评论

11月20日，爱数智慧发布中文普通话真·萌童声语音合成(tts)开源数据集。该数据集由真童声录制，为中文童声语音合成数据集子集，时长为15分钟，文本主要为日常用语。据了解，数据集全集包含2235句话，时长超2小时。这也是该童声第一次用于tts录制。

随着智能终端市场的扩张，人机交互逐渐成为与智能世界对话的入口。在人机互动过程中，语音合成(tts)的自然度和表现力是用户最能直观感受到的部分。用户使用智能设备的频率增加，对合成语音的期望值也不断提高。

tts数据是影响语音合成效果的重要因素。由于tts数据的采集和标注要求严格，因而成品数据集较少。从采集环节来看，录音需要在专业的录音棚中进行，并严格控制噪声水平，才能最大限度还原发音人声音。录音过程中还需要有专业的录音师和监听人在场，便于及时矫正录音过程中的错误。从标注环节来看，tts数据标注分为4个层级，包括发音校对、韵律层级、音素边界切分和分词词性。为了充分保留发音人的语义表达和发音习惯，标注准确率要求一般在99%左右。

智能设备使用者“低龄化”趋势明显，从而带动了童声数据的需求。受制于儿童识字水平和配合情况，市面上童声tts数据库数量较少，且多为成年人模仿。童声tts语料库呈现出明显的供需不平衡。

本次爱数智慧发布的tts童声开源数据集采集环境为符合nc-20标准的录音间并根据儿童发音习惯对数据进行转写和全链条标注。考虑到句内停顿和句间停顿对听感的影响，在音素边界切分环节，标注人员除了对声韵母边界进行切分外，还对句中静音段和句首尾进行精准切分。

发音人是影响tts数据质量的重要因素。该数据集的发音人为4岁小朋友妞妞。2019年初，发音韵律好的妞妞在上百位4-6岁小朋友中脱颖而出。因为发音韵律好能为用户带来更好的听感。

在与爱数智慧工作人员接触中，我们了解到妞妞性格活泼开朗，喜欢看冰雪奇缘和小马宝莉。在录制休息期间，想要看动画片时，就会黏着工作人员撒娇。录制工作已经结束很久，工作人员在提起妞妞时，言语间还是充满着浓浓的不舍与赞赏。这份由衷的赞赏，也让我们对这个真·萌童声充满期待!

为智能世界提供充足的数据生产力是这家公司创立的初衷。我们也期待爱数智慧用更多高质量的数据解锁更多应用场景，服务更广域的客户。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

小米华为维铭加宝S3手环对比分析，S3更适合老人

2013年，FitBit凭借FitBitFLex席卷全球，打开智能手环在健身领域的大好前景。随后智能手环在中国遍地开花，华为、OPPO、小米等各大品牌搅入战局，... [阅读全文]
Dueros设备激活超2亿，百度AI一骑绝尘领跑行业

AI技术所蕴含的变革力量和商业价值才初露头角，百度的转折也刚刚开始。与此同时，互联网的舞台焦点也从资本和规模的混战，转移到更需长期时间考验的领域，比如产业互联网... [阅读全文]
聊一聊智慧城市的前世今生

在中国，重庆机场的人脸识别系统成功匹配到了逃亡3年的北大弑母案疑犯，张学友开演唱会抓坏人频上新闻。而在美国，坐拥众多人脸识别公司的旧金山，监事会为了维护政治正确... [阅读全文]
修复技术走向产业化，除了“美图”还能干点儿啥？

今年是达·芬奇逝世500周年，所以世界各地都已经或即将举办与之相关的纪念活动。最近在中央美术学院美术馆举行的展览“达·芬奇的艺术：不可能的相遇”落下帷幕。此次展... [阅读全文]
巨头们都在争的语音入口谁家智能音箱能C位出道？

最近，百度全资收购“小鱼在家”的消息，让不少人的眼光再次聚焦语音AI板块，因为，在百度收购“小鱼在家”消息被传出之后不久，“傻白甜”的腾讯鹅也被传出投资智能语音... [阅读全文]
车联网V2X深度应用，聚焦CIDI智能网联交叉路口技术

如何打造更安全、更智能的道路交通呢？我们一起走进CIDI，一探究竟。CIDI智能网联交叉路口管理系统主要由RSU、边缘计算单元、智能交通信号灯、路侧传感器等组成... [阅读全文]
苹果智能音箱来了！发布两年终于在国内开卖

A5创业网（公众号：iadmin5）1月14日报道，2017年6月5日，苹果发布了智能音箱HomePod，但一直未出现在中国市场。今天苹果正式对外宣2019年1... [阅读全文]
带屏智能音箱的全局商战，百度和阿里的胜算几何？

随着AI时代的到来，这个领域的竞争只会越来越激烈。百度虽然早到，但阿里和腾讯显然也不会缺席。阿里、百度、腾讯等互联网巨头的迅速跟进，对于整个行业的快速发展和市场... [阅读全文]
京东发布智能内容创作平台李白和莎士比亚也来助力

A5创业网（公众号：iadmin5）1月14日报道，近日京东发布了首个智能内容创作平台——AI闪电，该平台整合了此前莎士比亚和李白京东两大AI智能文案系统。 [阅读全文]
陶氏全球CEO菲特林会见华人运通董事长丁磊

【2019年1月11日】日前，世界500强企业陶氏化学全球CEO吉姆·菲特林(JimFitterling)拜访了华人运通上海运营中心，并会见董事长兼CEO丁磊。... [阅读全文]

网友评论


验证码：

爱数智慧发布中文普通话真·萌童声TTS开源数据集

2019年11月26日 | 移动技术网科技 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论