采用市面上最接近人声的语音技术。有两种渠道实现文本转语音(text to speech)
渠道1:固定音色
使用最接近人声的音频技术,采用市面上最广泛认可的技术方案,下面是云溪的声音。
渠道2:任意音色
可以转换任意声音,下面是唐僧的声音。
下面是这两个渠道的使用办法:
首先电脑上扫码登录https://v2.clonevoice.net
1、固定音色
固定音色提供21个音色,包括普通话、粤语、东北话四川话等方言,提供男生和女生,涵盖有儿童,青少年,中年和老年人声音。
然后在弹出的tab页,输入文本,文本小于1万字,转换完就能在“我的文本转语音”听到转换结果了。
2、任意音色:
任意音色是从声音库选取声音模型,使用这个声音模型进行文本转语音。
上面两种渠道生产的音频文件都是48k的高清音频。