欢迎光临
我们一直在努力

只需 1 分钟,这个网站就能克隆你的声音

只需求你的几段话,机器就能克隆出你的声响,如许的事变你置信吗?

这种好像只要在以前影戏和科幻作品里才会出现的情节,近来在极客之选(微信号 GeekChoice)发明的这个名叫 Lyrebird 的网站成为理想,而且明确无误地出如今我们眼前。

Lyrebird 取自一种生存在澳洲的特别鸟类——琴鸟,它最大的特点是能模拟四周的声响,只需听到声响信号,它都能够很天然模仿出来。现实上 Lyrebird 网站做的便是相似的事变。

翻开网站,主页上明晰的写着「我们发来日下上最真实的人造声响」(We create the most realistic artificial voices in the world),看起来有点让人迷惑,只是下方写着如许三条注解,表明网站的目标:

  • 通过付与特别声响使你的产物特别;
  • 在你需求时发明你本人的声响助手;
  • 为你的使用集成用户本人的声响。

既然是发明声响的网站,那么它究竟能有多像?这就惹起了我们的激烈猎奇,固然在网站 DEMO 部分,我们听到了官方合并的足以以假乱真的特朗普以及奥巴马的声响(文章开头视频部分),但那和我们从前见到的 AI 视频作假都更像是展现技能罢了,终究可否模仿出坐在电脑前的你我呢?

带着这个题目,我们又看到官方一个名为「CREATE YOUR OWN VOCAL AVATAR」的功用,上面写道只需录制 1 分钟,就能发明出属于每个人的声响,这就让我们刻不容缓想要尝尝看这扇新天下大门背后的机密。幸亏这个功用并没有运用门槛,官方只需求运用前先注册,就能不收费运用。

怀着半信半疑又满心等待的心境,我开启了特殊的灌音之旅。Lyrebird 官方要求每个人必须至少录制 1 分钟,即 30 段英文,这些英文是来自官方素材库中的随机句子,或长或短,但都不算太难。

点击「Start recording」,对着麦克风念出句子,点击上传,接着出现下一个句子,点击「Start recording」…… 如许往复,完成 30 句就算收罗胜利。值得留意的是,每一句话录制流程中,假如你觉得不称心,都能够选择重新录制。

颠末几分钟的录制,30 句话上传完毕,这时会弹出一个窗口,上面通知大众,录制的材料越多终极出现的声响结果越好,30 句话的英语实际上是 1 分钟的素材,最好可以录制 5 分钟,也便是 150 句话,结果会更好。固然,的确 30 句话也契合模范,点击「发明我的声响」,见证奇观的时辰就要到了。

Lyrebird 网站会在云端哄骗 AI 技能进行剖析和合并,大约一分钟左右,我们终于看到官网出现了一个新的对话框。而这便是终极我们的「声响制造器」。

在对话框输入随意句子或单词,你就能听到被机器制造出来的声响,听起来和我本人的声响确实十分靠近,即使是稍长一点的句子,它也能收回很正常的声响,给人一种更专业的觉得,只是也并非全完好陷,至少我发明了两个现在还不完满的方面:

第一,声响表示出来的虽然十分还底本人,但能听到此中混合的细微电流声,实验屡次都市如许,细心听的确和真人的声响会有差异;

第二,由于用英语录制素材,输出的也是英语句子,因而整体固然在英语上可圈可点,但当让它说出中词句子时,表示的并欠好。

虽然如许,Lyrebird 依然让我们感触诧异,在发明本人声响这件事变上,至少并不如我们想象的那么困难。实际上,它现在的结果曾经比客岁好了不少,就在上个月,Bloomberg 记者 Ashlee Vance 就用机器合并的句子跟家里人打电话并问好,他的母亲乃至很难分清晰终究是不是真的。

在让人齰舌的技能背后,Lyrebird 所关注的范畴天然也引发不少人的忧愁,终究这些能被用来做些什么?怎样不被滥用?更进一步会酿成什么?

在 Lyrebird,我们看到了开创团队想象的几个场景,包罗谈天机器人、电子书、智能客服、视频游戏、以及文章辅佐。这些场景实际上曾经有声响存在,但 Lyrebird 盼望做到的是,通过更真实的声响,能协助大众更好融入这些场景,同时也能节流下好多人力资源。

至于怎样不被滥用,Lyrebird 结合开创人 Jose Sotelo 在承受 Bloomberg 采访时谈到,他们盼望这个技能能协助那些发声困难的人,通过官方 API 接口,为他们打造出本人克隆出的更真实声响,而不再是以前那种机器收回的声响。一个例子是 Ice Bucket Challenge 开创人 Pat Quinn,他患有 ALS(肌萎缩侧索硬化),但在运用 Lyrebird 之后,他也能够通过「本人的」声响进行演媾和交换。

而关于 Lyrebird 的将来,我们不妨再追念一下今年五月,Google I/O 大会上,Google Assistant 带来的令人诧异的现场演示关键。当机器曾经可以模仿出真实的人类声响之后,假如还能表示出人类语言时断断续续、略带考虑的顿挫节拍,到达以假乱真的水平,能否就会更进一步,协助我们处置那些平常的噜苏事变呢?

新的技能出现往往会伴随人们的一些焦急,但即使如许,它在前进的流程中也会慢慢修正不对,改良不够,我们既是见证者,也是可以改良的到场者,因而也不必过于担忧,正如 Jose Sotelo 所说:

「我们盼望技能能用于积极的事变,而不该该令我们害怕。这便是我们应该当心和热情的缘由。」

赞(0) 打赏
未经允许不得转载:IT新闻网 » 只需 1 分钟,这个网站就能克隆你的声音
分享到: 更多 (0)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏