字体:大 中 小
护眼
关灯
上一章
目录
下一页
第19页 (第1/2页)
据说它最初是给音乐行业录制小样的,但是发行之后问津者寥寥。制作方一拍脑门,开了个脑洞:“我们不做音乐软件,做虚拟歌姬。”由此,初音未来诞生,虚拟偶像概念进入人们的视线。 谢晋说:“设计软件框架的时候,我们对比了几款竟品,其中最普及的是vocaliod和utau。它们的实现原理差不多,预先录制人声,对人声排列组合,再加上音调,组成一支歌曲。” “我们扒了两款软件的框架,最后还是决定,放弃这种纯机械式合成,改为仿生式的。也就是基于机器学习算法的AI软件,我们把它命名为,电子声带。” “因为没有先例,研发期非常困难,不过第一个版本出来之后,给了人相当大的惊喜。制作出来的成曲,最差也能达到歌姬级别。”他点了一下鼠标,对楼清焰说,“董事长,来听听它说的第一句话吧。” 音响里传出一个清朗的男声。 “hello,world.” 楼清焰顿时发现:“这是我的声音?” “这是大家投票决定的。”谢晋揶揄地看过来。 不知为何,被点破心思之后,他反倒觉得楼清焰有点亲切。 “还行,挺自然的。” “这是AI算法的功劳。”谢晋说,“我们设计了一种深度学习算法,软件会对音源库进行特征提取,用提取出来的特征信息进行训练,最终,为每组音源库生成独一无二的数据模型。基于这个模型,合成语音会自然许多。” “这还不是最理想的。最理想的那种合成语音,不用组合人声,是凭借AI算法的高智能,凭空生成声音。不过……” “不过你们没这个技术。”楼清焰说。 他想了想,描述道:“声音的本质是震动,在音响里就是膜片的震动,这种震动由电磁场引起,而电磁场的控制方式,是线圈通不通电。通电为1,不通电为0。” “所以,计算机声音的本质是一串二进制数,是不同排列组合的1和0。这叫做数字信号。” “最理想的语音合成,不是组合音节,而是直接组合数字信号。” 楼清焰:“我说的对吗。” 谢晋实实在在地惊讶了。 他一直以为楼清焰是个不学无术的纨绔,就算所有人都搞懂了计算机原理,他也不可能搞懂的那种。 没想到他真的懂。 楼清焰还没说完,他继而道:“理论上,AI软件通过深度学习,可以掌握数字信号的规律,构建一个数据模型,再基于模型生成语音。” “但是,这需要一个大前提——机器学习算法能直接从数字层做特征提取。”
上一章
目录
下一页