你是黑科技大佬你不早说_第19页_量子星星

　　第19页 (第1/2页)

    据说它最初是给音乐行业录制小样的，但是发行之后问津者寥寥。制作方一拍脑门，开了个脑洞：“我们不做音乐软件，做虚拟歌姬。”由此，初音未来诞生，虚拟偶像概念进入人们的视线。

    谢晋说：“设计软件框架的时候，我们对比了几款竟品，其中最普及的是vocaliod和utau。它们的实现原理差不多，预先录制人声，对人声排列组合，再加上音调，组成一支歌曲。”

    “我们扒了两款软件的框架，最后还是决定，放弃这种纯机械式合成，改为仿生式的。也就是基于机器学习算法的AI软件，我们把它命名为，电子声带。”

    “因为没有先例，研发期非常困难，不过第一个版本出来之后，给了人相当大的惊喜。制作出来的成曲，最差也能达到歌姬级别。”他点了一下鼠标，对楼清焰说，“董事长，来听听它说的第一句话吧。”

    音响里传出一个清朗的男声。

    “hello,world.”

    楼清焰顿时发现：“这是我的声音？”

    “这是大家投票决定的。”谢晋揶揄地看过来。

    不知为何，被点破心思之后，他反倒觉得楼清焰有点亲切。

    “还行，挺自然的。”

    “这是AI算法的功劳。”谢晋说，“我们设计了一种深度学习算法，软件会对音源库进行特征提取，用提取出来的特征信息进行训练，最终，为每组音源库生成独一无二的数据模型。基于这个模型，合成语音会自然许多。”

    “这还不是最理想的。最理想的那种合成语音，不用组合人声，是凭借AI算法的高智能，凭空生成声音。不过……”

    “不过你们没这个技术。”楼清焰说。

    他想了想，描述道：“声音的本质是震动，在音响里就是膜片的震动，这种震动由电磁场引起，而电磁场的控制方式，是线圈通不通电。通电为1，不通电为0。”

    “所以，计算机声音的本质是一串二进制数，是不同排列组合的1和0。这叫做数字信号。”

    “最理想的语音合成，不是组合音节，而是直接组合数字信号。”

    楼清焰：“我说的对吗。”

    谢晋实实在在地惊讶了。

    他一直以为楼清焰是个不学无术的纨绔，就算所有人都搞懂了计算机原理，他也不可能搞懂的那种。

    没想到他真的懂。

    楼清焰还没说完，他继而道：“理论上，AI软件通过深度学习，可以掌握数字信号的规律，构建一个数据模型，再基于模型生成语音。”

    “但是，这需要一个大前提——机器学习算法能直接从数字层做特征提取。”