库生成独一无二的数据模型。基于这个模型,合成语音会自然许多。”
“这还不是最理想的。最理想的那种合成语音,不用组合人声,是凭借AI算法的高智能,凭空生成声音。不过……”
“不过你们没这个技术。”楼清焰说。
他想了想,描述道:“声音的本质是震动,在音响里就是膜片的震动,这种震动由电磁场引起,而电磁场的控制方式,是线圈通不通电。通电为1,不通电为0。”
“所以,计算机声音的本质是一串二进制数,是不同排列组合的1和0。这叫做数字信号。”
“最理想的语音合成,不是组合音节,而是直接组合数字信号。”
楼清焰:“我说的对吗。”
谢晋实实在在地惊讶了。
他一直以为楼清焰是个不学无术的纨绔,就算所有人都搞懂了计算机原理,他也不可能搞懂的那种。
没想到他真的懂。
楼清焰还没说完,他继而道:“理论上,AI软件通过深度学习,可以掌握数字信号的规律,构建一个数据模型,再基于模型生成语音。”
“但是,这需要一个大前提——机器学习算法能直接从数字层做特征提取。”
他问道:“能吗?”
谢晋服了,这人为啥总是一下子问到最关键的地方。
“现在确实没这个技术。我们设计的特征提取算法,主要瞄准声音的波形表现,频率、相位这些。”他简单地说。
楼清焰又说:“不止缺这一个技术吧。做了特征提取,知道怎么归纳总结吗?知道怎么训练模型吗?会写算法吗?设想过这个计算量有多庞大吗?”
Loading...
未加载完,尝试【刷新】or【退出阅读模式】or【关闭广告屏蔽】。
尝试更换【Firefox浏览器】or【Chrome谷歌浏览器】打开多多收藏!
移动流量偶尔打不开,可以切换电信、联通、Wifi。
收藏网址:www.360lele.cc
(>人<;)