语音合成技术实际上包括了哪三大关键技术

我来答
明宇℡¹56°7°⁷¹8¹8 提问者:明宇℡¹56°7°⁷¹8¹8
3
王燕飞

王燕飞 9 月前

LMA随着人们对语音合成的自然度和音质的要求越来越高,PSOLA算法表现出对韵律参数调整能力较弱和难以处理协同发音的缺陷,因此,人们又提出了一种基于LMA声道模型的语音合成方法。这种方法具有传统的参数合成可以灵活调节韵律参数的优点,同时又具有比PSOLA算法更高的合成音质。这两种技术各有所长,共振峰技术比较成熟,有大量的研究成果可以利用,而PSOLA技术则是比较新的技术,具有良好的发展前景。过去这两种技术基本上是互相独立发展的。
小桃

小桃 9 月前

PSOLA20世纪80年代末提出的PSOLA合成技术(基音同步叠加技术)给波形拼接合成技术注入了新的活力。PSOLA技术着眼于对语音信号超时段特征的控制,如基频、时长、音强等的控制。而这些参数对于语音的韵律控制以及修改是至关重要的,因此,PSOLA技术比LPC技术具有可修改性更强的优点,可以合成出高自然度的语音。PSOLA技术的主要特点是:在拼接语音波形片断之前,首先根据上下文的要求,用PSOLA算法对拼接单元的韵律特征进行调整,使合成波形既保持了原始发音的主要音段特征,又能使拼接单元的韵律特征符合上下文的要求,从而获得很高的清晰度和自然度。PSOLA技术保持了传统波形拼接技术的优点,简单直观,运算量小,而且还能方便地控制语音信号的韵律参数,具有合成自然连续语流的条件,得到了广泛的应用。但是,PSOLA技术也有其缺点。首先,PSOLA技术是一种基音同步的语音分析/合成技术,首先需要准确的基音周期以及对其起始点的判定。基音周期或其起始点的判定误差将会影响PSOLA技术的效果。其次,PSOLA技术是一种简单的波形映射拼接合成,这种拼接是否能够保持平稳过渡以及它对频域参数有什么影响等并没有得到解决,因此,在合成时会产生不理想的结果。
菜鸟裹裹

菜鸟裹裹 9 月前

LPC波形拼接技术的发展与语音的编、解码技术的发展密不可分,其中LPC技术(线性预测编码技术)的发展对波形拼接技术产生了巨大的影响。LPC合成技术本质上是一种时间波形的编码技术,目的是为了降低时间域信号的传输速率。LPC合成技术的优点是简单直观。其合成过程实质上只是一种简单的解码和拼接过程。另外,由于波形拼接技术的合成基元是语音的波形数据,保存了语音的全部信息,因而对于单个合成基元来说能够获得很高的自然度。但是,由于自然语流中的语音和孤立状况下的语音有着极大的区别,如果只是简单地把各个孤立的语音生硬地拼接在一起,其整个语流的质量势必是不太理想的。而LPC技术从本质上来说只是一种录音+重放,对于合成整个连续语流LPC合成技术的效果是不理想的。因此,LPC合成技术必须和其他技术相结合,才能明显改善LPC合成的质量。
派克配音 全球好声音 平台累计配音,超75,960,387 分钟
  • 品质保证
    10年专注网络配音行业 500+国内外专业配音员
  • 全语种配音
    中文多场景配音 提供小语种配音
  • 公司化运作
    提供正规发票 签订服务合同
  • 正规备案
    工信部备案 正规公司平台运作
  • 7*14全天候服务
    公司实现轮流值班 周一至周日09:00~23:00

免责声明: 以上整理自互联网,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。(我们重在分享,尊重原创,如有侵权请联系在线客服在24小时内删除)

{{currtime}}
/
{{duration}}