音声処理技術

抑揚変換技術

 録音された人の声の抑揚(イントネーションやアクセント)を変えることができる技術です。声の高さを分析し、その抑揚を波形(軌跡)にして表示することもできます。

【特  長】
 ・学習者の声と先生の声(お手本)の抑揚の違いを波形として表示することができます。学習者は、どこをどのように矯正すればよいかが直感的に分かります。
 ・学習者の声の抑揚を、お手本の抑揚に変換した音声を生成することができます。学習者はこの音声と元の自分の声を聞き比べることで、お手本との違いを学習者自身の声で確認することができます。

【利用分野】
 ・日本語や中国語のような声の抑揚で単語の意味が決まる言語の学習ツール
 ・抑揚の変形によって感情や訛なまりなどの音声表現を制御するツール
48a.PNG
【技術解説】
(1)抑揚の波形(軌跡)の表示
 赤い線はアナウンサーによるお手本で、縦軸方向で各音の高さの変化、横軸方向で音の時間的間隔を表しています。
48a-1.PNG
一方、青い線は一般の学習者が同じ文章を発声した場合ですが、テンポやリズムがアナウンサーのお手本と異なることが多いため、同じ音を発声している位置が合うように時間方向で伸縮させています。これにより、お手本に比べてどの音の高さが低いのか、あるいは高いのかが理解しやすくなります。これらの赤い線や青い線のことを「ピッチ軌跡」と呼びます。

(2)語学学習での利用手順
① お手本音声の抑揚の抽出
 お手本の声の高さを表す基本周波数を抽出します。この基本周波数の波形には、聴感的な抑揚には寄与しない細かい変動が含まれることが多いため、それを除くためにローパスフィルターをかけて滑らかな軌跡とすることによってピッチ軌跡を求めます。
② 学習者音声の抑揚の抽出
 お手本音声と同じ内容を学習者が発声した音声を録音します。そして、お手本の音声と同様にピッチ軌跡を求めます。
③ お手本音声と学習者音声の対応付け
 DP マッチングと呼ばれる手法を用いて、お手本と学習者の音声を対応付けます。さらに、学習者の音声をお手本に合わせるように、学習者の音声の時間軸を伸縮させます。
④ 学習者音声の抑揚変換
 学習者の音声の抑揚を、お手本音声の抑揚に入れ替える変換を行います。この時の全体の平均的な声の高さを学習者の声の高さに保つように変換することによって、学習者の声の個人性を保ちます。

【提供可能な技術】
 ・声の高さの時間変化を分析し、見やすい軌跡にして表示する技術
 ・ 同じ文章を二者が別々に読み上げた録音音声がある場合に、同じ音韻(母音、子音等)が発声されている区間を対応付ける技術
 ・学習者の声の抑揚をお手本音声の抑揚に入れ替える技術

【関連特許】
 ・特許第6062665号 音声のピッチ周期を抽出する信号処理装置及びプログラム
(上記のリンクは開放特許DBにリンクしており、NHKエンジニアリングシステムのWebサイトから離れます)


≪キーワード≫ アクセント / イントネーション / 抑揚 / 語学学習