音声処理技術

話速変換技術

 人の話す速さを、音質劣化なくリアルタイムで変換できる技術です。パソコンやスマートフォンのアプリケーションとして、あるいはDSP を利用した機器として、音声全体の時間は延ばさずに、ゆっくり聞くことができます。速く聞くこともでき、3倍速程度でも内容を聞き取ることができます。お年寄り向けに、リアルタイムの放送の音声をゆっくりと変換したり、視覚障害者のための音声情報を高速に再生することができます。

【特  長】
 ・再生時の話速を変えても、声質の変わらない高品質再生が可能です。
 ・発話の時間尺を保ってゆっくりとした音声に変換できるため、早口に変換しても聞き取りにくくなりません。
 ・外国語にも利用できます。

【利用分野】
 ・テレビ・ラジオ受信機への組み込み
 ・補聴器などと組み合わせた(高齢の)難聴者支援
 ・記録した映像の、ダイジェスト視聴のための「早聞き」(家庭向け:HD レコーダーへの組み込み、プロ向け:編集機への組み込み)
 ・語学学習や聞き取りやすい会話のための支援ツール
 ・パソコンやスマートフォンアプリとしての映像・音声プレーヤー
 ・視覚障害者向け録音図書再生機

10126.png
図 適応的話速変換の動作


【技術解説】
(1)自然な音質を維持したスローや早回し再生
 ・お年寄りのなかには「放送で話される音声が早口で聞き取りにくい」と感じている人が少なくありません。ここで紹介する技術は、テレビやラジオの音声を、声の質はそのままに、話し手があたかもゆっくりと話したかのように変換できる話速変換技術です。
 ・開発した「適応的話速変換」によって、各フレーズの始めや声の高さが高いところを局所的に伸長する一方、息継ぎの" ま" など声のない部分を短縮することで、番組の時間尺を延ばすことなく、話す速さをゆっくりとすることができます。
 ・リアルタイムの放送に適用でき、テレビ・ラジオの受信機への導入実績があります。
 ・録音した音声では早回し再生が可能で、例えば2倍速では、どの部分も一様に短縮する場合に比べ、適応的話速変換では同じ半分の時間で内容を聞き取りやすくできます。

(2)適応的話速変換の動作
 ・フレーズの始めはゆっくりとし、徐々に元の速さに戻します(その後も、声の高さが高いところでは局所的にゆっくりと再生します)。
 ・息継ぎの"ま"など声のない部分に短縮し、次のフレーズの始めを実時間に合わせます。


(3)話速変換技術の応用例
 ・ラジオニュースのインターネットサービス。「普通、ゆっくり、速い」を選択聴取できます。

 ・人にやさしいテレビ・ラジオへの内蔵。お年寄り向けに、自分で速さを切り替えられます。

 ・スマートフォン用のアプリの語学プレーヤー。英会話等のコンテンツを初心者はゆっくり、上級者は早口にして練習できます。

 10391.png

図 ラジオオンデマンドでの応用例


【提供可能な技術】
 ・適応的な話速変換と聞こえの関係に関する技術
 ・番組音声などからの音声区間の検出に関する技術
 ・音声のピッチ抽出に関する技術
 ・音質の評価法に関する技術

【関連特許】
 ・特許第3220043号 話速変換方法およびその装置
 ・特許第5412204号 適応的な話速変換装置及びプログラム
(上記のリンクは開放特許DBにリンクしており、NHKエンジニアリングシステムのWebサイトから離れます)


≪キーワード≫ 話速変換