音声処理技術

音声区間検出技術・背景音抑圧技術

 若い人に比べてお年寄りは、番組の背景音がうるさく感じられたり、背景音により役者やアナウンサーの音声が聞き取りにくくなることがあります。このような人たちのために、家庭側で音声と背景音のバランスを聞きやすく調整できる技術です。

【特  長】
 ・放送番組中の音声がある区間と非音声(音楽や効果音などの背景音)だけの区間を自動判別できます。
 ・音声区間と非音声区間で背景音を抑圧する度合いを独立に調整できます。

【利用分野】
 ・テレビ・ラジオ受信機
 ・Web 等のムービーコンテンツの閲覧

9977.png
図 番組背景音調整装置イメージ


【技術解説】
 家庭側でテレビの放送番組中の背景音(音楽や効果音)がうるさすぎると感じた場合には、これまでは、テレビの音量ボリュームを小さく調整するしかありませんでした。ボリュームが小さくなるよう調整した結果、聞きたかったセリフを聞き逃してしまうことがあります。
 放送局では、多くの人にとってナレーションやセリフなどの音声と、音楽や効果音などの背景音が最適な音量バランスになるように調整して放送しています。しかし最適な音量バランス
であったとしても、お年寄りの持つ多様な聴力特性や好みなど、すべての要望に応えることは難しくなっています。
 ここで紹介するのは、番組中の音声と背景音の音量バランスの調整を家庭側の受信機でできるようにする技術です。

(1)音声区間と非音声区間(背景音だけの区間)の自動判別
 番組音中のナレーションなどの音声のある区間と音声がなく背景音だけの非音声区間を精度よく判別できる自動判別技術です。番組音の周波数やパワー等の特徴量を利用した区間推定技術と、音の大きさ(ラウドネス)を客観計算して変化の特徴を利用した区間推定技術を組み合わせた信頼性の高い音声区間検出技術です。

(2)音声区間と非音声区間で背景音の抑圧量を独立調整
 各種背景音抑圧技術を利用し、音声と背景音が混在する区間と背景音だけの区間の背景音抑圧手法を切り替えて、区間ごとの背景音抑圧の度合いを独立に調整することができる技術です。この技術により、個人ごとに背景音の大きさを変えることで、音声の聞きやすさをきめ細かく調節することができます。また、これまでに実施した実験結果から、平均的なお年寄りの聴力や好みに適した調整パラメータを算出しました。

【提供可能な技術】
 ・ 周波数やパワー等の特徴量の確率モデルを利用した音声区間推定技術
 ・ お年寄りに適した音声区間と非音声区間の背景音抑圧量調整技術

【関連特許】
 ・ 特許第4791857 号 発話区間検出装置及び発話区間検出プログラム
 ・ 特許第5737808号 音響処理装置およびそのプログラム
 ・ 特許第6313619号 音声信号処理装置及びプログラム
 ・ 特許第6321334号 信号処理装置及びプログラム
(上記のリンクは開放特許DBにリンクしており、NHKエンジニアリングシステムのWebサイトから離れます)


≪キーワード≫ 背景音抑圧 / 音声区間推定 / 音量バランス