放送素材の字起こしシステム
音声認識技術を用いて、取材映像中の発話内容の字起こしを制作するシステムです。XDカムやライブ伝送により局内に入った取材映像を即座に認識し、字起こし結果を簡単に参照・修正できるインターフェースを備えています。
AIを用いたアナウンスシステム
音声合成技術を用いて、自然で滑らかな合成音声で文章を読み上げるシステムです。
文脈に合わせた自然なイントネーションや間の取り方など、DNN音声合成技術を用いてコンピューターに学習させています。
顔画像認識システム
顔画像認識技術を用いて、映像中から顔部分を検出・認識して人物を同定するシステムです。映像中の登場人物のメタデータ付加への利用が期待できます。
顔検出・認識エンジンはNHKの独自開発のものを使用しています。