複数人数の会話も文字起こし可能な、すごい「書き起こし専門マシン」

公開: 更新: TBS Topics


大人数の会話にもスラスラ対応

人が話した内容をリアルタイムで文字にする、書き起こし専門マシン「ボイター」。

書き起こし専門マシン「ボイター」書き起こし専門マシン「ボイター」

一般的な文字起こしアプリよりも正確性が高く、文字起こしのスピードも速いうえ、大人数の会話もスラスラ文字にすることができます。

実は、複数人での会話は、様々な方向からの音声が混ざってしまうため、文字起こしが困難でした。しかしボイターは、本体に高性能マイクを8つ搭載することでこの課題を解決。

複数人の会話も文字起こし可能複数人の会話も文字起こし可能

“指向性があるマイク2つ・360度集音マイク6つ”を組み合わせ、ピンポイントで声の方向を分析・感知。複数人の会話でも、スムーズな文字起こしを可能にしました。

また、ボイターは、認識した音声をそのまま文字にするのではなく、日本語の前後の内容を理解して文章を訂正するため、文字起こしの正確度が高いという特徴を持っています。

前後の内容を理解して文章を訂正前後の内容を理解して文章を訂正

日本では2021年8月に販売が開始されたボイター。現在、ユーザーからの要望を受け、「え~」や「あの」などの言葉を自動的に削除して文章を作れるように改善中です(※2021年10月放送時点)

中国で最大シェアを誇る企業が開発

ボイターを開発・販売している「アイフライテック」は、中国のAI音声認識市場で最大のシェアを誇る巨大企業。

アイフライテックアイフライテック

国際的な音声認識技術大会「CHiME Challenge(チャイムチャレンジ)」で3年連続優勝しており、中国のパソコンやカーナビのほとんどに、アイフライテックの音声認識技術が使われています。

 

PICK UP