音声認識
音声認識(おんせいにんしき、英: speech
recognition)とは、人間の声などをコンピューターに認識させることであり、話し言葉を文字列に
変換したり、あるいは音声の特徴をとらえて声を出している人を識別する機能を指す。自動音声認
識(英: Automatic Speech Recognition; ASR)とも。
音声認識とは、人間の声などをコンピューターに認識させることである。話し言葉を文字列に変換
したり音声の特徴をとらえて声を出している人を識別したりする機能を指している。
話し言葉を文字列に変換する機能は、指を用いてキーボードから入力する方法に代わるものである
。
文字列(文章)を入力する機能だけを呼び分ける場合は「音声入力」あるいは「ディクテーション
(聞き取り)」と言う。
(ちょうどキーボードから文字列やショートカットを入力してアプリケーションを操作できるよう
に)音声認識でアプリケーションを操作することも可能である。音声でアプリケーションを操作す
ることは「音声操作」と言う。
「音声認識」に話者が誰なのか識別する機能を含めることもある。これは、あらかじめ記録してお
いた音声パターンと比較して個人認証等をおこなう機能であり、この機能を特に呼び分ける場合は
「話者認識」とも言う。
出典: フリー百科事典『ウィキペディア(Wikipedia)』