AI音声認識 AmiVoiceとは
AmiVoice
AmiVoiceとは
VoXT Oneサービスに搭載のAmiVoiceは、音声認識ソフトウェア/クラウドサービス市場 No.1※のAI音声認識です。日本語に対する高い認識精度に定評があり、音の情報と言語の情報を密接に組合せながら、高精度に音声を「文字」に変換します。
※ 合同会社ecarlate「音声認識市場動向2025」
特長

25 年以上のノウハウ・データが蓄積された
自社開発の高精度な音声認識エンジン
自社内に独自の研究部門を持ち、最新の技術やデータを使って分析やチューニング。最新のディープラーニング技術を実装し、高い認識率を実現しています。
AmiVoiceは日本語に対する高い認識精度に定評があり、議事録だけではなく様々なシーンで使われています。

会議・議会・医療など、業界やシーン特有の
用語が含まれるエンジンを提供
AmiVoiceは、業務に不適切な用語を省くことで誤認識を軽減したビジネスユースに強い言語モデルを使用しています。さらに、会議・議会・医療・建設など、業界・シーン特有の用語の認識精度が高いエンジンもご用意しているほか、製品名や固有名詞などの登録・認識も可能です。業界ごとの単語リストも提供しているので、単語登録の手間も削減されます。

自然な話し方でも認識でき、
方言によるイントネーションの違いも問題なし
AmiVoiceは、音声を認識させるために話し方を不自然に変える必要はありません。アクセントやイントネーション、会話スピードに左右されず、より自然な発話を認識します。また、事前に自分の話し方のクセを学習する必要はないため、老若男女を問わず誰の音声であっても簡単に認識します。
※
単語自体が共通語と異なる場合は、認識精度が下がる場合があります
音声認識の仕組み
音声認識は、声の情報と言語の情報を密接に組合せながら、音声を「文字」に変換する技術です。
「音響分析」によって音の特徴を数値化し、その数値(特徴量)を「音響モデル」、「言語モデル」、「発音辞書」の3つのパーツから構成される「認識デコーダ」に入力することで音声認識結果を出力します。認識デコーダがニューラルネットワークだけで構成されているというシンプルな構造が特長の「End-to-End型」の認識デコーダも存在します。
VoXT Oneサービスで利用できる音声認識辞書
VoXT
Oneサービスでは、以下の音声認識辞書を利用できます。最適な辞書を選択することで、より認識率が向上します。
下記以外の業界・シーンにおいても、単語登録機能を活用することで業界特有の用語や社内用語も認識します。業界別・職種別の単語リストも提供しています。
- 会議
- 企業や官公庁など業種を問わず、さまざまな会議に幅広くお使いいただけます
- 議会
- 地方自治体の議会や委員会など、議会特有の用語を使用する会話に適しています
- 医療・製薬
- 病院内におけるカンファレンスなど、医療用語を使用する会議に適しています
- 建設
- ゼネコンや建設会社など、建設業界特有の用語を使用する会話に適しています
- 英語
- 英語でのネイティブな一般会話を文字起こしします