コラム

column

方言で話すと、音声認識の精度は変わるのか?

2021年12月01日

話した言葉をリアルタイムで文字にする音声認識。
日本全国の地方自治体や議会において、議事録作成など多くのシーンで活用されています。

業務効率化を推し進める中で、音声認識を活用した製品の導入を考える方も多いのではないでしょうか。
この記事では、音声認識製品を検討する中で、気になるポイントの1つである【方言の認識精度】について紹介していきます。

1.方言の認識精度って実際どうなの?

結論から書くと、共通語に比べて方言の認識精度は低くなる傾向があります。
共通語と単語自体が異なる方言などの場合、どうしても認識されにくいです。

ですが、音声認識の特性を理解し、上手に活用してあげることで方言の認識精度を高めることができます。
今回は音声認識を活用した議事録作成ソフトの「ScribeAssist」を使って、方言の認識精度を検証していきたいと思います。

 

2.検証!イントネーション、アクセントが関西弁

(例:「ありがとう」が「ありが↑とう↓」になるような場合)

初めに、言葉は共通語ですがアクセントは関西弁の発話内容を音声認識にかけてみます。

発話内容 この間の会議で言ってた件についてですが、もう解決はしましたか。してないようなら一緒に確認しましょう。そういえば、この会議には事業部の人は全員入っていましたっけ。
認識結果 この間の会議で言ってた件についてですが、解決はしましたか。してないようなら一緒に確認しましょう。そういえば、この会議には事業部の人は全員入っていましたっけ。

このように、認識結果は元の発話内容とほとんど違いがありません。
音声認識は、アクセントやイントネーションの違いに比較的強い傾向があります。

 

3.検証!言葉もしっかり関西弁

(例:「ありがとう」が「おおきに」になるような場合)

次に、発言内容の言葉が共通語と全く違う関西弁の場合はどうなるでしょうか。
検証結果はこちらです。

発話内容 こないだの会議で言っとった件やけど、もう解決しました。してへんねやったら一緒に確認しましょう。せや、この会議って事業部の人全員入っとったっけ。
認識結果 こないだの会議で言っとったけんやけど、もう解決しました。してやったら一緒に確認しましょう。シェア、この会議で事業部の人全員入っとったっけ。

やはり先程の検証に比べて誤認識が多いようです。
「せや」が「シェア」になっていますね……。

音声認識は学習したデータをもとに文字起こしをしています。
知らない言葉や、あまり使われない言葉が含まれていると認識することは難しいです。
例:”〜やけど”を、”火傷”と認識してしまう、など

 

4.方言の認識精度を高める方法

ここからは、発言内容に方言を含む場合の認識精度の高め方をご紹介していきます。

単語登録

単語登録機能を使い、AIに言葉の「読み」と「表記」を学習させることで認識ができるようになります。
例:東北の方言 「めんこい」(かわいい)

単語登録しないで使った場合
発話内容 あの子はめんこい子だ。
認識結果 あの子は面子行こだ。

 

単語登録してから使った場合
発話内容 あの子はめんこい子だ。
認識結果 あの子はめんこいこだ。

このように、ひと手間加えるだけで認識精度はアップします。

 

また、そもそも音声認識は録音方法がとても大切なので、
単語登録だけではなく、録音のやり方を見直すことも認証精度の向上に繋がります。

録音環境でこんなに変わる! 文字起こしの精度を高める3つのコツ

https://voxt-one.advanced-media.co.jp/column/recorder/

 

5.おわりに

今回は音声認識を活用する上で気になる、方言の認識精度についてご紹介しました。

まとめると….

・方言は共通語よりも正しく認識しにくい
・イントネーションやアクセントの違いには比較的強い
・言葉自体が違う場合は誤認識することもあるが、単語登録で機械に学習させることで精度をあげられる。
・そもそもの録音方法に気を付けることを忘れずに!

 

この記事が少しでも、方言を含む発話における音声認識活用の助けになれば幸いです。

 

また、音声認識エンジンAmiVoiceを活用した議事録作成ソフト「ScribeAssist」、「ProVoXT」は北海道から沖縄まで、全47都道府県のさまざまな自治体や企業で活用されています。
方言の認識精度が心配で、音声認識製品の導入を迷っている担当者の皆さま!
ぜひ一度お試しください。

ScribeAssist:スタンドアローン型の議事録作成アプリケーション

https://voxt-one.advanced-media.co.jp/service/scribeassist/t

ProVoXT:クラウド型の議事録作成サービス

https://voxt-one.advanced-media.co.jp/service/provoxt/

  • HOME
  • コラム
  • 方言で話すと、音声認識の精度は変わるのか?