コラム
column
音声認識ソフトを上手に活用して、効率の良い文字起こしを!
目次
テープ起こしの速さの限界
録音した音声を文字に起こしたいという場合、すぐに頭に思い浮かべる方法は、テープ起こしではないでしょうか。テープ起こし作業は、最初のうちはなかなか慣れないかもしれませんが、数をこなすうちにスムーズに進められるようになっていきます。また、自分でテープ起こしをするのが面倒な場合は、プロのテープリライターに依頼するという方法もあります。
ただ、スキルがベテランレベルにまで上達したとしても、やはりテープ起こしのスピードには限界があります。60分の録音データならば、熟練された人で最低でも3時間は要するでしょう。そのため、音声データが長時間の場合は、全てを手作業で起こすのは非常に大変であり、精神的にも肉体的にも負担がかかります。
しかし、上記のような悩みを解消できる画期的なソフトが存在するのです。
音声認識ソフトで、音を文字へ
皆さんは「音声認識ソフト」というものをご存じでしょうか。音声認識とは、人間の声などをコンピュータに認識させることです。音声認識を行うことで、録音されている話し言葉を文字に変換することが可能になります。
テープ起こしのように、人間が録音音声を耳で聞いて文字に書き起こす作業に比べると、コンピュータによる音声認識のほうが、ずっとスピーディーだというイメージを持たれる方が多いかもしれません。しかし、それと同時に「コンピュータが、人間の話し声をきちんと正確に認識できるの?」という疑問を持つ方もいらっしゃるでしょう。
人間の声というのは千差万別です。性別、年齢、顔の骨格などで本来の声質が決まり、さらにその時々の体調や環境などの影響も受けるため、さまざまな声のタイプが存在するのです。ただ、その中でアナウンサーのような聞き取りやすい声というのは、非常に少ないでしょう。人間がその場で直接聞いている場合でも聞き間違いや聞き漏らしが発生しますから、「はたしてコンピュータがどれほど認識できるのだろう?」と疑問を持つのは自然なことです。
音声認識技術への注目が高まる!
近年、音声認識が少しずつ一般に普及しつつありますが、実は、技術自体はそれほど新しいものではありません。1950年代初めにアメリカで研究が始まり、日本においても1960年前後に研究がスタートしているのです。そして、研究の結果が実用的な商品に活かされ、それらが市場に出回り始めたのは、1990年代です。意外と長い歴史を持つ音声認識技術が、最近になって注目されるようになり、普及が加速している理由とは一体なんなのでしょうか?
音声認識機能が実用化され始めたころ、その画期的な方法に対する期待度はかなり高かったでしょう。しかし、実際に使用してみると、あらかじめ利用者の声の登録が必要であったり、コンピュータの認識間違いが多かったりなど、不便な点が多かったのです。しかし、近年のコンピュータ技術の進歩により、使い勝手や認識精度が大幅に改善されました。話者が不特定多数の場合でも問題なく対応でき、認識率もかなり向上しています。
もしかしたら、過去に音声認識ソフトの利用経験がある方の中には、満足のいく出来ではなかったことを理由に、音声認識という方法に苦手意識を持っている方がいらっしゃるかもしれません。しかし、過去と比べると、現代の音声認識技術は飛躍的に向上しているのです。
≪おわりに≫
コンピュータによる音声認識は非常に便利ですが、もちろん自動テキスト化された文章が100%完璧というケースはまだまだ少ないでしょう。そのため、人間が音を聞きながら文章を確認し、必要な箇所に修正を加えるという手間が発生します。しかし、その手間を差し引いても、人間が最初からテープ起こしをするケースに比べれば、随分と楽になるはずです。
今現在、仕事でテープ起こし作業を行っている方、テープリライターへ文字起こしを依頼している方など、是非一度音声認識ソフトの導入を検討してみてはいかがでしょうか? 上手く活用すれば、時間や費用などの節約につながるはずです。