コラム
column
ScribeAssistの話者識別機能が大幅にバージョンアップ!変更点を詳しく解説
AI音声認識AmiVoiceを搭載したスタンドアローン型の議事録作成サービス「ScribeAssist」に搭載している発言者識別(話者識別)機能が、2024年3月31日のバージョンアップ(Ver 2.6.0)で大幅にアップデートしました。本記事ではその変更点について詳しく解説します。

目次
話者識別とは
話者識別(発言者識別)は、声の特徴から誰が話しているかを特定する技術です。これにより、会議や電話の録音から、発言者ごとに自動で議事録を作成することができます。例えば、会議中に複数の人が話しても、誰が何を言ったかを簡単に整理できます。
主な変更点
ScribeAssistの話者識別機能について、今回のバージョンアップの主な変更点を紹介します。
出席者の学習データが管理しやすくなりました
すでに搭載されている話者識別について、より使いやすくなるよう管理方法や画面を一新しました。
旧バージョンでは、話者識別するための声の特徴を学習したデータを名前の完全一致で管理していました。そのため、例えば会議によって議事録に記載する出席者の役職名や敬称をつける/つけないなどを変えた場合、学習データを同じ人として扱うことができず、手動で出席者を割り当てる必要がありました。

今回のバージョンアップで、名前とは別に表示名も管理できるようになったため、表示名を変えても同じ人として学習データを扱えるようになりました。管理画面では学習量をカラースケールとともに表示するため、どの人の学習量が足りていないのかも一目瞭然です。


また、学習したデータをエクスポート/インポートすることもできるようになりました。端末ごとに学習する必要がなくなり、学習したデータを渡せばすぐに自動で発言者が識別されるようになります。
新しい話者識別方法が追加されました
新しいバージョンではすでにご説明した学習データをもとに話者識別する方法に加え、声紋情報から自動的に発言者を識別し番号を振る方式を追加されました。
学習データがなくても自動的に番号を振ってくれるので、連日多くの人と会議を行うような場合や、ScribeAssistをインストールした端末を貸し出して使っているような場合に便利にお使いいただけます。

振られた番号を元に、一括で出席者の名前を割り当てることができるため、話者を入力する時間が大幅に削減されます。
推奨する利用シーン
方式 | 概要 | 推奨する利用シーン |
従来方式 | 学習データを元に識別 | |
新方式 | 声紋情報から話者番号を振る |
その他の変更点
会議終了後に一括で識別し直すことができるようになりました
従来は、出席者が割り当てられていない発言しか識別し直すことができませんでした。
今回のアップデートで、新たに手動で設定した発言以外をすべて識別し直すことができるようになりました。そのため、会議中の学習させたデータをもとに、より正確に識別し直すことができます。

同じ発言者が連続している発言を結合できるようになりました
同じ発言者が連続している発言を、一括で結合することができるようになりました。より見やすい逐語録(一言一句の議事録)を作成することができます。
発言者の表示をよりわかりやすくしました
従来は表示上区別されていなかった、手動で選択した発言者と自動で識別された発言者を見た目で区別できるようになりました。

発言者の切り替わりを検知し、自動で発言が改行されるようになりました
従来は、発言の間(無音)をきっかけに発言が改行されていましたが、識別結果を元に改行されるようになりました。より発言者識別が正確になるとともに、学習のための手動選択もしやすくなります。
発言者識別(話者識別)機能の価格
本機能は「ScribeAssist」の標準機能のため、追加費用はかからず無料でお使いいただけます。「ScribeAssist」の価格体系は、こちらの資料 からご確認いただけます。
ScribeAssistについて
「ScribeAssist」は、株式会社アドバンスト・メディアが提供する議事録作成サービスのひとつです。市場でも数少ない、スタンドアローン型(インストール型)のサービスで、インターネット接続なし(オフライン)でも音声認識が可能なのが大きな特長です。料金は、同時利用数に応じた月額料金制のため、使えば使うほど安価に使えることもスタンドアローン型ならではの特長です。
また、市場シェアNo.1※のAI音声認識AmiVoiceを搭載しているため、音声認識精度が高く、確認や修正の手間が最低限で済みます。また、ChatGPTと連携したAI要約機能も搭載しているため、 文字起こし後の議事録作成作業の大幅な効率化も期待できます。
※ 合同会社ecarlate「音声認識市場動向2024」音声認識ソフトウェア/クラウドサービス市場
スタンドアローン型ですが、Web会議の文字起こしも問題なく可能です。当社が提供するクラウドサービス「ProVoXT」と連携することで、議事録をクラウドで管理・共有することもできるため、スタンドアローン型の良さだけではなく、クラウド型の手軽さ・便利さも備えています。

今回ご紹介した話者識別機能以外にも、「ScribeAssist」は議事録作成を効率化する便利な機能を搭載しています。また、2024年3月31日のバージョンアップ(Ver 2.6.0)で話者識別(発言者識別)機能以外も今まで以上に使いやすくなりました。
無料でのトライアルも提供しておりますので、ご興味があれば以下のフォームからお問い合わせください。
問い合わせフォーム
お問い合わせ | VoXT One (advanced-media.co.jp)
また、今回のバージョンアップで、サービス紹介資料もアップデートしています。過去にダウンロードしている方も、以下リンクから必要情報を入力の上ダウンロードください。
