GAFAを超える高精度！アドバンスト・メディアが放つ最先端の音声認識APIがビジネスの議事録作成を劇的に変える

音声ソフト開発の先駆者であるアドバンスト・メディアが、日本語の音声をリアルタイムでテキスト化できる強力な音声認識エンジンの外部提供を開始しました。クラウド経由で手軽に利用できるこの新サービスは、文字起こしや音声アシスタント機能の導入を検討する企業にとって待望のシステムといえるでしょう。これまでハードルが高かった高度な音声認識をまずは試してみたいという企業を優しく迎え入れ、ビジネスの可能性を大きく広げてくれるに違いありません。

SNS上では「ついに本命が来た」「自社アプリへの実装が簡単になりそうでワクワクする」といった歓喜の声が早くも上がっています。今回の展開にあたり、同社は外部のアプリケーションやシステムがスムーズに連携できるよう、窓口となる「API」を公開しました。APIとは、異なるソフトウェア同士が互いに情報をやり取りして繋がるための仕組みを指します。これにより、開発に多大なコストや時間をかけることなく、自社のサービスに最先端の機能を組み込めるのです。

気になる利用料金は、音声データをクラウド上に蓄積していくプランであれば1秒あたり0.025円という完全な従量課金制となっています。使った分だけ支払う明朗なシステムは、コストを抑えたいスタートアップ企業や中小企業にとっても大きな魅力です。同社はもともと、コールセンターや医療機関の現場といった専門性の高い領域に特化した法人向け音声認識ソフトで圧倒的な強みを誇っており、その技術力には以前から定評がありました。

さらに今回のサービスでは人工知能、すなわちAIの技術をフルに活用している点が最大の特徴です。ビジネスの厳粛な場面には適さない不適切な不快語を文字起こしの結果から自動で排除してくれるほか、仕事で頻繁に飛び交う専門用語や語彙の認識力を格段に高める工夫が施されています。単に言葉を拾うだけでなく、職場で即戦力として機能する洗練されたテキストが生み出されるため、業務効率化の強力な相棒になることは確実でしょう。

同社の鈴木清幸会長兼社長は、ビジネスで実用できるレベルの日本語音声入力の精度に関しては、アメリカのグーグルをはじめとする「GAFA」と呼ばれる巨大IT企業群であっても簡単には到達できないと、並々ならぬ自信を覗かせています。多くの企業にこの技術を役立ててもらい、それぞれの業務に合わせてカスタマイズされた最適な音声認識を提供することで、さらなる売上の拡大を目指していくという力強い展望を語ってくれました。

あらゆる業界で深刻な人手不足が叫ばれる昨今、録音データから長時間の会議の議事録を作成するような負担の大きい事務作業は、一刻も早く自動化されるべきだと私は考えます。専門用語が複雑に飛び交う日本のビジネスシーンにおいて、日本語の繊細なニュアンスを正確に聞き取る能力は、欧米のメガテック企業に国内の技術が十分に立ち向かえる重要な分野です。今後もこうした革新的なサービスが、私たちの働き方をスマートに変えていくでしょう。

関連投稿:

コメント