記事のポイント
- 自動車部品メーカーのアイシンが会話や環境音を可視化するアプリを開発
- きっかけはコロナ禍で聴覚障害者と出会ったことだった
- 開発者の中村正樹さんに開発経緯を聞いた
自動車部品メーカーのアイシン(愛知県刈谷市)は、コロナ禍で聴覚障害者と出会ったことをきっかけに、会話や環境音を可視化するアプリシリーズ「意思疎通支援システムYYSystem(ワイワイシステム)」を開発しました。NPO法人インフォメーションギャップバスターの伊藤芳浩理事長が、開発者の中村正樹さんに「YYSystem」の誕生のきっかけなどについて聞きました。
■「笑い声」やオノマトペも文字やアイコンで表示
――中村さんの仕事のキャリアと意思疎通支援システム「ワイワイシステム」を開発した契機について教えてください。
アイシンでカーナビゲーションのシステム開発からスタートし、その後音声認識やナレッジデータベースの研究に注力してきました。コロナ禍で聴覚障害者と出会ったことをきっかけに、意思疎通支援システム「ワイワイシステム」の開発に移行しました。
このプロジェクトの初期のアイデアは、人々の会話から知識や技術をデータベース化するというものでした。ですが、開発したシステムは聴覚障害者のことが考慮されていませんでした。
WHOの予測によれば、2050年には4人に1人が聴覚障害を持つという報告されています。すべての人が利用できるものを作ろうと、聴覚障害者もサポートする方向にシフトしていきました。
開発プロセスはSNSで障害当事者の意見を収集し、フィードバックに基づいてプロトタイプを迅速に改善していくというアプローチを取っています。最初に骨格となるデザインや機能を実装したものをリリースして、当事者のユーザー様に使っていただき、直接意見をもらい、改善及び新機能をすぐにリリースしています。
――開発中に直面した課題に対してどのように解決しましたか。
開発では、会議での笑い声などのポジティブな反応を、音声で認識する試みに挑戦しました。多種多様な笑い声に反応する仕組みを作るところが苦労しました。現在は種類程度の音(口笛や拍手、くしゃみ、サイレンの音など)をオノマトペとして表示する技術も開発しました。
また、音声認識の性能向上にも日々取り組み続けています。特に騒がしい工場などで、背景ノイズと人の声を区別することが課題でした。さらに、スマートフォンの電池消費を抑えるため、アプリが少ない電力で動くように、通信を最小限に抑えるための調整も行いました。
これらの挑戦を乗り越えるためには、実際に使う人たちの意見を取り入れ、彼らのニーズに合わせて改善してきました。
■工場や列車内などでも音声を認識
――YYProbe(ワイワイプローブ)の技術的な革新点と、他製品との大きな違いは何ですか。
ワイワイシステムアプリシリーズの一製品であるワイワイプローブは、特に騒音が多い環境下での音声認識精度において自信があります。工場や列車内などの騒々しい環境でも高い認識精度を実現しています。また、開発プロセスにおいては、障害当事者と共にアプリを開発していきました。
例えば、対面でのコミュニケーションを支援するための画面分割機能や、LiD/APD(聞き取り困難症/聴覚情報処理障害)を持つ方々のために開発されたAI要約機能などです。
これらの機能は、障害当事者の方々からのフィードバックに基づいて、実際のニーズに応える形で開発しています。この開発スタイルを評価いただき、2023年のグッドデザイン賞金賞を受賞させていただきました。
音声認識の正確さや開発の迅速性に関しても、多くの方から高い評価を受けています。特に、新機能の要望に対して翌日にはリリースするなど、私たちの迅速な対応は利用者から喜ばれています。一方で、オフラインで使用できる音声認識エンジンについて、認識精度の向上が今後の課題です。
――ワイワイプローブの音声認識技術は、どのように社会に貢献しているでしょうか。
ワイワイプローブは、日常生活で簡単に、当たり前に使える技術の提供を目指しています。私たちの目標は、単に新しいサービスを提供することではなく、人々が日々喜んで使い続けるような製品を作ることです。
特に、障害当事者が情報を簡単に理解できるよう、文字での情報表示を含むさまざまな支援を行っています。これによって、障害を持つ人々だけでなく、彼らの周囲の人々の生活も豊かにしていると考えています。
また、社会的マイノリティの方たちの社会進出を、テクノロジーによって補助することで、より質の高い仕事に取り組めるようになり、日本の労働力不足という問題に対しても貢献していけるのではと考えます。
――音声認識技術サービスは、将来どのように進化するでしょうか。
音声認識技術サービスが市場で一般的になり、より手頃な価格で提供できるようになると予想しています。これにより、より多くの人々にサービスが普及し、新たなサービスの提供ができると考えています。
当面の目標としては、音声認識の精度をさらに高め、生成系AI技術の活用を深めることに集中しています。特に、聴覚障害者特有の発話パターンを学習させ、それを機械音声で再現することも検討中です。
将来的には、災害時など緊急事態に障害当事者を支援する機能や、彼らがより幅広い仕事をこなせる技術の開発を目指しています。技術を通じて誰もがアクセスしやすい包括的な社会を実現していきたいと考えています。