生成AIが切り開く視覚障害者の新世界

アメディアでは、2024年7月1日付で、音声読書器「快速よむべえ」と「よむべえスマイル」に、 Google の生成AI機能を搭載しました。
これを機に、生成AIを視覚障害者が利用しやすい環境を順次整えて行きます。

快速よむべえ よむべえスマイル クラウドサービス

これまで、読めなかったものへの挑戦

これまで、音声読書器では、文字しか読み上げませんでした。
絵や写真が入っていると、それらが文字認識を邪魔して、文字化けの原因となることがしばしばありました。
生成AI を導入することにより、絵や写真を言葉で説明できるようになります。

これまで、読まれても分かりにくかったものへの対応

クラウド認識機能を用いると、ほとんどの印刷物は非常に正確に認識して読み上げます。
しかし、新聞のように、レイアウトが複雑な印刷物は、文字は読んでいても、内容がよく分からないということがしばしばありました。

ところが、レイアウトが複雑な新聞や、細かい文字で小さな紙面に大量の情報が印刷されているもの等を、適切な指示をAIに与えることにより、とても分かりやすく文章を整頓して読み上げてくれます。
新聞は、紙面に書かれているテーマを分類して、それぞれのテーマごとに読み上げするので、内容が混在して分かりにくいというこれまでの問題は脱却できました。

利用者が自分で生成AI に指示を送る機能

利用者がテキストで生成AI に指示を出す機能を搭載しました。
指示のテキストは、USBメモリーからよむべえが仲介して生成AI に渡します。

指示には、
・読んだ印刷物に対する指示
・利用者が自由に与える指示
の2パターンがあります。

「読んだ印刷物に対する指示」では、印刷物に書かれていることの中から、知りたいことだけを抽出させること等ができます。
「利用者が自由に与える指示」では、テーマを与えて作文させたり、自分が書いた文章を遂行して書き直しさせたりもできます。
URL を与えて、ホームページに書かれていることから知りたいことを重点的に調べさせたりもできます。

従来のプログラムと異なる非再現性

従来のプログラムでは、何度実行しても同じ結果が返されるというのが常識でした。これを「再現性」と呼びます。
ところが、生成AI には、再現性はありません。
昨日と本日、同じ指示を出したとしても、まったく同じ答えが帰ってくる可能性はとても低いです。
実行する度に少し角度が異なる別の解答が返ってきます。
まさに、生成AI が常に進化している状態を示しています。

利用者も進歩に加わることができる生成AI

生成AI は、
・土台を作っている Google
・視覚障害者に窓口を提供しているアメディア
・実際に利用している利用者
の3者が、それぞれに工夫をこらして努力することにより、日進月歩で使いやすいものに成長して行きます。
利用者の皆様自身も、製品の改良に加わることのできる素晴らしいシステムです。

アメディアでは、機能改良版を随時インターネットによるアップデート機能で、利用者の皆様に遅滞なく提供して参ります。
生成AI で、新世界を一緒に切り開いて行きましょう。

株式会社アメディア
代表取締役 望月 優

お問い合わせページ