今回は、AppSheetを使用して作成した高性能OCRアプリについてご紹介します。Geminiとの連携により、今までできなかったことが可能になったので、ぜひチェックしてみてください。
これまでのOCR機能の限界
AppSheetには以前からOCR機能がありました。
定型文を読み取って指定の位置に登録することができるもので、例えば、名前や住所が決まった位置にある場合、その情報を特定のカラムに登録することができました。
しかし、この機能は非常に高性能であったにも関わらず、レシートのような非定型の情報を読み取ることは困難でした。
非定型情報の難しさ
レシートは書かれている情報がレシートごとに異なり、フォーマットや内容も様々です。
日本では内税・外税の違いなどもあり、位置が定まらない非定型な情報を読み取るのは非常に難しいものでした。
過去にレシート読み取りアプリを自社のために作ろうとしましたが、うまくいかず断念したことがあります。
Geminiとの連携による高性能OCRの特徴
今回、Geminiとの連携させることで高性能なレシート読み取りアプリが完成しました。
AppSheetでレシートをOCRテキストとして読み込み、そのデータをGeminiで分析します。これにより、レシートような非定型な情報も正確に読み取ることが可能になりました。
AIによる精度向上
GeminiというAIを導入したことで、OCRの精度が大幅に向上しました。
これにより、今まで難しかった非定型な情報の読み取りが可能となり、レシートのデータを正確に取り込むことができるようになりました。
これが無料のノーコードツールで実現できるようになりました!
実際のアプリの動作
ここまでは、どのようにして機能させるのかをお伝えしましたが、実際のアプリの動きを見ていこうと思います。
まずはスマホでレシートの撮影と読み取り
まず、スマホでレシートを撮影し、OCRで読み取ります。
スマホでは「レシート読み取り」という機能を用意しており、画像を撮影して取り込みます。その後、カテゴリ(接待交際費、消耗品費、雑費など)を選択し、データを登録します。
必要に応じて備考も記述できます。
もちろん、PCに直接画像を取り込むことも可能です。
デスクトップでの確認
取り込んだレシートデータは、デスクトップで確認することを想定しています。スマホではレシート撮影、PCでは登録されたデータを表示し、詳細をチェックする想定です。
データのCSV出力
また、登録したデータをCSVファイルとして出力する機能も備えています。
例えば、会計処理や経費精算のためにデータを出力する場合、CSV出力ボタンを押すことで、必要なデータを簡単に出力できます。
出力専用機能の追加によるスマートなデータ出力
デフォルトのCSV出力機能では、すべてのカラムが出力されますが、もう少しスマートにデータを出力するための機能を追加しました。
日付を指定して、特定の期間のデータだけを絞り込み、そのデータだけをCSVファイルにして出力することができます。
これにより、必要なデータだけを効率的に管理できます。
まとめ
今回ご紹介した高性能OCRアプリは、AppSheetとGeminiの連携により、非定型な情報も正確に読み取ることができるようになりました。
様々な関数とAIを活用することで、必要なデータを自分の望む形で取得することが可能です。AppSheetの可能性はまだまだ広がっており、皆様のビジネスでも活用いただけると思います。
当社ではAppSheetの学習や代行サービス「AppSheet Magic」を提供していますので、興味のある方はぜひご相談ください。