生成AIとAI OCR非定型文書データ化実現!さくら情報システム「AI TextSifta」

投稿日:

さくら情報システムは、生成AIとAI OCRを組合せた新たなデータ化サービス「AI TextSifta」(エー・アイ・テキストシフタ)を2024年6月より提供開始しています。

 

さくら情報システム「AI TextSifta」(エー・アイ・テキストシフタ)

 

 

 

さくら情報システムは、生成AIとAI OCRを組合せた新たなデータ化サービス「AI TextSifta」(エー・アイ・テキストシフタ)を2024年6月より提供開始!

 

■サービス提供の背景

企業がDXを進める上で課題の一つとなる「アナログ情報のデジタル化」を解決するために、各種紙資料の電子化と並行しAI OCRの利用がビジネスの場面に広がっています。

一方、既存のAI OCRが得意とする日本語の請求書や領収書だけでなく、業務固有の特殊なレイアウトの帳票やPDF、写真などからテキストを抽出する作業もさまざまなビジネスシーンで求められています。

同社はこれらの需要に着目し、急速に進化するGPT(生成AI)を活用し、プロンプトを駆使することで速やかにデータ化を行う当サービスを開発しました。(特許出願中)

 

サービス詳細:https://www.sakura-is.co.jp/solution/ps-000-158.html

 

 

■サービスの特長

「AI TextSifta」は従来のAI OCRで必要とされた事前学習モデルや設定作業を不要とし、以下4つの特長を備えています。

これにより業務で使用するデータの抽出効率を飛躍的に向上させます。

 

1. 生成AIの自然言語処理能力を活用し、文書全体の文字認識の結果から情報を特定。

データ化すべき項目名はプロンプトで指示され、生成AIは「請求金額合計」「合計金額」といった異なる項目名でも同じ意味をもつ値として抽出することが可能。

2. これまで国内では対応が難しかった英字の請求書や各種画像イメージなどの取扱いも可能。

3. 生成AIの力で、単純なテキスト抽出の他、簡単な計算や文章の要約も可能。

4. 複雑な複数のフォーマットに対し一つのプロンプトで対応できない場合、事前にプロンプト(1)でグループ分けを行い、別のプロンプト(2-1、2-2)でグループに合った指示を行うことが可能。

注:ポスト処理については、2024年度後半リリース予定

 

AI TextSifta フロー

 

■参考価格(一般的な請求書を用いた場合)

<日本語請求書の場合>

1ページ 20円~

<英字請求書の場合>

1ページ 30円~

 

注:

・特殊な帳票の場合は、サンプルイメージを数点お預かりし、検証後にお見積り

・本契約後のプロンプトのチューニングは有償

Copyright© Dtimes , 2024 All Rights Reserved.