業務支援例:簡易OCR(文字認識ソフト)作成

 約10年前、創業間もない頃です。「作業に追われてたまらない。何とかして欲しい」と相談を頂きました。

 作業の全体構成は、
○ソフトA
 ある関連の運用情報を印刷出力する。
 運用情報の書式は調整できない(ソフト任せ)。
○ソフトB
 ソフトAで書き出した運用情報を、別の書式で集計整理する。
というものでした。

 何が大変かというと、ソフトAの出力が「紙」である事。ソフトBの入力にはエクセルシートを使えるのですが、今はソフトAの紙の内容をソフトBに手入力しているのです。
 職員さん1人が毎日専属で作業しているけど、毎日残業しないと処理が追いつかないとの事でした。

 さて、どうすれば良いか。
 3つのソフトウェアを導入する事にしました。

○ソフト1
 ソフトAには印刷に使用するプリンタを切り替える機能がありました。
 そこで、「印刷内容を、画像ファイルとして書き込む」ソフトウェアを使いました。AdobeのAcrobatに似た機能を持つフリーソフトウェアです。
 これで、少なくとも「人の目で、紙を読む」必要がなくなります。

○ソフト2
 「人の目で、紙を読む」必要はなくなったのですが、今度は「人の目で、画像を読む」必要が出てきました。このままだと、ペーパーレスにはなるでしょうが、省力化にはつながっていません。
 この種の課題の解決にはOCR「機械の目で、画像を読む」一択ですが、
・OCRの価格が高い
・OCRの使い方を覚えなければならない
・OCRを使って終わりではない(OCRの出力は、そのままソフトBへ持って行けない)
と。

 そこで、ソフトAの出力画像からソフトBの処理に必要な情報だけを読み取るソフト2を作成しました。

○ソフト3
 ソフト2の出力内容を読み込んで、ソフトBの入力に使えるエクセルシートを作成するものです。
 ソフト2の中に組み込んでも良かったのですが、運用面での利点を考慮して別ソフトとしました。

 結果的に、どうなったか。
 ソフトAの出力として、ソフト1を使ってあるフォルダに数千個の画像ファイルが作られます。
 ソフト3上のボタンを押すと、内部でソフト2が起動し、フォルダ内の全画像ファイルを読み取って情報を書き出します。
 書き出した情報をソフト3が読み取って、ソフトBの入力に使用できるエクセルシートができあがります。
 丸一日以上かかっていた作業が、20分弱で終わる様になりました。それも、人が貼り付いている必要がありません。職員さんはボタンを数回押すだけです。後は処理が終わるのを待つだけ。

 このシステムは、若干の機能改良(ソフト3のみ)を加えながら、今も動いています。