業務支援例:簡易OCR(文字認識ソフト)作成
約10年前、創業間もない頃です。「作業に追われてたまらない。何とかして欲しい」と相談を頂きました。
作業の全体構成は、
○ソフトA
ある関連の運用情報を印刷出力する。
運用情報の書式は調整できない(ソフト任せ)。
○ソフトB
ソフトAで書き出した運用情報を、別の書式で集計整理する。
というものでした。
何が大変かというと、ソフトAの出力が「紙」である事。ソフトBの入力にはエクセルシートを使えるのですが、今はソフトAの紙の内容をソフトBに手入力しているのです。
職員さん1人が毎日専属で作業しているけど、毎日残業しないと処理が追いつかないとの事でした。
さて、どうすれば良いか。
3つのソフトウェアを導入する事にしました。
○ソフト1
ソフトAには印刷に使用するプリンタを切り替える機能がありました。
そこで、「印刷内容を、画像ファイルとして書き込む」ソフトウェアを使いました。AdobeのAcrobatに似た機能を持つフリーソフトウェアです。
これで、少なくとも「人の目で、紙を読む」必要がなくなります。
○ソフト2
「人の目で、紙を読む」必要はなくなったのですが、今度は「人の目で、画像を読む」必要が出てきました。このままだと、ペーパーレスにはなるでしょうが、省力化にはつながっていません。
この種の課題の解決にはOCR「機械の目で、画像を読む」一択ですが、
・OCRの価格が高い
・OCRの使い方を覚えなければならない
・OCRを使って終わりではない(OCRの出力は、そのままソフトBへ持って行けない)
と。
そこで、ソフトAの出力画像からソフトBの処理に必要な情報だけを読み取るソフト2を作成しました。
○ソフト3
ソフト2の出力内容を読み込んで、ソフトBの入力に使えるエクセルシートを作成するものです。
ソフト2の中に組み込んでも良かったのですが、運用面での利点を考慮して別ソフトとしました。
結果的に、どうなったか。
ソフトAの出力として、ソフト1を使ってあるフォルダに数千個の画像ファイルが作られます。
ソフト3上のボタンを押すと、内部でソフト2が起動し、フォルダ内の全画像ファイルを読み取って情報を書き出します。
書き出した情報をソフト3が読み取って、ソフトBの入力に使用できるエクセルシートができあがります。
丸一日以上かかっていた作業が、20分弱で終わる様になりました。それも、人が貼り付いている必要がありません。職員さんはボタンを数回押すだけです。後は処理が終わるのを待つだけ。
このシステムは、若干の機能改良(ソフト3のみ)を加えながら、今も動いています。