手書き文字認識アプリケーション「SmartOCR」:アイデアから2019年サオクエ賞TOP10へのブレイクスルーへ。

Share in
12-06-2019

時間を節約し、人件費を削減し、業務効率を向上させる… それが、GMO-Z.com RUNSYSTEMが研究開発・構築するSmartOCR ― 手書き文字認識をAI(人工知能)技術で実現するソリューション ― を通じて企業に提供したい価値です。

SmartOCRは、手書き文字を認識し、画像文字からデータを抽出してベトナム語や日本語のテキストに変換するソフトウェアです。AI技術を基盤とした光学式文字認識(Optical Character Recognition - OCR)により、スキャナーやカメラ、画像形式のPDFなどから出力された画像文書を、編集可能なファイル(テキストファイル、Wordファイルなど)に変換することができます。

現時点では、ベトナム市場において同様の仕組みで稼働する製品は存在していません。銀行、保険、行政機関など、大量の紙文書を扱う伝統的な業界において、本人確認のために個人書類を使用する需要が非常に高いことを踏まえ、当社はAI技術を活用したSmartOCRの研究開発に取り組むことを決定しました。

嬉しいニュースとして、2019年4月21日に開催された「サオクエ賞2019」の表彰式において、当社のSmartOCRは94のIT製品・サービスの中からトップ10優秀製品・サービスに選出されました。トップ10の選定は、市場規模、技術力、優位性、社会性、実用性、そして第4次産業革命における先駆性といった基準に基づいて行われました。SmartOCRは、Viettel、FPT、BIDVといった長年受賞している有名企業と肩を並べ、2019年サオクエ賞トップ10に輝いたことを誇りに思います。 

SmartOCRが2019年サオクエ賞トップ10に選出
SmartOCRが2019年サオクエ賞トップ10に選出

SmartOCRの成功は、決して容易に得られたものではありません。これはプロジェクトチーム全体が積み重ねた努力と試行錯誤の結果です。通常の製品開発ですら容易ではありませんが、AI技術を用いたプロジェクトではなおさら困難を極めました。

人間に学習が必要であるように、人工知能にもデータによる訓練が必要です。AIプロジェクトの構築には様々な方法がありますが、それぞれに長所と短所があります。学習データが少ない場合、従来のルールやアルゴリズムに頼らざるを得ず、その効率性も低下します。当時、チームが持っていた学習データはゼロでした。

データを集めるために、Google検索、データ購入、疑似データの作成など、あらゆる手段を試みました。しかし、それでも十分ではなかったため、社内のRunnerの仲間たちに協力を仰ぎ、日本語やベトナム語の手書きサンプルを提供してもらいました。ただし、必要とされる膨大な文字数に比べ、収集できたデータはわずかでした。そのため、少量のデータで精度を補う方法を選び、画像処理アルゴリズムを用いて多様な条件下での文字をシミュレーションし、現在のような高精度を実現しました。

顧客向けの試験期限が迫る中、精度が期待通りに出ず、チームは焦り、深夜まで作業を続けました。幸運なことに、日本の顧客が試験用サンプルを持ち込んだ際、結果は予想以上に良好で、全員が胸をなでおろしました。

プレッシャーもありましたが、喜びや思い出も数え切れません。立ち上げ当初のメンバーは少人数でしたが、とても結束力が強かったのです。AIチームのダオ・バオ・リン氏はこう語ります: 「当初、グループには私とグエン・タイン・ドーさんの2人しかいませんでした。ある時、プロジェクトの要件とホーチミン支社でのAI人材拡大のために私が出張を命じられ、ミン副社長から“AIチームの将来に期待している”という言葉を託されました。その間、同僚は一人で作業をし、同僚たちに“寂しい、早く戻ってきてほしい”と話していたそうです。今でもその話を冗談交じりに語り合っています。」

SmartOCR開発チーム

現在、SmartOCRは着実に完成度を高め、その品質を証明しつつあります。メディアや顧客からも高く評価され、今後さらに大きく発展していくことが期待されています。SmartOCRとチームのさらなる飛躍を願っています。  

Previous Post

Company trip Summer 2019: Hè là phải HIGH

Next Post

Tết thiếu nhi, vui mê ly: 1/6 rộn ràng cùng các Runner nhí