2020/06/15

研究開発した手書き認識 AI-OCR SmartOCRは2019年ベトナムソフトウエア協会(VINASA)最高レベルのサオクエ賞・プロダクト部門トップ10に入賞しました

企業向けの時間の節約、人件費の削減、作業効率の向上は、人工知能(AI)を活用したSmartOCR手書き認識アプリケーションを研究・開発する際にGMO-Z.com RUNSYSTEMが目指したものです。

市場需要からSmartOCR手書き認識ソリューションへ

SmartOCRは、文書、画像などから印刷文字、手書き文字を認識、抽出し、ベトナム語および日本語に対応するソフトウェアです。人工知能(AI)に基づいて、SmartOCRの光学文字認識(Optical Character Recognition‐OCR)技術は画像ファイル(スキャナ、カメラ、画像PDFファイルなどの出力画像)上の文字情報を編集可能な文書( テキストファイル、Wordファイルなど)に変換できます。

現時点では、同様の仕組みの製品はベトナム市場に存在しません。            銀行、保険、行政、などの業界では、紙の書類の使用と個人文書による本人認証に対する需要が高いことを確認し、当社はAI技術を研究してSmartOCRソリューションを開発することを決定しました。

SmartOCRは、2019年サオクエ賞の優れた製品・サービスのトップ10に選ばれました。

2019年4月21日に2019年サオクエ賞の授与式で、SmartOCRアプリケーションは、94のIT製品・サービスの内、優れた製品・サービスのトップ10に選ばれました。トップ10のタイトルは、市場規模、技術、優位性、社会化、適用性、及び第四次産業革命の開拓などの基準に基づいて検討されています。SmartOCRは、Viettel、FPT、BIDVなど、長年連続で受賞している会社と2019年サンクエのトップ10で表彰されたことを誇りに思っています。

SmartOCRの成功は、プロジェクトチームの団結と努力に満ちた日々があったからに他なりません。

SmartOCRの成功は、プロジェクトチームの努力に満ちた日々があったからに他なりません。テクノロジー製品の構築は単純ではありません。特に人工知能(AI)を使用するプロジェクトではさらに難しいものです。人間が学校に行く必要があるのと同じように、人工知能はデータでトレーニングされる必要があります。AIプロジェクトを構築する方法はたくさんありますが、それぞれの方法には長所と短所があります。トレーニングデータがまだ多くない場合は、従来のルールとアルゴリズムを使用して古い方法を選択せざるを得ないため、効率が低下します。逆もまた同様です。プロジェクトの初期には、チームが持っていたトレーニングデータの量はゼロでした。そのため、チームはデータを収集するために、グーグルでの検索、データの購入、トレーニング用のダミーデータの作成など、あらゆる方法で検索しました。ただし、上記の全方法で行っても、データ量はまだ少なすぎるため、チームは会社の従業員にトレーニングサンプルデータとして日本語とベトナム語を手で書くように頼みましたが、 対応できた人数は巨大な文字セットに比べて非常に少なかったです。そのため、チームは必要なデータがより少なく、不足していたデータを補えるソリューションを選択し、同時に、今日の高精度をもたらすためにさまざまな条件によってテキストを記述する画像処理アルゴリズムで多くの複製を作成しました。チームは顧客のテスト期日が近づいていますが、商品の精度がまだ期待どおりではない時に極端な不安の時期を過ごしました。真夜中まで仕事をして、ただ顧客に最も満足のいく結果をもたらしたいことを望んでいました。幸いなことに、お客様のデータを使ってテストしたところ、サンプルデータでテストした結果よりもはるかに良い結果が出てほっとしました。

現時点で、SmartOCRは徐々に改善され、品質が向上し、メディアだけでなく顧客によって熱狂的に受け入れられています。SmartOCR及びそのメンバーが将来が、より目覚しく成長するよう希望します。