ベトナムでのオフショア開発 | GMO-Z.com RUNSYSTEM

AIや機械学習は今では最も重要な技術であり、研究開発の中心になっています。
その実情で、AI開発の先頭に立っている弊社は機械学習用のデータセットを作成するサービスを提供し始めました。

教師データの作成の難題

手間

高品質なデータセットを作成するには、データの量産が必要である。したがって、大きい人力と精密な生産管理が不可欠である。

費用

大量だけでなく、データの多様性も手配しないといけない。そのため、膨大な費用がかかります。

ノウハウ

効率のいい識別ルールが必要なのにノウハウがない。

管理

大きいチームで作業するため、効率な生産管理・品質検査が課題となる。

GMO-Z.COM RUNSYSTEMがその課題を解決します

  • ITアウトソーシングにおける10年以上の実績により、優秀な人材を集まっています. 日本語プロジェクトのある大学と深く連携して、採用を行っている
  • 自社開発した品質の検査ツール (検証システム)により、バグなしのデータセットを可能に。
  • 低コストで質の高いデータセットを提供する。日本と同等な品質が3-5割のコストを節約できる。
  • 品質・時間・コストのバランスがいいデータセット作成用のツールを提案する。
    AI開発の経験を活かし、より質的にも、量的にも対応できます。
  • 常にセキュリティシステムを確保する(ISO27001を取得済み)
  • 標準した生産プロセスで必ず決まる期限までに、作業を完成する。

エントリシステム作成
入稿方法、納品方法、タイミング確定
対象データ分析し、エントリシステム作成(既存システムからカスタマイズ)
入力支援機能のカスタマイズ

改善活動
改善点を洗い出し、PDCAをまわす
入力システムの改善(効率化向上)

BPO開始
少ないボリュームからスタートし、徐々に増やしていく

教育
マニュアル作成
事前教育
テストデータで実施しながら効率のよい方法を教える。
テストデータの結果をチェックし、分析する
OJT教育
入力ポイント作成、チェックリスト作成、チェックフロー確立

利用事例

画像アノテーション
1.概要
ドライブレコーダーからの画像のアノテーション
画像は昼間、夜、雨、雪、都会、郊外など様々な種類
2.件数と期間
3400枚で1.5ヶ月程度
体制:ピーク時30人(作業者+チェッカー)

手書きデータのラベル付け
1.概要
手書きのデータのラベノレ付け
氏名、住所、電話番号など
2.件数と期間
毎月10万字前後(主に漢字、ひらがな、カタカナ)
体制:ピーク時10人(作業者+チェッカー)

Contact Us

contact us