前処理代行サービス”マエショリ”とは

  • 機械学習やデータ分析に必要なデータの前処理を代行・コンサルティング致します。
  • 機械学習エンジニアやデータ・サイエンティストの過重な作業負担を低減し、必要なデータをいつでも利用できるようにサポートします。
  • データの活用プロセスを含めたデータのLCC(ライフライクルコスト)の低減をゴールにして、人手とコードに依る前処理のベストミックスを追求します。

前処理の特徴

  • gitによるデータ管理・納品に対応

    • データの変更履歴の可視化による高い信頼性
    • クラウドワーカーによる作業では、自社開発のGit操作自動化ソフトウェア”PullReqMaker”を利用
  • CI技術を応用した自動validation技術の提供

    • データの以上検出を自動化
    • 常に正しい形式のデータであることを保証します。
  • エンジニアが扱いやすい形式での納品が可能

    • データサイエンティストや機械学習エンジニアの負担を軽減
    • json/sql他ほとんどの形式に対応します。
    • scp/sftp/git等の各種プロトコルに対応します。
  • 継続的なデータ収集・サポート体制

    • データ分析は業務改善のための息の長いの取り組みになります。
    • 一時納品後のタスク改善を見据えた運用を行います。

収集・修正対象データ

  • 自然文データ
  • 各種報告書やメディア記事
  • アンケート回答やMROCデータ(インフォーマル文体にも対応)
  • 日/英に対応します。
  • 表記ゆれ・形態素解析に対応します。
  • マーケティングデータ
  • 住所・電話番号
  • 価格・株価・財務データ
  • 小売・サービス商品の商品価格調査
  • 有価証券報告書/各種株価データの変換
  • 音声データ
  • 画像データ
  • IOTデータ


これまでの開発実績(各種公的研究費による学術研究を含む)

  • クラウドソーシングによる各種データ収集・訂正業務
  • マイクロタスキングに依る文書分類業務
  • 政策・マニフェスト文書の自動分類システム
  • 自動電話応答による政策支持率調査/マーケティングシステム開発
  • 社内研究所の論文・報告書データの関連性分析・可視化システムの構築
  • ソーシャルリスニングデータによる世論分析・コンテンツ生成
  • 政治資金収支報告書データベースの作成(http://rapportjapan.com/)
  • 政治家・選挙データベースの構築・大手サイトへの提供
  • 財務報告書のテキスト分析による株価予測システムの構築
  • 各種予測市場システムの開発・提供
  • マニフェスト検索・解析システムの構築