前処理代行サービス”マエショリ”とは
- 機械学習やデータ分析に必要なデータの前処理を代行・コンサルティング致します。
- 機械学習エンジニアやデータ・サイエンティストの過重な作業負担を低減し、必要なデータをいつでも利用できるようにサポートします。
- データの活用プロセスを含めたデータのLCC(ライフライクルコスト)の低減をゴールにして、人手とコードに依る前処理のベストミックスを追求します。

前処理の特徴
-
gitによるデータ管理・納品に対応
- データの変更履歴の可視化による高い信頼性
- クラウドワーカーによる作業では、自社開発のGit操作自動化ソフトウェア”PullReqMaker”を利用
-
CI技術を応用した自動validation技術の提供
- データの以上検出を自動化
- 常に正しい形式のデータであることを保証します。
-
エンジニアが扱いやすい形式での納品が可能
- データサイエンティストや機械学習エンジニアの負担を軽減
- json/sql他ほとんどの形式に対応します。
- scp/sftp/git等の各種プロトコルに対応します。
-
継続的なデータ収集・サポート体制
- データ分析は業務改善のための息の長いの取り組みになります。
- 一時納品後のタスク改善を見据えた運用を行います。

収集・修正対象データ
- 自然文データ
- 各種報告書やメディア記事
- アンケート回答やMROCデータ(インフォーマル文体にも対応)
- 日/英に対応します。
- 表記ゆれ・形態素解析に対応します。
- マーケティングデータ
- 住所・電話番号
- 価格・株価・財務データ
- 小売・サービス商品の商品価格調査
- 有価証券報告書/各種株価データの変換
- 音声データ
- 画像データ
- IOTデータ
これまでの開発実績(各種公的研究費による学術研究を含む)
- クラウドソーシングによる各種データ収集・訂正業務
- マイクロタスキングに依る文書分類業務
- 政策・マニフェスト文書の自動分類システム
- 自動電話応答による政策支持率調査/マーケティングシステム開発
- 社内研究所の論文・報告書データの関連性分析・可視化システムの構築
- ソーシャルリスニングデータによる世論分析・コンテンツ生成
- 政治資金収支報告書データベースの作成(http://rapportjapan.com/)
- 政治家・選挙データベースの構築・大手サイトへの提供
- 財務報告書のテキスト分析による株価予測システムの構築
- 各種予測市場システムの開発・提供
- マニフェスト検索・解析システムの構築
