Doorkeeper

(場所変更/注意) データ前処理研究会

2018-09-17(月)19:00 - 21:00 JST

アクアミーティングスペース渋谷

東京都渋谷区道玄坂1-22-12 和孝渋谷ビル10F

詳細

こんにちは! Team AI代表 石井大輔です。

弊社でもAIを構築していますが、データの前処理は地味ながら、分析の精度を左右するとても大事な領域ですよね?でも、体系だって手法をまとめてあるサイトや書籍は非常に少ないです。 我々はこの問題をコミュニティの集合知で解決しようとしています。

もくもく会・ディスカッション形式で前処理に関する研究会を進めていき、 体系的な部分はどんどんQiita等の記事としてアウトプットすることで、 実際のデータ分析フィールドで活躍されようとしている方々の支援をしようと思っております。

データ前処理の代表的手法

  • データクリーニング
    これはデータ前処理で実装される最初のステップです。このステップでは、主な焦点は、欠落データ、ノイズの多いデータ、検出、および外れ値の除去、データ内の重複および計算バイアスの最小化の処理です。

  • データ統合
    このプロセスは、さまざまなデータソースからデータを収集し、データを結合して一貫性のあるデータを形成する場合に使用されます。データクリーニングを実行した後のこの一貫したデータは、分析に使用されます。

  • データ変換
    このステップは、モデルの必要に応じて生データを指定されたフォーマットに変換するために使用されます。データの変換に使用されるオプションは次のとおりです。

  • 正規化
    この方法では、データのスケーリングを実行できるように数値データを指定された範囲、つまり0と1の間に変換します。

  • 集約
    コンセプトは単語そのものから派生することができます。この方法は、フィーチャを1つにまとめるために使用されます。例えば、2つのカテゴリーを組み合わせて新しいカテゴリーを形成することができる。

  • 一般化
    この場合、下位レベルの属性は上位レベルに変換されます。

  • データ削減
    データ複製の変換とスケーリング、すなわちデータ内の冗長性が除去され、データを効率的に整理した後。

Team AI の勉強会のご紹介

この勉強会は外国人・日本人交え、技術情報を交換する刺激ある場にしたいと思っております。
オープンデータ、API、ライブラリ、ツール、論文、コンペ等、どんどん情報交換して、業界を一緒に発展させましょう!

“勉強会を開いて、学習者同士情報交換する" 手法を取っていますので、カジュアルにお越しください。

社会人も学生も、みんなで集まってAIを自習しましょう!
教材を持ち込んでもくもく勉強してもいいし、皆と話して情報交換していただいてもいいです。

 データ前処理に関するブログ記事

「前処理」のフォーマット共通化やOSS化はできないんだろうか
http://tjo.hatenablog.com/entry/2013/12/17/201529

WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
https://www.slideshare.net/hajimesasaki1/wi2-55598897

Pythonで機械学習はじめました データ前処理編
https://qiita.com/yuuki_1204_/items/c26cb09fba8aad35dc0a

自然言語処理における前処理の種類とその威力
https://qiita.com/Hironsan/items/2466fe0f344115aff177

長岡技術科学大学 自然言語処理チーム
https://www.youtube.com/watch?v=I02cX-uZtzM

Contact

質問がある方や、迷子になったという方は、
dai@jenio.co もしくは TEL: 080-6306-2223 にご連絡ください。

場所について

アクアミーティングスペース渋谷
〒150-0043 東京都渋谷区道玄坂1-22-12 (和孝渋谷ビル 10F)
(当会場は10Fです。8Fから階段でお上がりください。)

■■渋谷駅直通「渋谷マークシティ」を通って来られる場合■■
渋谷駅ビル「渋谷マークシティ」4F道玄坂出口から徒歩1分

■■渋谷駅ハチ公口から来られる場合■■
渋谷ハチ公前からSHIBUYA109を左(TOHOシネマズ渋谷側)

道玄坂上交番前の交差点から1分程の場所です。

道順写真は[こちらから]
https://ams-shibuya.tokyo/access.html

TEL: 080-6306-2223

1-22-12 Wakou Shibuya Building 10F, Dogenzaka Shibuya-ku Tokyo JAPAN zip150-0043

=====================================================

主催情報 :

100万人の機械学習コミュニティを東京に創る Team AI

http://www.team-ai.com/

AI・機械学習に特化した人材エージェントTeam AI Career

http://career.team-ai.com/ai-agent

代表 : 石井 大輔

経歴;

https://www.ishiid.com

http://www.jenio.co/

株式会社ジェニオ代表取締役 1975年岡山県生まれ。

京都大学で数学を専攻。伊藤忠商事でファッションの知的財産を使用した事業開発を担当。 ロンドン、ミラノでの駐在を経て、2011年ジェニオを創業。 ファッション通販BUYMAの海外事業開発を受注。 2015年、シリコンバレーの起業家育成組織OneTractionの指導のもと米国で事業推進。 2016年、人工知能開発案件に特化したクラウドソーシングサービスTeam AIを立ち上げる。
10/17翔泳社より"機械学習エンジニアになりたい人への本"発売します!
https://amzn.to/2MSWSqV

=====================================================

コミュニティについて

Team AI

Team AI

引っ越しました。お手数ですが、今後の勉強会のお申込みはMeetup/Connpassからお願い致します。 ・Meetup:https://www.meetup.com/ja-JP/ ・Connpass:https://connpass.com/ (English Follows) 人工知能、機械学習、ディープラーニングに興味ある方の研究会グループです。 最新の技術を情報共有して学び、...

メンバーになる