ロシア人、トルコ人、Finance勤務、開発会社、建築家、外資系、大学生の方々含め、グループワークでテキストデータの解析に挑戦しました。
トピック:
Kaggle Kernelの写経は初心者に良い!
CounterVectorizer => Naive Bayesで迷惑メール分類
分かち書き
頻出度分析
Word2Vec
FastText
線形回帰
XGBoost
特徴エンジニアリング
挑戦したデータ:
World News on Reddit
掲示板上のニュースデータ解析
https://www.kaggle.com/rootuser/worldnews-on-reddit
South Park Dialogue
アニメ作品台本のセリフデータから話者を特定
https://www.kaggle.com/tovarischsukhov/southparklines
Deep NLP
Chatbotと履歴書データの解析
https://www.kaggle.com/samdeeplearning/deepnlp
Python Questions from StackOverFlow
プログラミングQ&AサイトのPythonに関する質問分析
https://www.kaggle.com/stackoverflow/pythonquestions
Japanese English Bilingual Corpus(日本語と英語のWikipediaコーパス)
https://www.kaggle.com/tea…/japaneseenglish-bilingual-corpus
Team AIでは毎日勉強会を開催しています。開催日と詳細は下記よりご確認頂けます。
お気軽に遊びにいらしてください!!
https://teamai.connpass.com/
#100万人の機械学習コミュニティを東京に創る
#AIエンジニアに世界一愛される組織になる
#DataHackathonEverday
#OpenInnovation