Business social network with 4M professionals

齋藤 孝太
齋藤 孝太
齋藤 孝太

齋藤 孝太

東京理科大学 / 創域理工学部 情報計算科学科東京都

齋藤 孝太

東京理科大学 / 創域理工学部 情報計算科学科

継続は力なり

私は、大学で統計学やプログラミングを学ぶ中で、データを用いて課題を解決するデータサイエンスの魅力に惹かれました。現在はPythonやSQL、機械学習の基礎を独学で学びながら、実際のデータを用いた分析課題にも取り組んでいます。今後は、実務を通じてデータ分析力を高め、実社会に貢献できるデータサイエンティストを目指していきたいです!

Ambition

In the future

データサイエンスを通じて複雑な社会データを解析し、有益な示唆を導くことで、実社会にインパクトを与えるデータ活用を実現したい

東京理科大学4 years

創域理工学部 情報計算科学科

-

大学では統計学と基本的なプログラミングを学び、現在は因果推論の手法である「Double Machine Learning(DML)」を用いたCATE(条件付き平均処置効果)推定に関する研究を行っています。データから因果関係を見出し、より精度の高い推定を行うことに興味があります。

  • データ分析による企業への提案資料

    プロジェクト名 IBM社向け 離職率低減提案資料(データ分析・予測モデル活用) 概要 GCIの最終課題でIT業界における人材不足の背景を踏まえ、IBM社の人事データ(年齢、月収、残業時間、リモートワーク日数など)を分析し、離職率に影響を与える要因を特定しました。LightGBMモデルを用いて離職率を予測し、AUC 0.806という高精度な結果を達成。予測結果を基に、カウンセリング・待遇改善等の具体的施策を提案しました。 成果・効果 離職率上位10%かつ残業あり社員の残業削減により、離職率を15.6%→9.9%に改善可能 低所得層社員への給与改善により、離職率を15.6%→13.9%に改善可能 データドリブンな施策により、IT人材流出防止と採用コスト削減の効果を見込める 使用技術 Python(pandas, LightGBM, scikit-learn) データ可視化(特徴量重要度、傾向分析) 評価指標:AUC(0.806) 添付されているURLはこの提案資料のスライドです

    -
  • 画像判定の精度を検証

    プロジェクト名 自動運転のための道路交通標識判別システム(画像処理・機械学習プロジェクト) 概要 大学の授業の一環でチームでプロジェクトを実施しました。(私は主にCNNを担当しました)自動運転における交通標識認識精度の向上を目的に、画像処理、ディープラーニング、クラスタリング、特徴量ベース分類など複数の手法を実装・比較しました。環境変化(雨・霧・夜間・雪・強い光・レンズ汚れ・ブレ)を想定したデータ拡張を行い、現実環境での認識性能を向上させました。 成果・効果 CNN+転移学習(VGG16, ResNet50, EfficientNetB0)で精度を約9%向上(loss 0.84 → 0.64、ReLUが最も有効) Random Forestによる特徴量ベース分類で Accuracy 0.88、F1スコア 0.88 を達成 simCLRによる自己教師ありクラスタリングを検証し、ラベルなしデータ分類の可能性を確認 現実の悪条件下でも標識認識精度が維持されるモデル構築の知見を獲得 使用技術 Python(NumPy, pandas, scikit-learn, OpenCV, TensorFlow, PyTorch) 画像処理(データ拡張、サリエンシーマップ、Median Filter) 機械学習(Random Forest)・深層学習(CNN, 転移学習)・クラスタリング(simCLR, GMM) 添付されたURLは最終発表の際に使ったスライドです。

    -

グランビュッフェ2 years

キッチン

-

アルバイトとしてキッチンで食材の補充、調理などの作業をチーム全体で効率的に店を回していた。

Personal Achievements

Personal Achievements

Personal Achievements


Receive Scouts from companies