Discover companies you will love
You'll be able to see their introduction and other information once they have accepted your connection request.
大学院の研究テーマ:日本の賃金制度は労働生産性と乖離しているかどうか 機器学習の練習項目の一:クレジットカード不正検出
プロジェクト概要:クレジットカードのトランザクションデータに基づいて分類モデルを構築し、トランザクションが異常、あるいは正常であることを予測します。 プロジェクトの技術点と流れ: 1.この項目では、データを観察したことにより、サンプルが不均衡であるという問題を発見し、それによりオーバーサンプリング(Over-Sampling)とダウンサンプリング(Under-Sampling)の2つの方案を提案し、二つのモデリング比較の結果を行って、より良いモデルを選ぶ。 2.モデリングの前に、データの標準化(Standardization)、欠落値充填(Fill Nan)など、データに対して様々な前処理を行った。 3.モデル化する前に、このモデルの評価方法としてリコール率(Recall Score)を使った。 4.適切なアルゴリズムを選択した。ここではロジスティック回帰(LogisticRegression)モデルを使用した。 5.クロスリファレンス(Cross Validation)によりモデルをパラメータ調整し、最適なモデルを見つけた。
⒈研究テーマ紹介:日本で、急速な高齢化と人口減少が進みつつあるが、今後の日本の潜在成長を考える上で、労働生産性に与える影響をどうのように評価するか? ⒉ディザインモデル: log(y(t)) = C + α1*exp + α2*exp_square + α3*edu + α4*log(ME(t)) + α5*log(CKB(t)) + α6*Full + u y: 実質産出 exp:勤続年数 exp_square:勤続年数2乗 edu:教育年数 ME(t):実際中間投⼊(t年での条件) CKB(t):資本サービス投⼊指数 * 実質資本ストック指数(t年での条件) Full:总劳动时间 ⒊研究時使う技術: 1.numpy、pandasを使い、データを洗浄し、計算する 2.Statsmodelの多元線形回帰モデルを導入して回帰分析を行う。 3.matplotlibによるデータの可視化。 注:この項目のコード、GitHubの制造业というファイルに入った。研究はまた終わらないので、コードの部分は完成品ではない。
ロボットについて