東京理科大学 / 経営学部経営学科
自然言語処理による拡散力のあるニュース判別
卒業論文の研究テーマです。TwitterAPIを用いて特定ニュースアカウントの拡散されたツイートと拡散されないツイートを取得し、前処理などの微調整なども加えながら判別器の精度を高めています。現在はまだ前処理や拡散の定義が甘く、またTF-IDF, word2vecとcosine類似度、ロジスティック回帰, SVM, などだけで分析しているため、Leave-one-out交差検証において、100回平均の精度61%といまだ低く改善方法として、前処理、意味解析でのベクトル化フェーズ、判別分析アルゴリズムなどの向上を考えています。 また、2018年にGoogleで発表されたBERTの利用も視野に入れています。