1
/
5
This page is intended for users in Japan(English). Go to the page for users in United States.

Wantedly RecSys 2020 参加レポート③ - Industrial Session

WantedlyのDataチームでデータサイエンティストとして働いてる関根です。先日、推薦システムに関するカンファレンスであるRecSys2020に参加させていただきました。

Wantedly RecSys 2020 参加レポート① - Wantedly Data チームで RecSys 2020 にオンライン参加しました | Wantedly Engineer Blog
こんにちは、ウォンテッドリーでデータサイエンティスト及びデータを活用したプロダクトのマネージャーを務めている松村です。2020年9月22日から9月26日にかけてオンラインで開催された RecSys 2020 に当社のデータサイエンティスト及び機械学習エンジニア5名で聴講参加及び、そのうちの3名が併設の RecSys Challenge の Workshop において口頭発表を行いました。その参加報告を行いたいと思います。 本記事では概要報告に留まりますが、明日からは参加メンバーが実際に発表を聴講して気にな
https://www.wantedly.com/companies/wantedly/post_articles/285471

RecSys2020では、推薦システムを研究するAcademyとIndustryの間でアイディアを交換し、課題について話し合い、解決策を共有する機会のために、Industrial Sessionという枠が設けられています。

The ACM Conference on Recommender Systems (RecSys 2020) is the premier venue for research and applications of recommendation technologies. One of our goals is to connect communities of researchers and practitioners from both academia and industry in order to exchange ideas, discuss problems, and share solutions.

(https://recsys.acm.org/recsys20/call/#content-tab-1-7-tab より引用)

Industrial Sessionの発表は全部で10本あり、その中から自分が気になったIKEA AppとAmazon Videoにおける推薦事例をご紹介します。

Balancing relevance and discovery to inspire customers in the IKEA App

一つ目はIKEAアプリにおける推薦事例で、これは3日目のReal-World Applications IIセッションで、IKEAのデータサイエンティストであるBalázs Tóthさんによる発表でした。

モチベーション

IKEAアプリでは商品のイメージを膨らませるためのInspiration Feedというものがあります。そこに表示されるのは、IKEAの商品とその商品の使用用途が想像できるような画像の一覧です。以下はInspiration Feedの画面です。

このInspiration Feedは新たに開発されたものなので、(1)データが揃ってないことと、(2)選択バイアスに左右されすぎないことの2点のために、よく使用されるCollaborative Filteringではなく、バンディットアルゴリズムの一つであるContextual Banditsという手法を用いています。

選択バイアスとは、モデルが推薦を行った結果からしか学習できないことで、似たような商品のみを推薦してしまい、まだ推薦したことがない商品が推薦されにくくなってしまうことです。

バンディットアルゴリズム

上記の問題を解決するためにバンディットアルゴリズムを用いています。バンディットは、限られた試行回数で最終的な報酬を最大化することを目的としています。選択バイアスにより、ユーザーが本来閲覧したいアイテムが推薦されなくなってしまった場合でも、そのアイテムが推薦された場合の報酬を考慮できるため、より探索的な推薦を行いやすくなります。

今回の場合でいうと、報酬は累計クリック数であり、それを最大にするためにInspiration Feedに表示する商品の画像を選択します。具体的には、ログとして観測できなかった商品のクリックのしやすさを、ユーザーのクリック履歴や実際に推薦した商品、実際にクリックした商品から統計的に推定しています。

Contextual Banditsとは、通常のバンディットに加えてユーザーの行動履歴や特徴を考慮して選択肢を決めることができる方法です。Contextual Banditsの説明は以下が分かりやすかったです。

A/Bテスト

また、実際にInspiration Feedの表示する商品について、Contextual BanditsとCollaborative Filteringの二種類のアルゴリズムで1週間程度のA/Bテストを行った結果、Contextual Banditsの方がCTRが20%上昇という結果になったそうです。

Exploration(探索)は良い推薦システムの要素の一つであり、IKEAアプリではA/Bテストより、Contextual BanditsによりCTRを向上させることができたと結論づけています。

Q&A

Collaborative Filteringはユーザーのフィードバックから似ている商品を推薦するため、Relevance(推薦する商品の関連性)が高くなるのに対し、Contextual Banditsでは似ている商品だけではなく、ユーザーにとって新たな発見となる商品も積極的に推薦しようとしています。そのため、Relevanceが下がっていることを懸念した質問がありました。それに対し、「特に悪い影響は見られなかった。」と回答していました。

また、今回目的関数にCTRを用いていたことについて、「CTRではなく、他の指標については改善しましたか?」という質問がありました。Relevanceを犠牲にしてExplorationを上げることで、本来ユーザーが見つけたいアイテムが推薦されなくなってしまい、それによりクリック数が増えてしまったのではないかと懸念していました。これに対し、「実際の売り上げについては確認できていない。CTRを増やすことでInspirationをわかせ、実際に店舗に行ったり、あとで購入することが考えられるが、これらの観測は難しい。」と回答していました。

まとめ・感想

今回のIKEAアプリでは、Contextual Banditsを推薦に用いることで、推薦のExplorationを向上させることを目的としていました。ExplorationとRelevanceはトレードオフの関係にあり、開発するサービスによりどこまでExplorationを行うかを決定する必要があると感じました。また、Q&Aにもあった通り、Explorationを求めることで目的のアイテムまでのクリックが多くなり、CTRが上がってしまうというNegativeな面も考慮する必要があり、推薦のExplorationの評価は難しいと感じました。

Reference

Balázs Tóth, Sandhya Sachidanandan, and Emil S. Jørgensen. 2020. Balancing Relevance and Discovery to Inspire Customers in the IKEA App. In Fourteenth ACM Conference on Recommender Systems (RecSys '20). Association for Computing Machinery, New York, NY, USA, 563. DOI:https://doi.org/10.1145/3383313.3411550

Behavior-based Popularity Ranking on Amazon Video

二つ目はAmazon Videoの推薦事例です。こちらは1日目のReal-World Applications IセッションでAmazonのLakshmi Ramachandranさんによる発表です。

モチベーション

Amazon VideoにはDiscoveryモードというものがあります。Discoveryモードとはユーザーが自分から見たいVideoを探しに行くためのページのことです。Video StreamingサービスではこのようなDiscoveryモードの需要が高く、AmazonVideoではSessionの約80%、Netflixでは約70%がDiscoveryモードによるものだといいます。

Discoveryモードでは、ユーザーは何が見たいか分からずにVideoを探索してるため、人気のある作品やトレンドの作品を表示する必要があります。従来は人気の作品をHeuristicで判定してあげていましたが、Amazon Videoではデータセットが巨大なため大変です。そこで、スケーラブルに推薦を行えるように、人気度(Popularity)を推定できるモデルを作成し、推薦に用いています。

アルゴリズム

Videoの人気を推定するために、「Popurality」の定義を以下のように定式化しています。

Popularityというのはユーザーのストリーミングが多いものであると仮定して、Videoがストリーミングされる確率( P(t) )配信されたときのストリーミング回数の期待値 ( E[s|t] ) の積として定義していました。つまり、よくストリーミングされるVideoほど、Popularityが高くなることを表しています。

今回はオンラインでの予測も考えて、推論時間のかかるDeep Neural Networkではなく、Tree Ensamble Modelを用いて、上記のストリーミングされる確率とストリーミングされる回数を予測するモデルを作成しています。特徴量には(1)ユーザーの行動履歴の集計結果 (2)Videoのメタデータ (3) Videoの新しさを用いています。(1)では動画がストリーミングされた総回数やストリーミングされた視聴時間の割合や、実際に購買された割合などが用いられています。

Cold Start問題

推薦システムはユーザーの行動履歴をもとに推薦するアイテムを決めることが多いのですが、新規ユーザーや新規アイテムに対してはログが存在していないため、推薦することが難しいという問題があります。これをCold Startと言います。

Amazon Videoでも、話題の最新映画やスポーツのライブ映像は新規アイテムのため、ログが少ないことが問題でしたが、特徴量にVideoの新しさを加えていたことで、新規アイテムでもストリーミングされやすく学習されていました。下のグラフを見ると、Videoがストリーミングされてから0〜100日のときにスコアがブーストしていることが分かります。

まとめ・感想

この発表では、Discoveryモードに表示するべきアイテムはどんな用件を満たす必要があるか考え、そこから人気度を定義し、Videoの人気度に影響を及ぼしそうな特徴量を見つけてモデルを作成するという一連の流れが実用的だと感じました。ユーザーのことを考えて推薦を行っている良い事例でした。

Reference

Lakshmi Ramachandran. 2020. Behavior-based Popularity Ranking on Amazon Video. In Fourteenth ACM Conference on Recommender Systems (RecSys '20). Association for Computing Machinery, New York, NY, USA, 564–565. DOI:https://doi.org/10.1145/3383313.3411555

https://vimeo.com/455639105

RecSys2020に参加してみて

自分自身RecSysに参加するのは今回が初めてとなります。今年はオンラインだったこともあり、例年とは異なる形での発表でしたが、スムーズに開催されていて参加しやすかったです。Industrial Session以外にもKeynote講演やTutorial Sessionなど様々なコンテンツが提供されていました。ぜひ来年も参加したいです。

RecSys2020を通して、良い推薦システムとは何かを考えさせられました。この経験を通して、Wantedlyでも本当の意味で「良い推薦システム」を開発していきたいと思います。

最後になりますが、Wantedlyではユーザーにとって良い推薦を行うために日々務めています。そのため、ユーザーファーストの推薦システムを開発したいというデータサイエンティスト・機械学習エンジニア・データエンジニアなどを探しています。もし少しでも興味がありましたら、下の募集からぜひ「話を聞きに行きたい」ボタンを押してください。まずは、カジュアルにお話ししましょう。

Data Scientist
ユーザにとって本当に良い推薦とは?を突き詰めたいデータサイエンティストへ
WantedlyはビジネスSNSとして、「であい/Discover」「つながり/Connect」「つながりを深める/Engage」の3つの体験を提供しています。 ■プロダクトについて Wantedlyは現在2つのプロダクトに力を入れています。 1つ目のWantedly Visitは、人と企業の出会いを生み出す「会社訪問アプリ」です。 共感や働く仲間を軸に、ココロオドル仕事との出会いを創出します。現在約34,000社以上の企業様に使っていただいており、IT業界のみならず、メーカーや不動産といった業種の企業様にも導入頂いています。 2つ目のWantedly Peopleは、名刺管理をきっかけとし、人と人のつながりを将来持続的に使える資産へと変える「つながり管理アプリ」です。2016年に立ち上がった新規事業ですが、読み込んだ名刺の枚数は1億枚を超え、今後さらにつながりを深める体験を提供していきます。 ■今後の展開 目標は全世界1000万人のユーザーにWantedlyを使っていただくこと。 そのため海外展開にも積極的に取り組んでおり、シンガポール、香港に拠点を構えています。
Wantedly, Inc.
Wantedly, Inc.'s job postings
18 Likes
18 Likes

Weekly ranking

Show other rankings