【感性AI】テックブログ vol.2　-「キャッチコピー感性評価」を行うBERTの多次元回帰モデル構築-

感性AIでエンジニアをしている本村です。

本村駿乃介のプロフィール - Wantedly

https://www.wantedly.com/id/shnmtmr

弊社の「感性AIアナリティクス」というツールでは「キャッチコピー感性評価」という機能があり、キャッチコピーに対して定量的に印象評価を行うことが可能になっております。

このキャッチコピーからの定量的な印象評価を実現するために用いられているのが、BERT(Bidirectional Encoder Representations from Transformers)という言語モデルになっています。

この記事ではBERTによるキャッチコピーの印象評価の予測を目的とした、Pythonによる学習モデルの実装について、実際に弊社が独自に収集しているアンケートデータの一部を用いて説明していきます。

なお、実際のサービス上では、この記事で作成したモデルが動作しているわけではなく、別途調整されたモデルが動作しております。

感性AIアナリティクス | 感性AI株式会社

AIが商品の感性価値分析をサポート。消費者データを学習したAIが1分でネーミング、キャッチコピー、パッケージデザインを評価。学術的にも認められた確かな精度です。

https://www.kansei-ai.com/marketingsolution-analytics

印象評価尺度の予測について

「感性AIアナリティクス」では印象評価尺度として43個の尺度を使用しています（例：「明るい - 暗い」「冷たい - 温かい」など）。キャッチコピーを入力するとそれらの43尺度についての印象評価値を予測するモデルが必要です。そのため、今回使用するモデルのタイプとしては多次元の回帰モデルということになります。

学習データ

弊社が開発したアンケート収集ツールにより収集した、キャッチコピーに対する印象評価値を答えてもらうアンケート、単語に対する印象評価値を答えてもらうアンケートの2種類のデータを用います。今回は、キャッチコピー50個に対して111名、単語100個に対して294名の回答を参考に説明していきます。データは継続的に収集していっているので、今回はその一部でのご紹介です。

キャッチコピーに対する印象評価値を答えてもらうアンケートのデータの一部

単語に対する印象評価値を答えてもらうアンケートのデータの一部

（一部の）尺度ごとの分布を可視化すると以下のようになります。

多次元の尺度を一度に学習するにあたり尺度ごとに分散が異なっていると、分散の大きな尺度におけるロスに大きく学習が左右されるという懸念点があります。そのため、すべての尺度の分散が1になるように調整し、その値を学習することにします。

これをキャッチコピーと単語のアンケートの両方で行うことで、機械学習の入力となるキャッチコピー・単語のテキストと、出力となる感性尺度のベクトルが出来上がります。

今回はキャッチコピーを予測するモデルを作るため、キャッチコピーのデータのうち一部をテストデータとして用い、それ以外のキャッチコピーと単語のデータを訓練データとして割り当てます。

BERTのファインチューニング

大規模データによる事前学習済みモデルを、手持ちのデータで分類器・予測器として学習させることをファインチューニングと呼びます。BERTを用いた学習モデル構築の一般的な手法になります。

Hugging Face社のtransformerというライブラリ（執筆時のバージョンは4.25.1）を使用します。BertForSequenceClassificationというクラスを利用することで、分類や回帰のためのファインチューニングが簡単に実装できるようになっています。

今回は43尺度の回帰予測であるため、以下のようにモデルを初期化して使用します。

なお、BERTの学習済みモデルとしてcl-tohoku/bert-base-japanese-whole-word-maskingを使用しています。

from transformers import BertForSequenceClassification
model = BertForSequenceClassification.from_pretrained(
　"cl-tohoku/bert-base-japanese-whole-word-masking",
　num_labels=43,
　problem_type="regression"
)

学習は以下のようにTrainerとTrainingArgumentsを利用すると簡潔に書くことができます。

from transformers import Trainer, TrainingArguments
from transformers import EarlyStoppingCallback
training_args = TrainingArguments(
　output_dir=output_dir,
　num_train_epochs=epochs,
　learning_rate=lr,
　per_device_train_batch_size=batch_size,
　per_device_eval_batch_size=batch_size,
　save_total_limit=1,
　load_best_model_at_end=True,
　metric_for_best_model=metric,
　greater_is_better=False,
　save_strategy="epoch",
　evaluation_strategy="epoch",
　logging_strategy="epoch",
)

trainer = Trainer(
　model=model,
　args=training_args,
　train_dataset=train_dataset, # torch.utils.data.Datasetオブジェクト
　eval_dataset=val_dataset, # torch.utils.data.Datasetオブジェクト
　compute_metrics=compute_metrics,
　callbacks=[EarlyStoppingCallback(early_stopping_patience=early_stopping_patience)]
)

Trainerオブジェクトを用意すれば、

trainer.train()

で、学習が始まります。

検証データのロスが下がらなくなったところで学習をストップ（Early Stopping）。

このモデルの予測性能を確かめるために、テストデータ全体を予測した際の正解の値と予測の値の相関係数を計算します。

今回は相関係数が0.67ということになりました。

最後にテストデータ1件だけを取り出して、そのキャッチコピーを入力した時のモデルの予測と、アンケートにおける印象評価の結果の違いを尺度ごとに可視化してみます。

このようにして新たなキャッチコピーに対しても自動で印象評価が可能なモデルが構築できました。

おわりに

以上、BERTを用いた「キャッチコピー感性評価」モデルの構築の取り組みを紹介いたしました。

実際のサービス上では性年代別に異なる評価や、キャッチコピーに関連した連想語マップを表示、評価結果のレポート生成などの機能もご利用いただけます。

感性ＡＩ株式会社's job postings

AI／バックエンド・インフラ

【感性AI】テックブログ vol.2　-「キャッチコピー感性評価」を行うBERTの多次元回帰モデル構築-

Shunnosuke Motomura

感性ＡＩ株式会社 / Web engineer

開発サービス機械学習エンジニアベンチャー

7 Likes

感性ＡＩ株式会社

私たち感性AI株式会社は、人の「感性」を可視化・定量化するAIをマーケティング支援など様々なビジネスシーンに活用する、大学発ベンチャーです。 ≪Technology≫ 国立大学電気通信大学で長年培った、言葉と五感・感性との関係性に着目した応用範囲の広い特許技術・知財、心理・分析データ、ノウハウに、深層学習（ディープラーニング）、機械学習などのAI関連技術を融合させ、さまざまな課題・ニーズに合わせた最適なソリューションを提供します。 https://www.kansei-ai.com/technologies ≪主な事業内容≫ ◆コンサルティング事業　感性評価AI“Hapina”など、「人が言葉で表す情報（感性的な表現）や認知特性」に関する特許技術・知財・ノウハウを駆使し、お客様の課題解決のためのプロジェクト編成、調査・実験のコーディネート・実施、ソリューションの提供までトータルでサポートしています。 ◆サービス・プロバイダ事業　コンサルティング事業で培ったプログラム、ノウハウを汎用化することでSaaSのプロバイダ事業も展開してまいります。【ものづくり】プロダクト・サービスの感性価値を科学し、コスト削減や付加価値創造を行います。 ●感性AIアナリティクス https://www.kansei-ai.com/marketingsolution-analytics ★総務省後援『ASPIC IoT・AI・クラウドアワード 2021』にてAI 部門ニュービジネスモデル賞受賞★ 商品開発に大切な3つの要素であるネーミング、訴求のためのキャッチコピー、パッケージデザインの印象に関して、感性価値に特化し分析のサポートを行います。感性を可視化する独自のAI関連技術によりネーミング、キャッチコピー、パッケージデザインの感性評価を行い、マーケティングにおける感性価値の創造を実現します。 ●感性マテリアルプラットフォームβ版 https://prtimes.jp/main/html/rd/p/000000896.000022856.html 大手素材メーカーであるDIC社と協業し、ブランドオーナーと素材メーカーをマッチングするクラウドサービスのβ版をリリースしています。ブランドオーナーが感性を基軸に商品を構成する素材を探索することが可能で、完成品の感性価値向上に寄与します。【ウェルネス】場の雰囲気や人々の意図・状態を科学し、快適で幸せな暮らしを実現します https://www.kansei-ai.com/technologies-%E3%82%A6%E3%82%A7%E3%83%AB%E3%83%8D%E3%82%B9 ●雰囲気を科学し快適性・生産性を向上させる技術・空気感分析・空間の統合制御 ●人々の状態を可視化共感し寄り添う技術・意図の可視化（痛みの印象可視化/会話分析）・状態の可視化（パーソナリティ把握/認知症の簡易診断） ≪私たちならではのユニークな特徵・今後の展望≫ 「感性とAIの融合でHAPINESSを実感できる社会に」 AIが人と共存する未来に向けて、現在のAIに最も欠けていることは何でしょうか。 AIは問題を高速かつ正確に解くことなどに長けていますが、人間社会では主観的な「感性」が絡んでおり、より複雑です。感性とは「感覚の知性」であり、感情とは違い「知能」の一つと言えます。AIが「感性」という知能を理解することにより人に寄り添い分かり合うことができます。私たち感性AIは、人のうちに秘めた感覚を理解し、表現をサポートしてくれるAIを創ることによって、感性活用のプラットフォーマーになることを目指してまいります。感性は目に見えにくいものですが、それを可視化し、人々の内に秘めた感覚をAIで表現してカタチにしていくことで社会全体をハッピーにしていきたいと思います。感性を活用できる領域は業種やフェーズを問いません。これまで蓄積された知財を活用しながら将来的には世界展開も視野に入れております！ ★会社説明資料感性AIをより皆さんに知っていただきたく会社説明資料を作成しましたのでぜひご覧ください。 https://www.kansei-ai.com/recruit

Invitation from 感性ＡＩ株式会社

If this story triggered your interest, have a chat with the team?

【感性AI】テックブログ vol.2 -「キャッチコピー感性評価」を行うBERTの多次元回帰モデル構築-

印象評価尺度の予測について

学習データ

BERTのファインチューニング

おわりに

感性ＡＩ株式会社

エンジニア

Weekly ranking

【感性AI】テックブログ vol.2　-「キャッチコピー感性評価」を行うBERTの多次元回帰モデル構築-