【BERT】自然言語処理を用いたレビュー分析
- 9. mail: kazuya99986@gmail.com
• Attention is All You Need by Google(2017)
• Attention layer(非RNN)が搭載されたEncoder-Decoderモデル
Transformer
私 の 仕事 は 機械学習 エンジニア です
Query Key Value
Embedding
Attention(Q, K, V ) = softmax(
QKT
dk
)V
Softmax
attentionスコア(=単語間の類似度)
全体図 Scaled Dot Product Attention
重みへ変換
:
{ }
重みで行列のベクトルを回転 =
1 2 3 4 5 6 7 8
横方向にconcat
MultiHead(Q, K, V ) =
Concat(head1, . . . , headh)WO
Attention
Matrix
Attention
Weight
output
(head)
出力値の調整
私 の 仕事 は 機械学習 エンジニア です
Nomarization & NNへ
- 15. mail: kazuya99986@gmail.com
• 多数決方式で総合評価を決定
Pos文, Neg文, Pos文: Positive
Pos文, Neg文, Neg文: Negative
Pos文, Neg文, Neu文: Neutral
• LightGBMで検証(Label Encoding)
【処理前】x = [pos, neg, neu, ・・・・・・・・] ・y=[1 to 5]
【処理後】x = [3, 2, 1, 0, 0, 0, 0, 0, 0, 0, 0,・・・]・y=[1 to 5]
※最長レビューに合わせ、29次元作成(※ブランクは0 padding) ※yはユーザー自身が付けた評価
【結果】Pos評価 : 4.2 Neu評価 : 3.6 Neg評価: 2.8
※各ラベルごとの平均
Classi
fi
cation & Validation
振り分け結果
- 22. mail: kazuya99986@gmail.com
総合ポジティブ × 部屋 ネガティブ
• 駅に近いことが最高。朝食は、美味しかった。部屋がちょっと
狭く、ベットと机の間隔が狭い。大風呂がありかり、いつでも
入れるから良かった。
総合ポジティブ × チェックイン ネガティブ
• チェックインの手続きが面倒くさいです。ホテル、施設は綺麗
です。大浴場も快適でした。景色も良かったです。
総合ポジティブ × 駐車場 ネガティブ
• 館内、部屋含めとてもキレイでした。また近場を観光でき良か
ったです。駐車場があるかと思っていましたが、駐車場は
なく、提携した駐車場もない為実費となりました。
総合評価に対して決定的に影響を与えているキーワードは?
What is a
ff
ecting to Negative reviews?
- 24. mail: kazuya99986@gmail.com
• ACC: 89.8%(Precision: 84.7% ・ Recall: 96.6%)
決定係数
• 各変数がどの程度、結果を説明(寄与)しているか
• 絶対値が寄与度の大きさ、正負がネガポジへの影響を示す
Coe
ffi
cient of Logistic regression