Weitere ähnliche Inhalte
Ähnlich wie ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business (20)
Mehr von Tokoroten Nakayama (16)
ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business
- 2. 自己紹介
• ところてん
• 所属
• Emotion Intelligence
• 職歴
• 半導体計測機開発
• 情報セキュリティ、ビッグデータ
• ソーシャルゲームデータ分析、ソーシャルゲームゲームディレクター、広告分析
• EC周りのデータ分析、興味解析、購買予測、広告CPA最適化
- 5. 出典書籍
• ヤバい予測学
• ビジネス寄りの機械学習に関する書籍
• 原著:The Power of Predict Who Will Click,Buy,
Lie,or Die
• 原著は2016年に改訂版が出ている
• 2章88pより
• プライバシーの攻防、という章の中で、企業が従業員を
監視・予測しているという文脈で紹介
• ほかにもTarget社(EC通販)の妊婦予測なども併せて紹
介、購買履歴から妊婦かどうかを予測する
• 本スライドでは、書籍の内容外の私の考えには「メモ」と
付けてあります
https://www.amazon.co.jp/dp/4484131250
- 6. HP社の離職予測
• 初出は2011年のPredictive Analytics Worldというカンファレンス
• http://www.predictiveanalyticsworld.com/london/2011/agenda.
php#day1-5a
• 要約:離職が予測できると、コスト削減したり、原因追及したりできる
メモ:Attritionは「摩耗」「損耗」の意味がだが、ここでは「社員の減少」を意味するっぽい
- 7. 書籍中での解説
• HPのインドのバンガロールの分析チームが開発
• Flight Risk
• メモ:直訳すると「高跳びリスク」、「離職リスク」の意味
• 訓練データ
• 給与、昇進、昇給、勤務評価、ジョブローテーション等のデータ2年分
• 実際に社員が辞めたかどうか
• 実験対象
• HPの「営業の管理」部門
• 「営業の管理」には専門スキルが要求されるために、育成コストが高い
• M&Aにより組織成長しているため、組織内の報奨制度がつぎはぎだらけ
• メモ:報奨制度の対照実験の環境が図らずとも実現されている?
- 8. 分析結果
• 精度・効果
• フライトリスクが高い方から40%の従業員に退職者の75%が含まれる
• 欠員補充や生産性の低下に対して、推定三億ドルのコスト削減効果
• 辞めない傾向にある社員
• 給料が高い、昇給が多い、勤務評価が向上している
• メモ:もし勤務評価が悪い人をクビにしているなら、生存バイアスなのでは・・・
• 頻繁なジョブローテ
• 定期的な仕事の変化が日常業務を面白いと感じさせるのでは?という考察
• 辞める傾向にある社員
• 昇進の回数が多い社員、昇進に対して昇給が小幅な社員
• メモ:人員不足->給与据え置き昇進->責任だけ増えるというコンボか?
• メモ:HPの肩書を利用して、給与の他社に転職するのだと思われる
- 10. なぜ離職予測がコスト削減につながるのか?
• 書籍の中で深く触れられていなかったので、自分
で計算をしてみる
• 日本基準で計算しているので、エージェントコストが支
配的
• 一人辞めると、年俸の50%くらいのコストがかかると
見ていい
• 離職率20%だと、20%の人員に50%のコスト増が
かかるので、給与支払対して10%のコスト増
• 考察
• 超過勤務に伴う他の社員の疲弊、離職リスクの増大
等を考えると、副次的な効果はもっと多そう
• 離職率が下がると、大幅なコストカットができることが
わかる
• 離職率が2pt下がると、コストが給与の1%分下がる
社員の基本的な数値類 unit
年俸 800 万円/年
営業日 240 日/年
有給休暇 20 日/年
実労働日数 220 日/年
1日あたりコスト 3.6 万円/日
退職に伴うコスト(生産性低下)
引継ぎ日数(本人) 10 日
引継ぎ日数(同僚) 10 日
引継ぎによる費用 72.7 万円
採用に伴うコスト
社員の採用稼働 10 日
社員の採用稼働コスト 36.4 万円
エージェント採用料率(年俸に対して) 40%
エージェントコスト 320 万円
欠員に対する同僚の超過労働コスト
欠員期間 20 日
超過労働による給与割り増し 25%
超過労働に伴う支払 18.2 万円
教育に対するコスト
教育期間 20 日
教育に対するコスト 72.7 万円
社員が一人辞めると、欠員補充に対するコスト 520 万円
年俸比率 65%
- 12. 原典を読んでみる
• 発表資料は未公開、カンファレンス参加者にのみ公開?
• HPのサイトからも見つけられず
• ヤバい予測学の著者のブログに当時の記事が載っていた
• http://www.predictiveanalyticsworld.com/patimes/the-privacy-
pickle-hewlett-packards-prediction-of-employee-behavior/2716/
• 割と本の内容そのままだが、一部違うことが書いてある
• ブログと書籍の内容の相違
• HPの社員は離職スコアのことを知らされていない
• 社員を罰するのではなく、離職率を下げるために行っている
• 「ドリルダウン」はしない、全体を俯瞰してパターンを発見するのに使う
- 14. 近しい事例を漁ってみる
• Googleは辞めそうな社員を予測している
• http://japan.zdnet.com/article/20393400/
• http://www.wsj.com/articles/SB124269038041932531
• 看護師の採用で「辞めない人材」を予測
• https://web.archive.org/web/20160125223928/http://www.sa
nkeibiz.jp/macro/news/160125/mcb1601250500017-n1.htm
• Pegged Software(http://www.peggedsoftware.com/ )を利用
• キーボードの打ち方や、1つのページに何秒間とどまるか、ブラウザーのタブをいつ閉じるかといっ
たデータから、アルゴリズムを使って候補者の仕事ぶりを予測することができるという。
• 例えば、ストレスの大きい状況に直面したときの反応を試すために、数学を専門としない人に
微分積分の問題を出し、固まってしまうか、別のページに移動するか、答えを入力したり修正
したりするかといった反応を測定する。
- 15. 近しい事例を漁ってみる
• Analyzing Employee Turnover- Predictive Methods
• https://www.linkedin.com/pulse/analyzing-employee-turnover-
predictive-methods-richard-rosenow-pmp
• 転職予測に使うアルゴリズムの説明
• Logistic Regression
• Survival Analysis(生存分析)
• 決定木
• ランダムフォレスト
• まぁ、そうだよね…。離職予測に特別な技術は要らないみたい。
- 16. 離職予測ができるサービス
• IBM Watson
• 決定木で出力してくれるらしい(労働時間、職位、SOの有無などが見える)
https://www.ibm.com/blogs/watson-analytics/watson-analytics-use-case-for-hr-retaining-valuable-employees/
- 19. クラウドソーシングでのアルゴリズム作成
• CrowdANALYTIXのコンテスト
• SanDiskの依頼で本番データでガチ
• 複数のデータサイエンティストが競う
• 賞金は9000ドル
• SlideShareに解説が上がっていた
• http://www.slideshare.net/divyabh
/employee-attrition-analysis
• 精度は 決定木>RF>KSVM>LR の順
• 直観に反する順番、何かトリックがあるのかも
• 特別な技術は特に要らないことが示唆される
• ジョブランクが高くて、勤続年数が長い人は
残りやすい(あたりまえ)
• 末端ノードにわりと原因が現れる(黒塗り)
https://www.crowdanalytix.com/contests/employee-attrition-analysis
- 22. 集団分析から個人介入へ
• 個人分析に向かっている
• HPは「個人を罰するためにには使わない」と言っている
• WSJの事例やサブロクでは個人のスコアを予測して、介入を実施
• これまともに運用できるのか?
• 今でさえ「上司がアンケートを見るから、全部最高評価にしておいた」と言ってるや
つがゴロゴロいる
• HPでさえ幹部に対してデータの読み方の訓練を施して、
そのうえで「集団の傾向は信頼できるが、個人のスコアは信頼できない」としている
• HPでさえ取り扱いが難しい劇薬を、どのように取り扱っていくのか?
• 社員100人の会社の人事や社長のレベルで取り扱えるのか?
• どうすれば運用に乗るのか?
- 23. まとめ
• 離職予測は北米では一般的になっている
• 採用コストは年俸の50%程度
• 離職率が下げられると、大きなコスト削減
• 離職予測には特別な技術は要らない
• DT、RF、LR、生存時間分析あたりでよさそう
• データさえあれば、だれでも簡単にできそう
• ここ一年に日本でも離職予測の流れが来ている
• メンタルヘルス診断の義務化と、AIブームの合わせ技で、調達ドン
• 良質なデータセットが手に入るようになった
• うつ病頻発(目的変数)メンタルヘルス診断の義務化(説明変数)
• でも離職予測のデータを使える人が育ってるの?
• アクションをどうやってセットにして売るか?がカギっぽい(会場でのディスカッションから)