La importancia de desarrollar y principalmente retener talento es fundamental para el éxito de las organizaciones. En esta sesión presentaremos un proyecto de investigación exitoso aplicado a la predicción de abandono de un empleado.
Presentado por: Juan Baldemar
People Analytics: Prevención y predicción de rotación del personal
1. People Analytics: Satisfacción
de Personal para evitar
Abandono.
Juan Baldemar Garza Villegas, PhD
https://sg.com.mx/dataday
#DataDayMTY
2. El recurso de mayor valor en las organizaciones es el capital
intelectual. La importancia de desarrollar y principalmente
retener este recurso es fundamental para el éxito de las
organizaciones.
A continuación se presentará un proyecto exitoso aplicado
para la predicción de abandono de un empleado y su
retención a través de la satisfacción laboral.
Introducción
3. People Analytics, sigue avanzando en las empresas. Es más
común observar más empresas participando en iniciativas y
proyectos con este enfoque, cambiando la manera de hacer
las cosas y anticipándose al futuro a través del uso de
analítica y la ciencia de datos aplicada en los recursos
humanos.
Introducción
4. Según Harvard Business Review, un 71% de los directores
generales ven en sus colaboradores el activo más importante
vinculado a unos buenos resultados económicos. Ante las
cifras, es evidente la importancia de predecir y actuar sobre un
factor tan variable como el de los recursos humanos.
Introducción
5. People Analytics es un conjunto de técnicas que nos
permiten predecir comportamientos de las personas dentro de
una empresa.
People Analytics hace uso de los distintos tipos de analítica:
descriptiva, prescriptiva, diagnóstica y predictiva.
Hace uso de la ciencia de datos, estadística, matemáticas,
aprendizaje automático (machine learning) y la inteligencia
artificial para dar Valor al Negocio.
Introducción
7. Literatura científica
Autores Título / Problemática Técnicas de People Analytics Algoritmos con mejores resultados
(Jantan & Hamdan, 2010) Data Mining techniques for performance
prediction of employees
C4.5 decision tree, Random Forest,
Multilayer Perceptron (MLP) and Radial
Basic Function Network
C4.5 Arboles de decisión
(Nagadevara, V., Srinivasan, V. &
Valk, 2008)
Relationship of withdrawal
behaviors like lateness and absenteeism,
job content, tenure and demographics on
employee turnover
Artificial neural networks, logistic regression,
classification and regression trees (CART),
classification trees (C5.0), and discriminant
analysis)
Árboles de regresión y clasificación
(CART)
(Hong & Chao, 2007) Feasibility of applying the Logit and
Probit models to employee voluntary
Turnover predictions.
Logistic regression model (logit), probability
regression model (probit)
Modelo de regresión logístico (logit)
(Kane-Sellers, 2007) To explore various personal, as well as
work variables impacting
employee voluntary turnover
Binomial logit regression Regresión logit binomial
(Alao & Adeyemo, 2013) Analyzing employee attrition using
multiple decision tree algorithms
C4.5, C5, REPTree, CART CS. Arboles de decisión
(Saradhi & Palshikar, 2011) To compare data mining techniques for
predicting employee churn
Naïve Bayes, Support Vector Machines,
Logistic Regression,
Decision Trees and Random Forests
Support Vector Machines
Introducción
8. Fuente: Stratistics MRC, 2018
$439m
The Global Market for People Analytics is set to Triple by 2022
$1.29b
USD
2015 2022
Introducción
9. Es el nuevo enfoque
de RH en la era de
la revolución 4.0
Introducción
10. • 40% de la rotación de personal es de categoría 2 y 3. ¿Por qué se va el personal
operativo de la empresa?
• Desconocimiento de lo que hace que un operador se identifique con la compañía.
¿Qué comportamientos hacen que un operador se identifique con la compañía?
•¿Qué variables “características” inciden para reducir el abandono de un operador?
• ¿Podemos sacar más provecho de la información estructurada y no estructurada de
la encuesta de clima?
•¿Cómo hacemos que nuestro personal este más satisfecho?
Antecedentes
11. Objetivo General:
◉ Determinar los comportamientos del empleado sindicalizado que
aumentan la identificación con la empresa y las características que
inciden en la rotación de personal.
Objetivos Particulares:
◉ Identificar las variables relevantes que inciden en la rotación del personal y la
identificación con la empresa, mediante la recopilación de datos, análisis bibliográfico y
participación de expertos de R.H.
◉ Desarrollar un modelo estructural que evidencie los factores que se relacionan con la
identificación con la empresa. (Encuesta Clima)
◉ Desarrollar un modelo predictivo que evidencie las características del personal sindicalizado
que se relacionan con la rotación de personal. (Encuesta Clima+Información RH)
12. Metodología CRISP-DM
Cross- Industry Standard Process for Data Mining
Comprensión del
negocio
Entender los objetivos del
proyecto
Comprensión de los datos
Recolección de datos relevantes e
identificación de los problemas de
calidad
Preparación de los
datos
Construir un conjunto final de
datos
Evaluación
Modelos con calidad para el
análisis de datos y comparación
con objetivos del proyecto
Modelado
Incorporación de datos a las
herramientas analíticas
Despliegue*
Interpretar, organizar y presentar
el conocimiento obtenido al
cliente
IBM
(2012)
14. ¿Qué es lo que hace que un
empleado “operador”
se identifique con la empresa?
15. Hipótesis de Constructos de Clima laboral
*
• H1: Existe una relación positiva entre la calidad de vida del personal con la identificación de los empleados a la
empresa
• H2: Existe una relación positiva del compañerismo organizacional con la identificación de los empleados a la
empresa
• H3: Existe una relación positiva del liderazgo organizacional con la identificación de los empleados a la empresa
• H4: Existe una relación positiva de las compensaciones de la organización con la identificación de los empleados a
la empresa
• H5: Existe una relación positiva de las condiciones de trabajo de la organización con la identificación de los
empleados a la empresa
• H6: Existe una relación positiva del desarrollo de habilidades de la organización con la identificación de los
empleados a la empresa
• H7: Existe una relación positiva de la comunicación organizacional con la identificación de los empleados a la
empresa
• H8: Existe una relación positiva del trato ejecutivo organizacional (Diversidad e inclusión) con la identificación de
los empleados a la empresa
• H9: Existe una relación positiva de la responsabilidad social de la organización con la identificación de los
empleados a la empresa
18. Confiabilidad
(Alfa de Cronbach)
La confiabilidad se aprueba en los 10 factores.
Compensaciones
Calidad de vida Compañerismo Liderazgo
Condiciones de trabajo Desarrollo de habilidades
19. • El análisis factorial, es una técnica de reducción de datos;
sirve para encontrar grupos homogéneos de variables a partir
de un conjunto numeroso de variables.
• Estos nuevo grupos homogéneos se forman con las variables
que se correlacionan mucho entre sí, procurando que estos
grupos sean independientes entre sí.
• Al realizar el análisis factorial en los constructos/factores de la
encuesta encontramos que de los 10 constructos originales, se
reducen a 6 con los cuales se explican el 65.44% de la varianza
total
Validez
(Análisis Factorial)
20. Validez
(Análisis Factorial)
• Liderazgo (12 / 13)
• Comunicación (11 / 12)
• Compañerismo ( 9 / 9 )
• Condiciones
de Trabajo (10 / 15)
• Compensaciones ( 6 / 9 )
• Identificación
con la Empresa ( 4 / 9 )
De 67 ítems, se quedarían 52
52 ítems en 6 factores
La Encuesta requiere ajustar los ítems de los factores:
-Calidad de Vida
-Diversidad e Inclusión
-Responsabilidad Social
-Desarrollo de habilidades
21. ¿Qué es lo que hace que un
empleado “operador”
se identifique con la empresa?
22. Modelación de ecuaciones estructurales.
Método de covarianza
• Para el desarrollo del estudio empírico utilizaremos
el modelo de ecuaciones estructurales (SEM) de
sus siglas en ingles “Structural Equation Modelling”
con la finalidad de encontrar técnicamente los
coeficientes desconocidos de un conjunto de
ecuaciones estructurales.
• De acuerdo a Lean & Gray (1998) se asume que
una estructura causal es un conjunto de variables
latentes (constructos) y variables observadas como
ítems ó indicadores de las variables latentes.
• Las variables latentes son combinaciones lineales
de variables observadas, es decir es un concepto
supuesto y no observado que sólo puede ser
aproximado mediante variables medibles u
observables. Según Byrne (1994) citado en Lean &
Gray (1998) el método de ecuaciones estructurales
toma una prueba de hipótesis y desarrolla un
análisis multivariado.
Desarrollo de un modelo
basado en teoría
Construcción de un
diagrama de trayectoria
Conversión del diagrama de
trayectoria a ecuaciones
estructurales
Evaluación de la
identificación del modelo
Correlaciones Covarianzas
Estimación de los
parámetros del modelo
(elección del
método de estimación)
Evaluación de la
de bondad de
ajuste del modelo
Modificación del Modelo
Interpretación del Modelo Final
Elección del tipo
de matriz a analizar
Especificación
del Modelo
Identificación
del Modelo
Estimación
del Modelo
Evaluación e
Interpretación
del Modelo
Fases del Proceso de desarrollo de un modelo de Ecuaciones Estructurales
24. Nota: Esas hipótesis no se pueden confirmar ya que el factor no ajusta.
No son validos esos factores. No miden lo que se pretende medir.
H1: Existe una relación positiva entre la calidad de vida del
personal con la identificación de los empleados a la empresa
H2: Existe una relación positiva del compañerismo organizacional
con la identificación de los empleados a la empresa
H3: Existe una relación positiva del liderazgo organizacional con
la identificación de los empleados a la empresa
H4: Existe una relación positiva de las compensaciones de la
organización con la identificación de los empleados a la empresa
H5: Existe una relación positiva de las condiciones de trabajo de
la organización con la identificación de los empleados a la
empresa
H6: Existe una relación positiva del desarrollo de habilidades de
la organización con la identificación de los empleados a la
empresa
H7: Existe una relación positiva de la comunicación
organizacional con la identificación de los empleados a la
empresa
H8: Existe una relación positiva del trato ejecutivo organizacional
(Diversidad e inclusión) con la identificación de los empleados a
la empresa
H9: Existe una relación positiva de la responsabilidad social de la
organización con la identificación de los empleados a la empresa
26. El Índice de bondad de ajuste (GFI) evalúa si el modelo
debe ser ajustado. Entre más se acerque a cero indica un
mal ajuste.
El Índice normado de ajuste (NFI), compara el modelo
propuesto y el modelo nulo considerando un valor aceptable
si es mayor a 0.90.
El Error de Aproximación Cuadrático Medio (RMSEA),
representa el ajuste anticipado con el valor total de la
población y ya no con el de la muestra. Si RMSEA es menor
o igual a 0.05 indica un error de aproximación del modelo
con la realidad.
El Índice de error de cuadrático medio (RMR) mide las
varianzas y covarianzas de la muestra y si éstas difieren de
las estimaciones obtenidas. Si este indicador se acerca a 0,
puede considerarse un ajuste casi perfecto.
Si los valores de Chi-cuadrado/gl son de 2 a 3 y con límites
de hasta 5 el modelo tiene un ajuste aceptable
Análisis
Modelo Final - resultados
27. Liderazgo
Compensaciones
Comunicación
Condiciones de
Trabajo
Compañerismo
Identificación
con Empresa
0.173
*Coeficientes Estandarizados
Nota: Se sugiere actualizar el instrumento
ajustar los 4 factores (2020)
-Calidad de Vida
-Diversidad e Inclusión
-Responsabilidad Social
-Desarrollo de habilidades
Acciones sugeridas:)
Formalizar equipo
Ajuste de ítems en cada uno de los factores
Prueba piloto
Validación
Desventajas:
Se pierde historia de los 4 factores ya que no serian
comparables los ítems
29. Objetivo General
◉ Determinar los comportamientos del empleado sindicalizado que
aumentan la identificación con la empresa y las características que
inciden en la rotación de personal.
Objetivos Particulares:
◉ Identificar las variables relevantes que inciden en la rotación del personal y la identificación
con la empresa, mediante la recopilación de datos, análisis bibliográfico y participación de
expertos de R.H.
◉ Desarrollar un modelo estructural que evidencie los factores que se relacionan con la
identificación con la empresa. (Encuesta Clima)
◉ Desarrollar un modelo predictivo que evidencie las características del personal
sindicalizado que se relacionan con la rotación de personal. (Encuesta
Clima+Información RH)
33. Nube realizada de motivos
Fuente: Entrevista de salida, RH 2018
Entrevista de salida
34. outputinput
Documento de opinión
“Comentario”
Clasificador
Opinión negativa
Algoritmo de texto. Clasificador binario
Análisis de sentimiento de entrevista de salida
Ejemplo: Comentario (-)
No existe riesgo de que el personal
que se retira sean detractores de la
empresa.
No afecta Reputación de la Empresa.
Entrevista de salida
Modelo realizado en AZML
¿Por qué no usar este mismo algoritmo con la información no estructurada de la encuesta de clima?
35. Variables
• ID Empleado
• Nombre de Empleado
• Estatus
• Compañías en las que trabajó
• Suma de años trabajando
• Viajes en Autobús
• Tiempo de Traslado
• Distancia desde el hogar
• Colonia
• Ausentismo
• Antigüedad
• ID Posición
• Posición
• Estado Civil
• Categoría
• Mejoras
• # Proyectos
• Accidentes de trabajo
• Tiempo de capacitación en el último año
• Departamento
• ID Departamento
• Unidad de Negocio
• ID Unidad de Negocio
• Educación
• Preparación Educativa
• Edad
• Fecha de Solicitud
• Tipo de Terminación (Voluntaria)
• Tipo de Terminación (Involuntaria)
• Tipo de Terminación (Voluntaria & Involuntaria)
• Encuesta de salida
• Razón de encuesta de salida motivo de baja
• Jefe & Supervisor
• ID Jefe & Supervisor
• Municipio donde vive
• Género
36
36. • ID Empleado
• Nombre de Empleado
• Estatus
• Compañías en las que trabajó
• Suma de años trabajando
• Viajes en Autobús
• Tiempo de Traslado
• Distancia desde el hogar
• Colonia
• Ausentismo
• Antigüedad
• ID Posición
• Posición
• Estado Civil
• Categoría
• Mejoras
• # Proyectos
• Accidentes de trabajo
• Tiempo de capacitación en el último año
• Departamento
• ID Departamento
• Unidad de Negocio
• ID Unidad de Negocio
• Educación
• Preparación Educativa
• Edad
• Fecha de Solicitud
• Tipo de Terminación (Voluntaria)
• Tipo de Terminación (Involuntaria)
• Tipo de Terminación (Voluntaria &
Involuntaria)
• Encuesta de salida
• Razón de encuesta de salida motivo de baja
• Jefe & Supervisor
• ID Jefe & Supervisor
• Municipio donde vive
• Género
36
Variables
37. • ID Empleado
• Compañías en las que
trabajó
• Tiempo de Traslado
• Ausentismo
• Antigüedad
• Estado Civil
• Categoría
• Mejoras
• # Proyectos
• Accidentes de trabajo
• Tiempo de capacitación
en el último año
• Preparación Educativa
• Edad
• Género
• DSP
• Tipo de Terminación
(Voluntaria)
• Tipo de Terminación
(Involuntaria)
36 14
Variables
38. Hipótesis
• H1: Las Compañías en las que trabajó afecta positivamente la probabilidad de abandono.
• H2: El Tiempo de Traslado afecta positivamente la probabilidad de abandono
• H3: El Ausentismo afecta positivamente la probabilidad de abandono
• H4: La Antigüedad afecta positivamente la probabilidad de abandono
• H5: El Estado Civil afecta positivamente la probabilidad de abandono
• H6: La Categoría afecta positivamente la probabilidad de abandono
• H7: Las Mejoras afectan positivamente la probabilidad de abandono
• H8: Los # Proyectos afectan positivamente la probabilidad de abandono
• H9: Los Accidentes de trabajo afecta positivamente la probabilidad de abandono
• H10: El Tiempo de capacitación en el último año afecta positivamente la probabilidad de
abandono
• H11: La Preparación Educativa afecta positivamente la probabilidad de abandono
• H12: La Edad afecta positivamente la probabilidad de abandono
• H13: El Género afecta positivamente la probabilidad de abandono
• H14: Un buen resultado de Satisfacción (Clima) afecta positivamente la probabilidad de abandono.
39. Regresión Logística
• Este modelo es una generalización del modelo de regresión lineal clásico para
variables dependientes categóricas dicotómicas (García, García, & Caro, 1996).
• Tiene la ventaja de no requerir supuestos como el de normalidad multivariable y el
de homocedasticidad (igualdad de las varianzas), que son difíciles de verificar.
• Otra ventaja radica en su similitud con la regresión múltiple: permite el uso de
variables independientes continuas y categóricas (estas últimas por medio de su
codificación a variables ficticias), tiene capacidad de incorporar efectos no lineales y
es útil para realizar diagnósticos (Hair, Anderson, Tatham, Black, & others, 1999)
40. ¿Qué es lo que influye para que un
empleado “operador” abandone su puesto?
43. Resultados
Verdadero negativo: Cantidad de veces que una clase real
fue negativa.
Ejemplo: El colaborador realmente no esta en riesgo de
abandono y el modelo predice que no esta en riesgo.
Rechazo correcto.
Falso negativo: Cantidad de veces que una clase real fue
positiva, pero se predijo como negativa.
Ejemplo: El colaborador realmente esta en riesgo de
abandono y el modelo predice que no esta en riesgo. Error
tipo 2.
Verdaderos positivos: Cantidad de veces que una clase fue
positiva. Éxitos
Ejemplo: El colaborador esta en riesgo de abandono y el
modelo predice el riesgo.
Falso positivo: Cantidad de veces que una clase fue negativa
y se predijo como positivo.
Ejemplo: El colaborador en realidad no esta en riesgo de
abandono, pero el modelo predice riesgo. Falsa Alarma.
Error tipo 1.
Modelo final
97.3% 2.7%
15.4% 84.6%
44. Compañías en las
que ha trabajado
Antigüedad
Lo que impacta Lo que reduce
R
O
T
A
C
I
Ó
N
Tiempo de
traslado
Faltas
Proyectos
Hrs. Capacitación
Mejoras
Resultado Encuesta (>80)
Modelo final
45. 1ª Fase
• Comunicación
• Compañerismo
• Compensaciones
• Condiciones de trabajo
2ª Fase
• Encuesta Clima
• Número de compañías en las
que ha trabajado
• Faltas
• Tiempo de traslado
• Antigüedad
• Proyectos
• Mejoras
• Horas de Capacitación
Resumen
variables
relevantes
Conclusiones
46. Acciones
Más de 40 acciones implementadas por R.H
Ejemplo de algunas acciones:
• Sistema de Seguimiento Encuesta – Plataforma para seguimiento de hallazgos
• Cada Planta con acciones
• Se integra algoritmo de datos no estructurados (Análisis de sentimiento)
• Se integra algoritmo de datos no estructurados (Análisis de reputación corporativa)
47. Costo beneficio
(Renuncia voluntaria)
Categoría Costo de rotación por pérdida Renuncias voluntarias por categoría Costo de rotación por renuncias
1 $84,550.71 0 $0.00
2 $94,983.28 8 $759,866.27
3 $104,276.30 12 $1,251,315.63
4 $114,574.31 6 $687,445.89
5 $138,576.38 11 $1,524,340.14
6 $155,446.78 3 $466,340.34
7 $181,366.32 5 $906,831.58
8 $216,288.73 1 $216,288.73
Costo TOT
$5,812,
Si reducimos un 50% la rotación a nivel operativo en
categoría 2 y 3.
4 casos de categoría 2.
6 casos de categoría 3.
Nos daría un beneficio potencial = $1,005,590.
Costo directo
de
reclutamiento
Reducción temporal de
costo de mano obra
Costo por caída en la
productividad
49. Ejemplo de Acciones Encuesta
Creación de Plataforma Encuesta
para seguimiento de planes,
análisis de sentimiento
y reputación corporativa
50. Sentiment Analysis Encuesta
El análisis de sentimiento (también conocido como minería de opiniones) consiste en el uso de tecnologías de
procesamiento del lenguaje natural, analítica de textos y lingüística computacional para identificar y extraer
información subjetiva de contenido de diversos tipos.
Sentimiento a nivel de atributo
Detecta el sentimiento específico para una objeto o cada una de sus cualidades. Analiza el sentimiento de cada frase en detalle.
Identifica opiniones y hechos
Discrimina cuando se expresa un hecho objetivo y cuando es una opinión subjetiva
Detección de ironía
Identificamos aquellos comentarios donde se quiere expresar lo contrario de lo que se dice.
Polaridad graduada
Diferencia lo muy positivo y lo muy negativo, además de la ausencia de sentimiento.
Acuerdo y desacuerdo
El análisis detallado permite identificar opiniones de distinto signo o mensajes contradictorios o ambiguos
55. El análisis de la Reputación Corporativa permite entender el impacto que las opiniones y percepciones del
empleado que tienen sobre una serie de dimensiones o ejes reputacionales de una organización.
Se puede definir como un agregado de las opiniones, percepciones y expectativas que diversos grupos de
interés relevantes tienen sobre una cierta empresa u organización.
Incorpora todo tipo de feedback Además de entrevistas y
encuestas, incorpora redes sociales, foros y otros canales
de feedback no solicitado, con su carga de inmediatez y
espontaneidad.
Identifica rápidamente crisis potenciales. La
disponibilidad 24x7 y su alta velocidad permite generar
alarmas en tiempo real sobre cualquier comentario o
tendencia e identificar rápidamente áreas de mejora.
Algoritmo de reputación corporativo
Corporate Reputation Analysis
Propuesta de Valor
Trabajo
57. http://pivot.com.mx/
Ingresar el link y buscar :
People Analytics
Ingresar el link y buscar :
La analítica predictiva y
su aplicación en los negocios
http://pivot.com.mx/
Más sobre People Analytics
http://pivot.com.mx/
Ingresar el link y buscar : Tendencias
de People Analytics
58. REFLEXIÓN
Implementación de herramientas de análisis más
profundas en RH
Satisfacción para la productividad
Hechos y Datos en R.H
complementa labor
Sinergia entre plantas y
Corporativo
Reducción de rotación voluntaria
Aprendizajes y Reflexión
“No permitamos que factores externos sean un obstaculo para la mejora de nuestros
procesos; la solución siempre estará en como nos enfrentamos a ellos”.
Eliminación de actividades que no agregan
valor en nuestros procesos.