Este documento descreve um estudo que utiliza séries temporais para prever o número de praticantes inscritos em federações desportivas nos próximos anos. Os dados de 16 anos de 69 modalidades desportivas foram analisados usando modelos ARIMA e ETS para fazer as previsões. Os resultados podem ajudar federações desportivas e entidades públicas a planearem recursos com antecedência. O modelo ETS apresentou um erro médio absoluto ligeiramente menor do que o ARIMA.
Business Process Management in Sports Organizations: A case study in the Euro...
Previsão da prática desportiva recorrendo a séries temporais
1. Congresso
Internacional da
UI-IPSantarém
Congresso da Unidade de
Investigação
Pedro Sobreiro e Abel Santos
ESDRM-IPSantarém
Imagem obtida em: http://1079mixfm.s3.amazonaws.com/wp-
content/uploads/2014/10/fotolia_43767087_subscription_monthly_l.j
pg
3. Objetivo
do estudo
Prever praticantes
inscritos em federações
desportivas recorrendo
a séries temporais
Imagem obtida em:
https://www.forbes.com/sites/bernardmarr/2016/10/10/5-amazing-
things-big-data-helps-us-to-predict-now-plus-whats-on-the-
horizon/#6642349d412e
4. Enquadramento
• A avaliação das taxas de participação desportiva na
europa (Rodgers, 1977) ajuda a definição as
políticas públicas destinadas a incentivar a
participação na atividade física, antecipar o
desenvolvimento do mercado de equipamento e
materiais para o desporto (Tuyckom, Bracke &
Scheerder, 2011);
• O conhecimento do número de praticantes é um
problema de gestão (Camps & Pappous, 2016), que
pode suportar a tomada de decisão;
Rodgers, B. (1977). Rationalising sports policies. Sport in its social context: International comparisons. Strasbourg: Council of Europe/Committee on
Sport
Van Tuyckom, C., Bracke, P., & Scheerder, J. (2011). Sports – idrott – esporte – deporte – sportovní: The problem of equivalence of meaning in
comparative sports research. European Journal for Sport and Society 2011, 8 (1/2), 85-97.
Camps, A., Pappous A. (2016). Predicting the Evolution of Sports Federation Membership: An Important Tool to Asses National Governing Bodies’
Strategic Planning. Journal of Sports Science 4 (2016) 57-69.
5. Enquadramento
• As séries temporais são utilizadas para prever
resultados de equipas ou as situações que podem
melhorar suas chances de ganhar uma competição
(Yiannakis, Selby, Douvis and Han, 2006);
• Podem ser aplicadas no futebol (Stern, 1991),
basquetebol (Lopez & Matthews, 2015, Ruiz & Perez-
Cruz 2015) ou no hóquei no gelo (Brockwell &
Davis,1991);
• Considerando a importância na previsão do número de
praticantes inscritos nas federações desportivas,
desenvolvemos este estudo para suportar a tomada de
decisão para o planeamento de recursos utilizando as
séries temporais
Yiannakis, A., Selby, M. J. P., Douvis, J., and Han, J. Y. (2006). “Forecasting in Sport. The Power of Social context—A Time Series
Analysis with English Premier League Soccer.” International Review for the Sociology of Sport 41 (1): 89-115
Lopez, M., and Matthews, G. (2015). “Building an NCAA Men’s Basketball Predictive Model and Quantifying its Success.”
Journal of Quantitative Analysis in Sports 11 (1): 5-12.
Brockwell, P. J., and Davis, R. A. (1991). Time Series: Theory and Methods. New York: Springer-Verlag.
6. Metodologia utilizada
• Para realizar a previsão dos praticantes nas
federações foram utilizados dados de uma amostra
com 22080 registos e 19 variáveis, representando a
prática desportiva em todos os distritos
portugueses desde 1999 até 2014, em 69
modalidades em vários escalões.
• Os dados obtidos foram consolidados calculando o
total de praticantes de todas as modalidades em 16
anos;
7. Metodologia utilizada
• O tratamento de dados foi realizado com o
Anaconda e IPython (Continuum Analytics, 2016),
recorrendo ao Pandas (McKinney & others, 2010)
• As previsões foram desenvolvidas com 16
observações (16 anos), valor que é considerado
viável para series temporais de pequena dimensão
(Makridakis & Hibon, 2000)
Continuum Analytics. (2016). Anaconda Software Distribution. Obtido de https://continuum.io
McKinney, W., & others. (2010). Data structures for statistical computing in python. Em Proceedings of the 9th Python
in Science Conference (Vol. 445, pp. 51–56). SciPy Austin, TX. Obtido de
https://pdfs.semanticscholar.org/f6da/c1c52d3b07c993fe52513b8964f86e8fe381.pdf
Makridakis, S., & Hibon, M. (2000). The M3-Competition: results, conclusions and implications. International journal
of forecasting, 16(4), 451–476.
8. Metodologia utilizada
• Previsão realizada em R (R Development Core
Team, 2008) utilizando a biblioteca forecast
(Hyndman & Khandakar, 2008);
• Utilizamos os modelos Exponential smoothing state
space model, Error, Trend, Seasonal (ETS) e
Autoregressive Integrated Moving Average (ARIMA)
para determinar o número de praticantes para os
quatro anos seguintes;
Hyndman, R. J., & Khandakar, Y. (2008). Automatic time series forecasting: the forecast
package for R. Journal of Statistical Software, 26(3), 1–22.
9. Metodologia utilizada
• Aplicamos o arima.auto() e obtivemos
ARIMA(0,1,0): autoregressive order 0, diferencing
1, moving average 0;
• Verifica-que um modelo não estacionário, i.e., time
series apresenta tendência, a média e variância não
é 0, não se pode usar AR (autoregressive) e MA
(moving average)
• Aplica-se random walk, modelo time series em que
a observação atual é igual à anterior mais um passo
aleatório;
10. Metodologia utilizada
• Aplicamos também outro modelo não estacionário
ETS que modela a tendência, erro e sazonalidade
(ETS);
• O ETS escolhe o melhor método e foi desenvolvido
para resolver o problema das previsões de vendas
dos produtos farmacêuticos em milhares de
produtos (Hyndman, n.d.);
Rob J Hyndman. (n.d.). Forecasting using R. Obtido 31 de Janeiro de 2018, de
https://robjhyndman.com/talks/RevolutionR/6-ETS.pdf
11. Resultados ARIMA
Year Point For
ecast
Lo 80 Hi 80 Lo 95 Hi 95
17 236959.5 229853.6 244065.4 226091.9 247827.0
18 244709.9 234660.7 254759.2 229340.9 260079.0
19 252460.4 240152.6 264768.2 233637.3 271283.5
12. Resultados ETS
Year Point Fore
cast
Lo 80 Hi 80 Lo 95 Hi 95
17 237251.3 230479.8 244022.8 226895.2 247607.4
18 245210.9 235788.1 254633.6 230800.0 259621.7
19 253170.5 241686.3 264654.7 235607.0 270734.0
13. Comparação ETS vs ARIMA
Year Point Fore
cast
Lo 80 Hi 80 Lo 95 Hi 95
17 237251.3 230479.8 244022.8 226895.2 247607.4
18 245210.9 235788.1 254633.6 230800.0 259621.7
19 253170.5 241686.3 264654.7 235607.0 270734.0
ETS
Year Point For
ecast
Lo 80 Hi 80 Lo 95 Hi 95
17 236959.5 229853.6 244065.4 226091.9 247827.0
18 244709.9 234660.7 254759.2 229340.9 260079.0
19 252460.4 240152.6 264768.2 233637.3 271283.5
ARIMA
O ETS apresenta um Mean Absolute Error (MAE) de 11884.74 e o ARIMA de
12078.57.
14. Conclusão
• Os resultados obtidos podem ser utilizados como
orientações para as federações desportivas,
entidades públicas financiadoras das federações
desportivas e mercado de produtos e serviços de
desporto para anteciparem as necessidades de
recursos;
• A exatidão das previsões realizadas poderá ser
realizada através do MAE e reservando dados para
testar a previsão;