A aplicação da ciência de dados em uma organização é extremamente importante para projetos, independente de qual organização seja. A livraria Iztaccihuatl localizada na cidade de Monterrey, Nuevo León, México necessita melhorar seus indicadores de desempenho e estratégia na tomada de decisões. Nesse sentido, o trabalho aqui realizado teve como objetivo identificar as ferramentas necessárias para essa análise; propor uma estrutura de dados e um modelo baseado em Ciência de Dados para apoiar a tomada de decisão da livraria. A linguagem de programação utilizada será o R para análise e estruturação dos dados e o GitHub para armazenar e apresentar a proposta do projeto.
3. 1 INTRODUÇÃO
A aplicação da ciência de dados em uma organização é extremamente
importante para projetos, independente de qual organização seja. A livraria
Iztaccihuatl localizada na cidade de Monterrey, Nuevo León, México necessita
melhorar seus indicadores de desempenho e estratégia na tomada de decisões.
Nesse sentido, o trabalho aqui realizado teve como objetivo identificar as
ferramentas necessárias para essa análise; propor uma estrutura de dados e um
modelo baseado em Ciência de Dados para apoiar a tomada de decisão da
livraria. A linguagem de programação utilizada será o R para análise e
estruturação dos dados e o GitHub para armazenar e apresentar a proposta do
projeto.
4. 2 FERRAMENTA DE ANALISE
A proposta de ferramenta de análise dos dados é a linguagem R, visto que,
permitirá editar, armazenar, criar e administrar os arquivos da livraria, seus
objetos e estruturas de dados e integrar com versões de sistemas de controle de
versão com a ajuda do Git. O GitHub também fará parte do processo que
permitirá todo o armazenamento, controle e edições futuras da livraria desde o
início do projeto, assim como, seu sistema de armazenamento em nuvem. Para
criar os documentos, o Rmarkdown será um aliado, porque podemos redefinir os
arquivos em diferentes versões como HTML, PDfs, Word ou slides.
O banco de dados proposto é o SQL que permitirá definir, administrar e
consultar bases relacionadas, manipular os dados, sua atualização, garantindo
assim a confiabilidade das informações armazenadas.
5. 2.1 Análise preditiva
Segundo análise dos dados da livraria, o indicado seria fazer uma análise
preditiva dos dados, onde esta técnica analítica poderia antecipar tendências e
fazer projeções nos negócios da organização. Com os levantamentos dos
arquivos “top_books” , “ratings” e “to_read” já podemos prever melhor os
próximos gêneros mais vendidos, mais desejados da livraria, os menos
desejados, os mais recomendados pelos clientes entre outros dados que podem
identificar oportunidades à frente, como nova aquisições na livraria dos gêneros
mais vendidos, otimizar estratégias de marketing, mapear o comportamento e
hábitos dos clientes e colaboradores, melhorar as operações e eficiência dos
processos dentro da livraria, reduzir riscos e etc.
Alguns passos são necessários para que a livraria continue melhorando seus
indicadores de desempenho e estratégias na tomada de decisões. Como:
- Levantar os principais objetivos;
- Definir metas;
- Coletar dados (pesquisa de mercado);
- Organizar estes dados;
- Monitoramento;
- Ferramentas de análise adequadas.
As vantagens de utilização das ferramentas propostas é que a linguagem R
é gratuita e permite trabalhar com o GitHub de uma maneira tranquila e de fácil
acesso, que também é gratuito. Além de ambos permitir organizar esses
arquivos da livraria e trabalhar com as etapas da ciência de dados:
Outra vantagem é que o Git com seu controle de versão, permitirá que os
envolvidos no projeto continuem melhorando constantemente e aperfeiçoando
seus dados, com novas edições, analises e monitoramento.
6. Um exemplo é nos arquivos mais votados pelos clientes no sitio web da livraria
é coloca-los por nome e não “Id”, para melhor visualização dos colaboradores do
projeto.
7. 3 CONCLUSÃO
Após análise dos dados, visualização das opções e definição das ferramentas,
pode-se concluir que o um projeto de ciência de dados para a livraria com esses
apontamentos e sugestões permitiriam a flexibilidade porque é fácil escrever
formulas complexas em R. Praticamente todos os tipos de testes e modelos
estatísticos estão disponíveis para uso na linguagem, Utilizar o CRAN que é o
repositório da linguagem R em que cada colaborador pode contribuir com novos
pacotes que podem ser facilmente instalados com uma linha de código, a
utilização do Rstudio para complementar as funções do R, utilizar o enorme
conjunto de bibliotecas disponíveis para análise de diferentes tipos de estatística,
o Rstudio facilitar a maioria das tarefas e facilitar o fluxo de trabalho. Assim como
o GitHub em todo o seu processo de criar, agregar, executar, integrar e
compartilhar.