O documento discute Big Data, definindo-o como dados que não podem ser processados usando ferramentas tradicionais devido ao seu volume, variedade e velocidade. Explica que soluções de Big Data são úteis para analisar dados estruturados e não estruturados de várias fontes e que novas tecnologias permitem manipular grandes quantidades de dados rapidamente. Também projeta que o mercado de Big Data valerá US$ 24 bilhões até 2016.
3º Seminário CICTEC - Porto Mídia - Joana Mendonça e Mariana Valença 29 05 2013
Big Data: Volume, Variedade e Velocidade
1. BIG DATA
O objetivo principal deste Boletim é apresentar, de forma breve, a tendência tecnológica e de
mercado denominada Big Data. Big Data não implica dizer que os dados pré-existentes são
“pequenos” (o que não são) ou que seu único desafio é o seu tamanho (tamanho é apenas um
deles). O termo Big Data se aplica à informação que não pode ser processada ou analisada
usando processos ou ferramentas tradicionais.
Big Data é importante devido a alguns princípios chave:
- Soluções de Big Data são ideais para analisar não somente dados brutos estruturados, mas
também data semiestruturados e dados não estruturados a partir de uma ampla variedade de
fontes; - Soluções de Big Data são ideais para análises interativas e exploratórias quando
medidas de negócios com dados não são pré-determinadas; - Big Data é uma tecnologia
adequada para resolver desafios de informação que não podem ser tratados pelos enfoques
tradicionais de bancos de dados relacionais usuais no mercado.
Três características definem Big Data: volume, variedade, e velocidade (os conhecidos 3
V´s). Juntas, estas características definem o que a empresa IBM se refere à Big Data. Alguns
autores têm acrescentado outra caraterística (outro V): a da veracidade.
O fenômeno do Big Data é impulsionado pela massiva redução em custo na gestão de dados,
combinada com o aumento exponencial da capacidade de processamento computacional que
vemos nos dias atuais. Novas tecnologias têm permitido a manipulação de novas dimensões
de quantidades de dados rapidamente e de forma economicamente eficiente (volume e
velocidade).
Enfoques de Big Data requerem novas ferramentas tais como Analítica (a descoberta e a
comunicação de padrões – com significado – em dados, tema de outro Boletim), que permitem
analisar novas quantidades de diferentes fontes de informação, como por exemplo, de redes
sociais, engenhos de busca, transações de pagamentos, ou todas as categorias de e-
Commerce (variedade).
O sucesso de Big Data é inevitavelmente relacionado com uma gestão inteligente de seleção e
uso de dados, bem como esforços conjuntos em direção a regras claras com respeito à
qualidade dos dados. Uma clara governança de dados e uma clara política de dados são
inevitáveis para capacitar um uso de significado dos dados (veracidade).
Para que se perceba a importância de Big Data como uma tecnologia emergente, basta que se
observe os dados que se pode coletar e processar através da ferramenta gratuita chamada
Google Trends (http://www.google.com/trends) . Google Trends é uma poderosa ferramenta
que emergiu a partir da existência do Google, e pode ser usada através de simples técnicas de
Analítica.
2. Em termos de tendências de mercado, segundo estimativas de janeiro de 2013 da empresa
IDC- International Data Corporation, Big Data representará em 2016 um mercado da ordem de
US$ 24 bilhões, o que não é desprezível para um mercado ainda na sua infância.
No que diz respeito à sua evolução, uma grande tendência trazida pelo Big Data é a evolução
da atual fase de uso dos chamados Database Management Systems – DBMS (Sistemas de
Gerenciamento de Bancos de Dados), que lidam com conteúdos de dados estruturados, para
uma fase onde estão sendo (e serão ainda mais) tratados conteúdos de dados não
estruturados (marcadamente baseados na Web).
A fase seguinte na evolução proporcionada por Big Data será a de conteúdos baseados em
artefatos móveis e em sensores. Estas evoluções estão impactando (e impactarão ainda mais)
nas aplicações de comércio eletrônico e inteligência de mercado, governo eletrônico, em
política, ciência e tecnologia, saúde e bem-estar, segurança e proteção pública. Estes impactos
estão fazendo emergir (e irão fazer ainda mais no futuro) novas áreas de pesquisa, tais como
Analítica de Big Data, Analítica de Textos, Analítica da Web, Analítica de Redes e Analítica de
Dispositivos Móveis.
Pesquisador CICTEC: José Carlos Cavalcanti.