Master Data Management & Virtualização de Dados em SOA
1. Master Data Mgmt. e
Virtualização de Dados
em SOA
Transforme os Dados que você TEM
nos Dados que você QUER!
Ricardo Ferreira
Middleware Solutions Architect
Red Hat do Brasil
2. O que é Master Data Management?
● Conjunto de Processos e
Ferramentas usadas para:
✔ Consolidar dados de
diferentes fontes
✔ Assegurar controle e
consistência sobre os dados
✔ Resolver problemas de
duplicidade dos dados
✔ Promover uma interface
abstrata de acesso a dados
● Método Corporativo de
Gerenciamento de Dados
✔ Dados gerenciados como
ativos corporativos
✔ Reforça questões de
segurança relacionadas ao
acesso não autorizado
✔ Promove dados estratégicos
a serem exibidos em painéis
e relatórios de BI e BAM
2
3. Cenários onde MDM deve ser Aplicado?
● BI, Análise Operacional,
Relatórios Gerenciais:
✔ Relatórios financeiros
consolidados / Dashboards
✔ Data Marts Virtuais
● Reference Data Mgmt:
✔ Visão 360° de Clientes
✔ Visão 360° de Produtos
✔ Visão 360° de Funcionários
✔ Visão 360° de Fornecedores
● Conformidade com
Regulamentações:
✔ VISA PCI, Sarbanes Oxley
✔ Segurança Unificada
✔ Auditoria de Acessos
● Service-Oriented Architecture
✔ Federação de Dados
✔ Processos mais Simples!
3
4. Master Data Mgmt. É Algo Novo?
● Na verdade não, muito
pelo contrário ...
✔ MDM provêm de um
conceito antigo conhecido
como “Master File”
✔ Um “Master File” representa
uma coleção de registros
que representam entidades
básicas de uma empresa
● Humm ... acho que já ouvi
esse termo antes ...
✔ O conceito de Master File é
comumente usado em
alguns programas baseados
em Clipper, COBOL
✔ Grande parte dos bancos de
dados de plataforma alta
(CICS DB2, ADABAS) usam
este conceito nativamente
✔ Conceitos chave: Master
Data, Reference Data e
Master Reference Data
4
5. Mergulhando no Master Data Mgmt.
● Master Reference Data
✔ Dados compartilhados entre
vários sistemas, cuja
importância para o negócio
é relativamente baixa
✔ Exemplos: Países,
Calendários, Categorias
● Reference Data
✔ Dados que são modificados
frequentemente por
transações de sistemas
✔ Definem os assuntos de
aplicações isoladas
● Master Data
✔ Dados compartilhados entre
vários sistemas, com alta
importância para o negócio
✔ Exemplos: Clientes,
Produtos, Funcionários,
Fornecedores, Vendas
5
7. Como Funciona Hoje: Programas ETL
● Como isso Funciona?
✔ Dados são copiados de uma
fonte de dados para outra
✔ A cópia é feita por
programas escritos em
línguagens de programação
ou ferramentas de ETL
“Master File”
✔ As cópias são executadas
em períodos de inatividade
das fontes de dados
● Quais são os Problemas?
✔ Dados nunca estarão
sincronizados de forma
apropriada
✔ Proliferação dos dados em
diferentes fontes e bases
✔ Programas ETL são
complexos de manter
✔ Mudanças exigem re-
compilação dos programas
✔ Inadequado para Cloud!
7
8. Como Funciona Hoje: Database Links
● Como isso Funciona?
✔ Uma conexão ou link entre
duas bases de dados é
criada para fins de EII
✔ As políticas de autorização
dos artefatos é replicada
entre as duas bases
✔ Visões ou procedures são
criados para abstrair as
tabelas físicas distribuídas
● Quais são os Problemas?
✔ Conexão e links apenas para
o mesmo tipo de banco de
dados. Ex: DB2 → DB2
✔ Complexo para administrar:
Links ponto a ponto!
✔ Específico para fontes de
dados relacionais como
tabelas, visões e procedures
✔ Específico de um banco de
dados = Vendor Lock-In!
✔ Muito caro para Cloud!
8
9. Como Funciona Hoje: Acesso Direto
● Como isso Funciona?
✔ Cada aplicação estabelece
uma conexão direta com a
fonte de dados para acesso
Uma vez estabelecida a
conexão, a aplicação acessa
uma ou mais tabelas (ou
artefatos) da fonte de dados
● Quais são os Problemas?
✔ Baixa disponibilidade: Se a
fonte de dados cair, a
aplicação para de funcionar
✔ Lógica de transformação dos
dados fica a cargo da
aplicação que faz acesso
✔ Complexidade de transações
distribuídas e segurança
vem para dentro do cliente
✔ Lógica de conexão e acesso
nunca é reutilizada
✔ Impossível usando Cloud!
9
11. Solução: Virtualização dos Dados
● Esqueça o físico: Conecte-
se apenas com o Virtual!
✔ Abstração de uma ou mais
fontes de dados físicas
✔ Hoje você já virtualiza
servidores, redes, aplicações
... porque não os dados?
✔ Elimine impedância de
formatos, fabricantes,
localizações físicas,
transações distribuídas,
segurança, conformidades
● Acesse como você quiser,
de onde você quiser!
✔ Se os dados forem virtuais, o
formato pode ser alterado
como quiser
✔ Preucupe-se apenas em ter
um usuário e senha, e saber
o endereço e porta dos
dados a serem acessados
✔ Ideal para cenários de Cloud
11
12. Como posso Virtualizar meus Dados?
● Usando um Middleware
de Virtualização de Dados
✔ Plataformas de integração
de informações corporativas
✔ Várias soluções existem
atualmente no mercado
✔ Conectores especiais são
usados para acessar as
fontes de dados
✔ Todas as informações sobre
as fontes de dados devem
ser armazenados em nível
corporativo para reuso
● O que isso implica no que
eu já tenho hoje?
✔ Redirecionar as aplicações
para o middleware de
virtualização
✔ Repensar políticas de locking
nos transacionais
✔ Definir políticas de cache
12
13. Estudo de Caso: MDM Aplicado à CRM
● Aplicado a uma empresa
do ramo de Seguros
✔ Área de Call Center da
empresa necessita ter maior
agilidade no atendimento
Web
✔ Atrasos no atendimento a SQL Services
clientes ocasionavam multas
altas e processos jurídicos
Data Service Data Service Data Service
✔ Consultores de atendimento
não tinham informações JBoss Enterprise
confiáveis e disponíveis
● Solução técnica baseada Data Services Platform
na plataforma MetaMatrix
✔ Fontes de dados sobre
clientes e seguros acessíveis
via Data Services
✔ Foco primário nos sistemas
de atendimento e demais
sistemas do Back-Office
✔ Subsidío para a aplicação de
Federação de Dados e SOA
13