A través de la metodología Cross Industry Estándar Process for Data Mining (CRISP-DM) damos una manera de aterrizar a los negocios de el concepto Big Data.
2. BDS Somos científicos de datos
• Business Data Scientists (BDS) se enfoca en monetizar el valor oculto en los datos del negocio,
descubriendo patrones relevantes a través de modelos de análisis avanzado que identifican planes de
acción concretos para resolver los retos competitivos de sus clientes.
• Nace en 2009 con la marca Logyt Discovery, cambiando de marca en 2014 a Business Data Scientists
para reflejar su enfoque en la ciencia de datos.
• A través de la aplicación disciplinada de metodologías y prácticas propietarias diseñadas para mantener
el enfoque en los retos de negocio, sus procesos de integración de datos y de modelación analítica
permiten desarrollar nuevas reglas de negocio que se despliegan y operan capturando/monetizando el
valor descubierto en los datos internos y externos de la organización.
• Ayudamos a nuestros clientes a:
• Minimizar el tiempo/costo de obtención del dato relevante (información suficiente y económicamente
disponible)
• Optimizar la conversión dato-conocimiento
• Maximizar la tasa de conversión dato-dinero
• Convertir conocimiento estratégico
3. No somos revendedores de Software,
Aunque algunas veces creamos software para una solución específica de
nuestros clientes
No somos revendedores de Hardware,
Aunque hemos y somos capaces de integrar o ser integrados en
soluciones completas de datos y Analytics con:
EMC2/Pivotal, HP/HAVeN, IBM/Netezza
¿Qué no somos?
3
4. Big Data: Volumen, Variedad y Velocidad
Capturistas
Usuarios
Máquinas
4
Social Media
Internet of Things
5. Big Data no tiene sentido sin analytics
Las tres “V”: grandes volúmenes de información, de
varios tipos y fuentes, que se acumulan muy
velozmente
Permiten descubrir patrones a aprovechar con
beneficios medibles
Híper-abundancia de información= escasez de
atención o de enfoque. Incluso parálisis
Se requieren metodologías y experiencia para
vincular capacidades de:
TIC y cómputo avanzado,
Análisis estadístico y modelación matemática,
y
Pensamiento estratégico para transformación
organizacional
5
Gap Analítico
Competing on Analytics
Datos
Disponibles
Capacidad
de Ejecución
Gap de
Ejecución
Capacidad
de Análisis
Big Data Era
2020
1980 1990 2000 2010
6. Diferencia entre Business Intelligence y Business Analytics
Business Analytics (y es el sentido
que le damos aquí a Big Data
Analytics) se refiere a las habilidades,
tecnologías y prácticas para la
exploración e investigación del
desempeño pasado de la empresa
para ganar conocimiento y conducir la
planeación y ejecución del negocio.
BA se enfoca en desarrollar nuevos
aprendizajes y entendimiento del
negocio basado en los datos, métodos
estadísticos y de optimización.
En contraste, Business Intelligence
tradicionalmente se enfoca en usar un
conjunto consistente de métricas
para al mismo tiempo medir el
desempeño pasado y guiar la
planeación del negocio.
6
Business
Intelligence
7. Cross Industry Standard Process for Data Mining (CRISP-DM)
Concebido en1996:
•DaimlerChrysler
•SPSS
•NCR
En ese tiempo empieza el auge por la
minería de datos, Un modelo de proceso
estándar para cualquier industria, no
propietario y gratuito, cumpliría con el
propósito.
Un año después se crea un consorcio para
desarrollar este proceso estándar quien en
2 años y medio se dedicaron a desarrollar
y refinar lo que hoy en día es el CRISP-DM.
7
8. Antes de entender los datos debemos de entender el negocio
ENTENDIMIENTO DEL NEGOCIO
¿Para quién producimos valor?
¿Cuál es nuestra propuesta de valor?
¿Cómo la entregamos?
¿Cómo la creamos?
8
9. Si no sabes cuál es la pregunta no tiene caso preocuparte por el Big Data
No sé cuál es la pregunta
9
10. Antes de la respuesta necesitamos la pregunta
No poner el caballo detrás de la
carreta
¿Cuál es la pregunta de negocio?
Las preguntas de negocio se sintetizan en una
sola: ¿cómo lograr ventaja competitiva?
Se pueden categorizar en rentabilidad cliente
(RC), rentabilidad de recursos (RR) y rentabilidad
de oferta (RO). Ejemplos:
¿Cómo seleccionar y atraer a los clientes más
rentables? (RC)
¿Cómo incrementar el índice de cierre de mi fuerza de
ventas? (RR)
¿Cómo seleccionar puntos de venta más rentables?
(RR)
¿Cómo seleccionar productos/servicios que
maximicen la rentabilidad? (RO)
¿Cómo fijar precios para mi portafolio de
productos/servicios? (RO)
10
11. Lienzo de Osterwalder: Una herramienta para entender el negocio
El lienzo (canvas) del modelo de
negocio de Osterwalder es una
plantilla de gestión estratégica para
desarrollar o documentar modelos de
negocio.
Es un apoyo visual con elementos
que describen la propuesta de valor
de la empresa, los clientes, las
operaciones y las finanzas.
Esta herramienta ayuda a las
organizaciones a alinear sus
recursos, actividades y gente
ilustrando potenciales desventajas.
11
12. ¿Cuáles son los dos KPIs de tu industria?
Banca al menudeo, ejemplos
Cross Sale
Attrition
Fraude
¿Cuáles son los dos KPIs en los que debes superar a tu
competencia?
¿Cuál(es) es(son) la(s) preguntas de negocio
recurrentes?
12
13. Ejercicio
Una vez definido uno o dos KPIs generemos hipótesis:
¿Cuáles son las cosa que influyen positivamente en ellos?
Documentación de hipótesis
¿Quién la emite?
¿Cómo se priorizan?
¿Qué datos necesitamos para contrastarlas?
14. ETENDIMIENTO DE LOS DATOS
¿Existen los datos?
¿Dónde están?
¿Necesito más datos?
15. Sé cuál es la pregunta
Sé la pregunta,
pero no sé que datos necesito para contestarla
Sé que datos necesito,
pero no sé donde encontrarlos
15
16. Tipos y fuentes de datos
16
No
estructurado
Investigación de mercado:
• Cuanti
• Cuali
• CATI
• Planos
• Fotografía
Social Media
Estructurado
POS
SCM-ERP-CRM
Call Center
Survey Monkey/Mail Chimp
INEGI
Otras fuentes indirectas
internacionales
Interno Externo
17. Ejemplo de fuentes de información para un modelo de localización predictiva
Contexto
Infraestructura
Punto de
Venta
Encuestas de
satisfacción
¡Más de 4,500
17
variables!
18. Contexto
Infraestructura
Punto de
Venta
Encuestas de
satisfacción
Foursquare
Con nueva fuente
¡Posibilidad de hacer
sentiment analysis!
18
19. Intergración de datos
¿Qué datos han incluido en sus análisis?
¿Qué datos extras necesitas incorporar para contrastar las hipótesis que has
generado?
19
20. PREPARACIÓN DE LOS
DATOS
¿Cómo obtengo los datos?
¿Me sirven así?
¿Dónde depositarlos?
21. Business Intelligence me permite saber qué pasa pero no necesariamente por qué
Business Intelligence Tradicionalmente un
sistema de business
intelligence se diseña
de arriba a hacia
abajo.
Defino que quiero
saber, extraigo el
dato, hago el cálculo
lo cargo en un
repositorio.
21
Reportes
Tableros de
Control
Business Dataware House (BDW)
Servidor de
Reportes
Alertas
ETL ETL ETL ETL ETL
ERP CRM HRM SCM Otros
22. Un Business Dataware House puede ser útil pero no indispensable
22
Business Analytics En un mundo ideal, la
organización cuenta con
un BDW en el cual existen
los datos necesarios para
responder la pregunta de
negocios.
Pocas veces sucede y si
existe no hay el tiempo de
respuesta requerido
(síndrome del dueño del
kínder).
Los ETL son ejecutados
manualmente a partir de
extracciones a modo.
Modelado con SPPS, SAS, R,…
Archivo plano
Queries
ERP CRM HRM SCM Otros
23. El sueño es contar con un data lake
Business Analytics Dejo de preocuparme de
los ETLs ya que TODOS
los datos, estructurados y
no estructurados estarán
disponibles en el Data
Lake.
La posibilidad de revelar
relaciones relevantes
entre los datos y no
previamente teorizadas
entre los datos se
materializa.
Data Lake
ERP CRM HRM SCM Otros (Ver Data Lake o Data Swamp)
23
Modelado con SPPS, SAS, R,…
ELT ELT ELT ELT ELT
24. Bases de datos en Big Data
El Big Data empezó a estresar el desempeño en empresas como Google y Amazon
haciéndoles evidente que las bases de datos relacionales (SQL) no satisfacían sus
necesidades. Necesitaban mejor desempeño para atender miles de peticiones sobre
una cantidad de datos inmensa, compleja, creciente y distribuida entre miles (millones)
de servidores.
Necesitaban entonces una nueva concepción de bases de datos, esto es, bases de
datos no relacionales (NoSQL), y un nueva arquitectura (Hadhoop) para procesar
eficientemente la información distribuida.
24
Bases de datos relacionales Bases de datos no relacionales
SQL Server, MySQL, Oracle… MongoDB, CouchDB, BigTable…
25. A9.com, AOL, Booz Allen Hamilton,
Eharmony, eBay, Facebook, Fox
Interactive Media, Freebase, IBM,
ImageShack, ISI, Joost, Last.fm,
LinkedIn, Meebo, Metaweb, Mitula15,
The New York Times, Ning,
Rackspace, StumbleUpon16, Tuenti,
Twitter, Veoh, Zoosk, 1&1,
Mercadolibre
¿Necesito Hadhoop?
25
27. Sé cuál es la pregunta
Sé que datos necesito para contestarla
Sé donde encontrarlos
Sé dónde encontrarlos,
pero no sé como procesarlos
27
28. Técnicas de análisis predictivo
Técnicas de regresión Regresión lineal
Series de tiempo
Análisis de
superviviencia
Modelos elección
discreta
Logit
Probit
Árboles
de
decisión
Machine learning Redes neuronales
Modelación
geoespacial
Naïve
Bayes
k-nearest neighbours
28
29. Aplicación de modelación predictiva en gestión de clientes
¿Qué clientes me conviene retener?
¿Cuál es el ciclo de vida de un cliente y cómo podemos ampliar su duración/valor?
¿Qué clientes están por irse y cómo los retengo?
¿Por qué han comprado y cómo lo han hecho?
¿Qué comprarán después?
¿Qué clientes son susceptibles de comprar más
productos?
29
30. Por su volumen de facturación
(agrupación tradicional)
• Poco o ningún entendimiento de motivos
consumo.
• No permite descubrir ciclos de vida
• Acciones comerciales similares para
clientes distintos y planteadas en
escenario
Por su comportamiento histórico (base
para análisis predictivo)
• Patrones de consumo claramente
identificados y segmentados
• Potencial de los clientes medido en
función de su segmento, no del total
• Ciclos de vida son evidentes por segmento
• Acciones individualizadas y proactivas en
función de modelos predictivos
Descriptiva Vs Predictiva
30
31. Objetivo y los modelos de segmentación
Campañas iguales a clientes
parecidos
Predicción certera de:
• Up-sale
• Cross-sale
• Churn
• Default
Cada grupo de clientes tiene que ser significativamente
distinto que los otros
Cada cliente dentro de un grupo debe ser significativamente
similar con los otros miembros del grupo
de clientes
31
33. Sé cuál es la pregunta
Sé que datos necesito para contestarla
Sé donde encontrarlos
Sé como procesarlos
¿Tengo la respuesta adecuada?
33
34. Evaluación del modelo
No es indispensable esperar
eventos futuros para determinar la
precisión de nuestros modelos.
El procedimiento cruzado nos
permite validar con los mismos
datos que tenemos ahora.
34
Datos
(y1, x1),…(yn, xn)
Estimación Prueba
Datos
entrenamiento.
Todos los datos
salvo (yk, xk))
Datos de prueba
(yk, xk))
Predicción
Repetir para cada k
35. Contrastación del modelo con la realidad
35
R2=0.92 Modelo estadístico de pronóstico
900
800
700
600
500
400
300
200
100
0
0 100 200 300 400 500 600 700 800 900
Venta mensual Real
Mínimo de ventas
deseado
Venta pronosticada dada la ubicación (venta mensual promedio)
36. No sólo debe ser preciso, debe tener sentido económico (de negocio)
“La producción pesquera explica muy bien
la venta de cerveza”
“Pon la próxima cafetería al lado de una
agencia Bentley”
36
38. Sé cuál es la pregunta
Sé que datos necesito para contestarla
Sé donde encontrarlos
Sé como procesarlos
Tengo la respuesta adecuada
¿Cómo sacarle provecho
a lo aprendido?
38
39. Plan de despliegue
¿Qué procesos de negocio
serán modificados/implantados?
¿Qué reglas de negocio serán
alteradas o introducidas?
¿En qué tecnologías será
desplegado?
¿Qué nuevas habilidades serán
necesarias?
¿Cómo manejar el cambio?
39
Procesos
Tecnología
Gente
40. Herramienta tecnológica de soporte a compra de calzado
Sistema de soporte
predictivo para la compra
(SSPC)
• Predice el comportamiento de
un producto a partir de sus
características
• Facilita la labor de recompra
luego de las dos primeras
semanas de venta
40
41. Modificación en el proceso de decisión inmobiliaria
Presentación
de ubicación
disponible
Definición de
infraestructura
Visita a campo
y estimación
de venta
Caso de
negocio a
considerar
41
Búsqueda
proactiva
en AGEBs
con mayor
potencial
Estimación
de venta
preliminar
Estimación
de venta
final con
certeza de
entre el 94
y el 96%
Proceso
anterior
Modificaciones
al proceso
Mejora del hit rate (número de tiendas arriba del objetivo) pasó del 62% al 79%
42. Qué se hizó con
42
900
800
700
600
500
400
300
200
100
0
Modelo estadístico de pronóstico
Bien ubicadas,
mal desempeño
0 100 200 300 400 500 600 700 800 900
Venta mensual real
R2=0.92
Mala ubicación y
mal desempeño
Los esfuerzos
de apoyo no
eran rentables
Se aplicaron
prácticas que
se pueden
replicar
Venta pronosticada dada la ubicación (venta mensual promedio)
Mínimo de ventas
deseado
43. Rueda Test and Learn
43
2
Detalle
operativo
de la
prueba
3
Diseño de
la prueba
4
Ejecución y
evaluación
5
Ajuste y
reglas de
despliegue
1
Crear y
refinar
hipótesis
6
Despliegue
Adaptado de Applied Predictive
Technologies “Test and Learn
Wheel”
Biblioteca
de
aprendizaj
e
44. Big Data Analytics
La velocidad, variedad y volumen en la que hoy se genera la información puede generar
un reto abrumador para las empresas que deseen enriquecer su toma de decisiones y
mejorar sus procesos a través de la analítica predictiva.
jperezcolin@bdatascience.com
www.bdatascience.com
44
Hinweis der Redaktion
Soy un economista, tecnólogo y académico centrado en ayudar a las empresas, los ejecutivos y los empresarios a hacer frente a retos de negocio a través estrategias pragmáticas de análisis y operación.Hoy soy socio de Business Data Scientists (BDS) empresa dedicada a invertir y desarrollar en empresas especializadas en Big Data Analytics en la región. Las empresas de BDS se enfoca en ayudar a sus clientes en obtener beneficios económicos de la información oculta en los datos de las empresas a través de metodologías y tecnologías de la ciencia de datos. Nuestros clientes son empresas globales de bienes de consumo envasados (CPG), empresas en los sectores de telecomunicaciones y finanzas, entre otras.Soy consejero editorial de la revista InformationWeek México. He colaborado con la revista en el diseño y la ejecución del premio 50 Empresas más Innovadoras. También soy miembro fundador de la Asociación de Gestión de Desarrollo de Productos de México PDMA y consejero independiente de la empresa Praxis.He dado consultoría a Oracle y Microsoft ayudándoles a entender y servir mejor a sus clientes clave, a través de prácticas de alineación estratégica de las tecnologías de información a los negocios..Fui coordinador del Centro de Estudios Económicos de la Universidad de las Américas -Puebla.Había sido profesor visitante de Dirección de Tecnología de Información en el PAD Escuela de Negocios, Perú e INALDE Business School, Colombia .Sostuve la posición de CIO del IPADE Business Shool y fui profesor de Entorno Económico de la misma escuela durante 3 años. Hoy soy profesor en el Master en Internet Business (MIB ) del ISDI, una red académica y profesional para las empresas digitales en México y España.
El crecimiento exponencial en la generación de datos se puede explicar en el surgimiento sucesivo de tres generadores de datos:
Desde la entrada de los mainframes (granes computadoras centrales) a las empresas y hasta la popularización del cómputo personal (inclusive) los generadores de datos fueron predominantemente capturistas
Con la entrada de la web, acelerado por el Web 2.0 y potenciado por el cómputo móvil, son los datos que generan los usuarios los de mayor crecimiento
Ahora las máquinas empiezan a hablar con otras máquinas, lo que producirá muchos más datos de los que podremos almacenar y analizar
Un exabyte es una unidad de medida de almacenamiento de datos cuyo símbolo es el 'EB', equivale a 1018 bytes
1 EB = 103 Petabyte (PB) = 106 Terabyte (TB)
15 TB es el contenido total de la Biblioteca del Congreso de los Estados Unidos.
Fuentes: Wikipedia; Data, data everywhere: A special report on managing information, The Economist 27 de febrero 2010; Patrick Schwerdtfeger What is Big Data? Big Data Explained (Hadoop & MapReduce)
Retos:
Aprovechar inversiones en infraestructura de TI
Integrar fuentes distintas de datos del negocio para tomar decisiones equilibradas
Dar sentido estratégico a los esfuerzos de recolección, análisis y aplicación de datos
Maximizar la conversión de estos esfuerzos en rentabilidad: monetizar el valor de los datos del negocio
Business Analytics (BA) hace uso extensivo e intensivo de datos, análisis estadístico y cuantitativo y modelaje explicativo y predictivo. Por lo tanto está más relacionado con la ciencia administrativa. La analítica se usa tanto como insumo para las decisiones humanas o para ser usada en procesos automatizados. Business Intelligence es consulta (querying), On-line Analytical Processing (OLAP), reporteo, y alertas.
En otras palabras, querying, reporteo, OLAP y las herramientas de alertas pueden contestar preguntas como qué es lo que pasó, cuánto, qué tan frecuente, dónde está el problema y qué acciones son necesarias. BA puede contestar preguntas como por qué esta pasando, qué si estas tendencias continúan, qué es lo que puede pasar después (esto es, predecir) y qué es lo mejor que puede pasar (esto es, optimizar).
CRISP-DM , de Cross Industry Standard Process for Data Mining. Se trata de un modelo de proceso de minería de datos que describe los enfoques comunes que utilizan los expertos en minería de datos. Encuestas realizadas en 2002, 2004 y 2007 muestran que es la principal metodología utilizada para esta tarea. El único otro estándar de data mining nombrado en estas encuestas era el SEMMA. No obstante, 3-4 veces más personas reportaron optar por CRISP-DM. Una revisión y crítica de los modelos de minería de datos en 2009 llamó a CRISP-DM el "estándar de facto para el desarrollo de la minería de datos y los proyectos de descubrimiento de conocimiento“.
CRISP-DM divide el proceso de minería de datos en seis fases principales
Las flechas en el diagrama indican las dependencias más importantes y frecuentes entre fases. El círculo exterior en el diagrama simboliza la naturaleza cíclica de la minería de datos en sí. Un proceso de minería de datos continua después del despliegue de una solución. Las lecciones aprendidas durante el proceso pueden provocar nuevas preguntas de negocio, a menudo más centradas y posteriores procesos de minería de datos se beneficiarán de la experiencia de los anteriores.
Fuente:ibm.com
Acrónimos de abajo hacia arriba:
ERP. Los sistemas de planificación de recursos empresariales, o ERP (por sus siglas en inglés, Enterprise Resource Planning) son sistemas de información gerenciales que integran y manejan muchos de los negocios asociados con las operaciones de producción y de los aspectos de distribución de una compañía en la producción de bienes o servicios.
CRM. Software para la administración de la relación con los clientes o CRM(por sus siglas en inglés, Customer Resource Management). Sistemas informáticos de apoyo a la gestión de las relaciones con los clientes, en el mercadeo, la venta y el servicio post-venta.
HRM. Los sistemas de gestión de recursos humanos, o HRM (por sus siglas en inglés, Human Resource Management) son los sistemas de información que integran y gestionan la atracción, selección, capacitación, remuneración y retención del capital humano.
SCM. La administración de redes de suministro (en inglés, Supply chain management, SCM) es el sistema que gestiona el proceso de planificación, puesta en ejecución y control de las operaciones de la red de suministro con el propósito de satisfacer las necesidades del cliente con tanta eficacia como sea posible.
ETL. Extract, Transform and Load (Extraer, transformar y cargar en castellano, frecuentemente abreviado a ETL) es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio.
Business Intelligence. Se denomina inteligencia empresarial, inteligencia de negocios o BI (del inglés business intelligence) al conjunto de estrategias y llaves enfocadas a la administración y administración de conocimiento sobre el medio, a través del procesamiento de los datos existentes en una organización o empresa.
Fuente: Wikipedia
Según algunas estimaciones, Google puede contar a la fecha con más de 2 millones de servidores alrededor del mundo. El número oficial es un secreto industrial.
SQL no es el tipo de bases de datos, en este caso relacionales. SQL se refiere a una de las maneras en las que se accede a los datos en bases de datos relacionales. SQL no es usado para bases de datos no relacionales, por eso se sí se usa indistintamente NoSQL para llamar a las bases de datos no relacionales.
Apache Hadoop es un framework de software que soporta aplicaciones distribuidas bajo una licencia libre.[1] Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Hadoop se inspiró en los documentos Google para MapReduce y Google File System (GFS).
Fuentes: http://slashdot.org/topic/bi/sql-vs-nosql-which-is-better/
http://es.wikipedia.org/wiki/Hadoop
Muy probablemente tu empresa no necesita Hadhoop o bases de datos no relacionales. Y lo más importante: no es indispensable para Analytics.
http://web.anglia.ac.uk/numbers/graphsCharts.html
Problema. Empresa líder de venta al menudeo de zapatos tenis pierde consistentemente margen bruto debido mala predicción de la rotación de modelos no resurtibles que lo lleva a perder ventas por pedir de menos o hacer descuentos por pedir de más.
Solución. Modelo predictivo para:
Sistema de soporte predictivo de compra (SSPC) (mostrado en la lámina)
Modelo de sembrado (assortment por tienda)
Modelo de descuentos y regreso a Centro de Distribución
Modelo de predicción de ventas
Índice de éxito de las tiendas
Tecnología y procesos analíticos:
Se extrajeron los datos de SAP R/3 mediante querys de SQL Server para generar tablas planas CSV al máximo nivel de detalle, se cargaron y prepararon en Netezza y se analizaron en SPSS a diferentes niveles dependiendo del análisis y modelación requerido.
Cross Industry Standard Process for Data Mining (CRISP-DM).
Modelos de series de tiempo, modelos multiplicativos de desestacionalización, modelo multivariado de árbol de decisión y regresiones lineales múltiples.
IBM SPSS, IBM Netezza, MS Visual Basic y MS Excel
Beneficios:
Aumento en poder de negociación sobre Nike y Puma. Predicciones con más del 90% de certeza. Mejora de margen bruto
Problema. En una gran cadena de cafeterías no se estaba llegando al objetivo de negocio (hit rate) en un porcentaje relevante de ubicaciones.
Solución. Modelo de localización predictiva y nuevo proceso inmobiliario al incorporar los resultados del modelo. El proceso inmobiliario era totalmente reactivo, esto es, esperaban que los profesionales inmobiliarios trajeran a la mesa locales disponibles con el inherente conflicto de intereses (el buscador decía que era una muy buena ubicación). En el nuevo proceso se establece un listado ordenado (de mayor venta potencial a menor) de Áreas Geostadísticas Básicas sobre el que se solicita a los profesionales inmobiliarios a hacer la búsqueda.
El modelo genera un pronóstico de ventas son más de 94% de certeza.
El nuevo proceso incorpora no sólo la demanda disponible sino la venta esperada de acuerdo a la infraestructura.
Beneficio. El modelo mejoró en casis 17 puntos porcentuales el hit ratedesplegar mejorando la certeza del caso de negocio al mejorar el pronóstico de ventas hasta alcanzar más del 94%.
Área Geoestadística Básica (AGEB). Subdivisión de los municipios o delegaciones que conforman el país, utilizada por primera vez en el X Censo General de Población y Vivienda 1980. Su utilidad radica en permitir la formación de unidades primarias de muestreo y la organización de la información estadística. Tiene tres atributos fundamentales: a) es perfectamente reconocible en el terreno por estar delimitada por rasgos topográficos identificables y perdurables; b) por lo general es homogénea en cuanto a sus características geográficas, económicas y sociales; c) su extensión es tal que puede ser recorrida por una sola persona. Las AGEB se clasifican en más y menos urbanizadas, dependiendo de su densidad de viviendas.