Presentacion Datos estadisticos, mediante textos, tablas y graficas, Barras simples, agrupadas, pictogramas, Histogramas, piramides, Graficos de linea de dispersion, Caja de Bigotes !
1. Presentación de datos estadísticos
PRESENTACIÓN DE DATOS
Hay tres formas básicas para el resumen y presentación de información acerca de
mediciones efectuadas sobre objetos, personas, períodos de tiempo, etc. Y aplicables tanto a
datos continuos como a datos discretos: presentación de datos mediante texto, mediante tablas y
mediante gráficos, que se combinan generalmente para lograr mayor claridad, transparencia e
interpretabilidad de la información.
PRESENTACIÓN DE DATOS MEDIANTE TEXTO
Se hace una descripción narrativa de la información. Las dos formas más comunes de la
presentación textual de la información comprenden a:
Presentación de todos y cada uno de los datos obtenidos,
Para lo cual se presenta un pequeño párrafo que explica el origen de los datos y a
continuación la “nube de datos”.
Presentación de datos en forma resumida mediante porcentajes o
promedios.
Es una forma adecuada de presentación cuando la cantidad de valores o porcentajes que
se pretenden ilustrar corresponden a situaciones interesantes que se pueden mostrar con
pocos datos.
Los datos se presentan en tablas, graficas y medidas resumen.
PRESENTACIÓN DE DATOS MEDIANTE TABLA
Si el volumen de la información es grande y no parece conveniente una presentación
textual, la mejor alternativa consiste en la presentación de datos por medio de tablas. Una tabla se
define como un arreglo ordenado de filas y columnas, clasificadas según el propósito y el tipo de
datos que se presenten.
La tabla debe tener titulo e información clara y concisa.
Parte de una tabla
Título
El titulo debe ser breve pero completo, además de corresponder exactamente a lo que se
está presentando en la tabla.
2. Cuerpo de la tabla
Lo componen las diferentes filas y columnas con sus correspondientes encabezamientos.
Para tablas de más de una variable, además de presentar la información univariada, se presentan
la distribución de frecuencias relativas por filas y columnas.
Distribución de frecuencias absolutas
Es una columna en la tabla que muestra el número de observaciones en categorías o clase
de una variable.
Distribución de frecuencias relativas
La frecuencia relativa de una clase o categoría de una variable es el número de
observaciones que caen dentro de ella, expresada como una porción del número total de datos.
Esta frecuencia se expresa mediante porcentajes o proporciones.
Distribución de frecuencias absolutas y relativas acumuladas
Son columnas en la tabla que muestran la distribución de frecuencias absolutas y relativas
acumuladas según el orden implícito de la variable. Las frecuencias se van acumulando, la última
categoría tendrá por valor acumulado la totalidad de las observaciones en el caso de frecuencias
absolutas y el valor 100% en el caso de frecuencias relativas.
Distribución de frecuencias absolutas y relativas acumuladas
Es una distribución de frecuencias relativas construida según el valor de la fila o columna
respectiva.
Notas explicativas
Pueden ser de encabezamiento, subtítulos o de pie de tabla.
Presentación de datos cuantitativos mediante tablas
Cuando se pretende presentar los datos de una variable continua mediante una tabla, la
primera tarea consiste en determinar el criterio usado para construir las clases o categorías de la
variable.
Sturges: Esta metodología consiste en la construcción de intervalos de igual amplitud,
donde la amplitud de cada clase se calcula como (Max-Min)/k, siendo k el número de intervalos,
que se calcula reemplazando el tamaño de la muestra n en la siguiente expresión:
K= 1+3.322 log10 (n)
Scott: En esta aproximación sugiere la construcción de intervalos de igual amplitud, donde
la amplitud está dada por la siguiente expresión, siendo s la desviación estándar:
H= (3.5)s(n)-1/3
3. Diaconis: Este criterio es análogo al propuesto por Scott en 1979. La amplitud está dada
por la siguiente expresión, siendo RI el rango intercuartílico.
H= 2(RI)(n)-1/3
Presentación de datos mediante tabla de dos dimensiones
Con frecuencia en la presentación de tablas de dos dimensiones se tiene como objetivo
principal la evaluación de la asociación entre una variable independiente (factor de exposición) y
una variable respuesta (desenlace). Por convención, se acostumbra ubicar la variable respuesta en
las columnas y la variable independiente en las filas.
Más de dos variables en una tabla la hacen pesada y difícil.
Recomendaciones acerca del uso de tablas
Cuando se tiene sólo una variable o criterio de clasificación, se acostumbra ubicar las
clases o categorías de la variable en la primera columna.
Debe evitarse en lo posible tablas con más de dos variables.
PRESENTACIÓN DE DATOS MEDIANTE GRÁFICOS
Un gráfico es un dibujo descriptivo que sirve para dar una idea visual y rápida del
comportamiento de un fenómeno o situación. Básicamente un gráfico es la representación de una
tabla mediante diagramas y se constituye, de forma general, de las mismas partes, adaptadas para
este tipo de presentación.
El comportamiento y la relación entre las variables se evalúan con gráficos.
Tipos de gráficos
Barras y pictograma
Es utilizado especialmente para representar variables cualitativas nominales y ordinales, y
cuantitativas discretas.
El gráfico de barras es popular por ser fácilmente comprensible.
Barras simples
En el eje horizontal del plano cartesiano se representan las modalidades o categorías que
toma la variable mediante barras de igual base y en el eje vertical se presenta la frecuencia
absoluta o la frecuencia relativa.
Barras agrupadas
4. El grafico de barras agrupadas se emplea para comparar varias poblaciones entre sí. Para
cada categoría que toma la variable se elevan tantas barras como poblaciones haya, cada una con
un color representativo.
Pictograma
Las frecuencias de las categorías de la variable se representan por dibujos alusivos al tema
de estudio.
Diagrama de torta o pie
Este gráfico se emplea para variables cualitativas nominales y ordinales. Para su
construcción se divide un círculo en tantas porciones como niveles tome la variable, de modo que
a cada nivel de la variable de corresponde un arco de círculo proporcional a su frecuencia absoluta
o relativa. Este tipo de gráfico se utiliza para destacar la importancia relativa de los niveles o
categorías dentro de un total.
Los diagramas de torta (pie) inclinados son inapropiados.
La tridimensionalidad en los gráficos distorsiona los datos.
Histograma y polígono de frecuencias
Histograma de frecuencias
Es un grafico utilizado para representar distribuciones de frecuencia de variables
cuantitativas continuas. Las barras deben ir siempre verticales pegadas una a otra. Sobre el eje
horizontal se representa la frecuencia absoluta o relativa.
Las variables continuas se ven bien con histogramas.
Polígono de frecuencia
El polígono de frecuencias es semejante al histograma, pero se usa cuando se quiere
comparar las distribuciones de una misma variable continua en dos o más poblaciones.
Diagrama de “Tallo y Hoja” (Stem and Leafplots)
Este es un método gráfico para representar la distribución de datos cuantitativos. Se trata
de un método rápido, sencillo y efectivo de mostrar la distribución de un conjunto de datos
usando para su representación la información original.
El diagrama de tallo y hoja describe bien y en detalle.
Pirámides poblacionales
Son una forma especial de histograma en la que se representa simultáneamente la
distribución por edad y sexo de una población. Estos histogramas (en realidad son 2, uno para
cada sexo) se dibujan verticalmente, las barras quedan horizontales pero antepuestas unas a
otras.
5. La pirámide de edad por sexos es una excelente opción.
Gráfico de caja y bigote (Box plot)
También conocido como box plot o diagrama de caja, es una representación gráfica de un
conjunto de datos o valores de una variable discreta o continua, para facilitar la percepción visual
de su localización, dispersión y del grado y la dirección del sesgo. También permite identificar
datos atípicos o extremos.
El gráfico de caja y bigote es muy completo y claro.
Algunos gráficos usados en métodos multivariados
En esta sección se hace una descripción de algunas de las graficas que ofrecen una alternativa para
el manejo de la presentación de dos o más variables simultáneamente.
Gráfico de dispersión
El gráfico de dispersión se emplea con variables de tipo cuantitativo. Este tipo de gráfica
ofrece una forma útil de ilustrar la relación entre dos variables.
Gráfico de línea
En general se usa para representar series en el tiempo o series de datos de tipo
cuantitativo.
La relación de dos variables se grafica con dispersión y líneas.
Caras de Chernoff
Estos gráficos se usan principalmente para caracterizar o perfilar un conjunto de
individuos, elementos u objetos a través de varias variables.
Gráfico de estrella
Cada observación se representa por una estrella en la que cada una de sus puntas
representa una variable. Para una observación específica, la punta se sitúa a una longitud del
centro que sea proporcional al valor de la variable que se está representando.
Para graficar más de dos variables hay múltiples opciones.
Matriz de dispersión
Las respuestas pueden ser exploradas inicialmente mediante la utilización de varios
gráficos de dispersión. Consiste en un arreglo de filas y columnas en cuya intersección se
encuentra el gráfico de dispersión correspondiente a dos variables.
La matriz de dispersión es útil en graficar regresión lineal múltiple.
6. Recomendaciones para el uso de gráficos
Los gráficos son la forma de presentación de datos más expresiva y tiene como objetivo
lograr comunicación rápida de situación, evolución o tendencia, enfatizar ciertas relaciones o
resaltar situaciones importantes, confusas o complejas.
La clasificación y nivel de medición determinan el gráfico.