1. UNIVERSIDAD INDUSTRIAL DE SANTANDER
ESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES
Perfecta Combinación entre Energía e Intelecto
CASO1.2 ESTADÍSTICA
Organización de Datos
Julián David Gamboa García (Líder), Ronald Andrés Rengifo Mejia (Asegurador), Jorge Andrés
Moreno Lozada (Planificador), José David Gómez (control).
Grapa: 7 Nombre: R3J Grupo: H1.
Actividad: Caso 1.2; Organización de Datos
Módulo 1.2, Estadística descriptiva
Lección 1.2, Conferencia 2.
Docente: Ricardo Llamosa Villalba. Jueves 14 de Junio del 2012.
1. INTRODUCCIÓN:
b.) Instrumentos de medición: son los recursos que
La estadística es una ciencia que estudia la utiliza el investigador para obtener información o
recolección, el análisis y la interpretación de datos. datos de algunas variables que el tiene en estudio.
Pero una parte muy importante de este proceso de
análisis y de interpretación de los datos es la C.) Medición: El proceso de asignar un valor
organización. El tener los datos organizados de una numérico a una variable se llama medición. Las
escalas de medición sirven para ofrecernos
manera u otra nos permite ver de una manera más
información sobre las clasificaciones que podemos
fácil tendencias y comportamientos de los datos. La hacer con respecto a las variables (discretas o
organización es uno de los aspectos más continuas). Cuando se mide una variable el resultado
significativos en el análisis estadístico, nos facilita el puede aparecer en uno de cuatro diversos tipos de
trabajo y nos permite llevarlo a cabo de una manera escalas de medición; nominal, ordinal, intervalo y
más eficiente. En este informe pretendemos exponer razón. Conocer la escala a la que pertenece una
en cierta manera los métodos de organización medición es importante para determinar el método
adecuado para describir y analizar esos datos
aprendidos en el material del curso, hablar un poco
de las tablas de datos, mostrar ciertas propiedades
3. CASOS TRATADOS EN LOS
que podemos sacar de los datos y que nos ayudan en
RECURSOS DIDÁCTICOS.
su organización, y ¿por qué no? Aplicar todo esto a
un ejemplo en concreto que nos permita ver a lo que
se quiere llegar. a. Caso 1: Una empresa decide medir el grado de
aceptación de 10 clientes sobre un nuevo producto,
2. ASPECTOS TEÓRICOS: que hace muy poco tiempo salió al mercado; para
ello, utilizarán una tabla que se caracteriza por
a.) Tabla de frecuencia: es una tabla en la que se manejar un conjunto pequeño de posibles resultados
organizan los datos en clases, es decir, en grupos de de una variable dentro de la muestra o población, y
valores que escriben una característica de los datos y además los clientes tendrán para elegir o calificar de
muestra el número de observaciones del conjunto de la siguiente manera: muy malo, malo, regular, bueno
datos que caen en cada una de las clases. y excelente.
La tabla de frecuencias ayuda a agrupar cualquier b. Caso 2: Se muestra un sondeo realizado en la
tipo de dato numérico. En principio, en la tabla de Universidad de Cartagena sobre 30 alumnos, que
frecuencias se detalla cada uno de los valores son estudiantes de Administración Industrial, lo que
diferentes en el conjunto de datos junto con el se pretende es mostrar que edad es la mas
número de veces que aparece, es decir, su frecuencia representativa; se muestra una serie de edades, para
absoluta. Se puede complementar la frecuencia ello se utilizara una tabla la cual suelen ser utilizadas
absoluta con la denominada frecuencia relativa, que cuando el numero de resultados posibles que puede
indica la frecuencia en porcentaje sobre el total de obtener una variable son muy amplios.
datos.
2. UNIVERSIDAD INDUSTRIAL DE SANTANDER
ESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES
Perfecta Combinación entre Energía e Intelecto
4. RESPUESTA A LA PREGUNTA DE
CASOS. IV. Revise el material que aparece en RD y
cerciórese de que en la sección de Aspectos
teóricos de su documento a entregar se encuentre
la definición de los siguientes conceptos, y para
I. ¿Qué es y como se relacionan los conceptos de cada uno de estos resuelva las preguntas
medición, ajuste y calibración?
La medición es una recolección de medidas, de un a) Medidas de tendencia central
conjunto de datos, que se hace teniendo en cuenta
un patrón o un parámetro estadístico, es decir, la Medidas de tendencia central: Son indicadores
relación que guardan las dimensiones de los datos estadísticos que muestran hacia que valor (o valores)
que estamos midiendo, con el parámetro. El ajuste se agrupan los datos.
de esos datos que obtenemos de la medición al
parámetro, nos da una idea de las dimensiones
posibles de los datos. Media aritmética (µ o X): Es el valor resultante que
se obtiene al dividir la sumatoria de un conjunto de
datos sobre el número total de datos. Solo es
II. Defina los siguientes términos con ayuda de los aplicable para el tratamiento de datos cuantitativos.
videos: X = Suma (xi) / N
a) Frecuencia relativa: equivale a la razón de la Mediana (Me): Valor que divide una serie de datos
frecuencia de cada clase sobre el total de datos. en dos partes iguales. La cantidad de datos que
H1=f1/n queda por debajo y por arriba de la mediana son
b) Frecuencia Absoluta: numero de veces q se iguales.
repite un valor dentro de un conjunto de datos
c) Marca de clase: son las equivalente del punto
medio de cada intervalo de clase Moda (Mo): indica el valor que más se repite, o la
d) Amplitud de clase: este es el ancho y este clase que posee mayor frecuencia.
equivale a diferencia entre el límite superior y el
límite inferior de cada intervalo b) Medidas de dispersión
e) Rango: es le valor de la resultante entre La
distancia máxima menos la distancia mínima
ajustada a los datos q se van a tratar. Nos informan sobre cuánto se alejan del centro los
f) Límites de las clases (Superior e inferior): valores de la distribución.
Limite inferior: valor mínimo ajustado a los datos
tratados y el límite superior es la suma del ancho y el El rango: Es la diferencia entre el mayor y
límite menor de los datos ajustados y tratados. el menor de los datos de una distribución estadística.
g) Intervalos de clase: intervalos empleados en las
tablas de frecuencia estadística, los cuales contienen
diversas medidas de una variación. La desviación respecto a la media: Es
la diferencia entre cada valor de la variable
estadística y la media aritmética.
III. ¿Qué son las tablas de frecuencias y qué
función cumplen? Di = x – x
Tabla de frecuencias: es una ordenación en forma
de tabla de los datos estadísticos, asignando a cada La desviación media es la media aritmética de
dato su frecuencia correspondiente. los valores absolutos de las desviaciones respecto a
la media.
Su función: es sintetizar conjuntos de datos
mediante tablas o gráficos resumen, con el fin de La desviación media se representa por
poder identificar el comportamiento característico de
un fenómeno y facilitar su análisis exhaustivo.
3. UNIVERSIDAD INDUSTRIAL DE SANTANDER
ESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES
Perfecta Combinación entre Energía e Intelecto
Desviación media para datos agrupados Propiedades de la varianza
Si los datos vienen agrupados en una tabla de i. La varianza será siempre un valor positivo o cero,
frecuencias, la expresión de la desviación media es: en el caso de que las puntuaciones sean iguales.
ii. Si a todos los valores de la variable se
les suma un número la varianza no varía.
iii. Si todos los valores de la variable se multiplican
por un número la varianza queda multiplicada por el
cuadrado de dicho número.
iiii. Si tenemos varias distribuciones con la
misma media y conocemos sus
respectivas varianzas se puede calcular la varianza
Varianza: La varianza es la media aritmética del total.
cuadrado de las desviaciones respecto a la media de
una distribución estadística. Desviación típica: La desviación típica es la raíz
cuadrada de la varianza.
La varianza se representa por .
Es decir, la raíz cuadrada de la media de los
cuadrados de las puntuaciones de desviación.
La desviación típica se representa por σ.
Varianza para datos agrupados
Desviación típica para datos agrupados
Para simplificar el cálculo de la varianza vamos o
utilizar las siguientes expresiones que son
equivalentes a las anteriores.
Propiedades de la Desviación Típica:
i. La desviación típica será siempre un valor positivo
o cero, en el caso de que las puntuaciones sean
Varianza para datos agrupados iguales.
ii. Si a todos los valores de la variable se
les suma un número la desviación típica no varía.
iii. Si todos los valores de la variable
se multiplican por.un número la desviación
típica queda multiplicada por dicho número.
iiii. Si tenemos varias distribuciones con la
misma media y conocemos sus
respectivas desviaciones típicas se puede calcular
la desviación típica total.
4. UNIVERSIDAD INDUSTRIAL DE SANTANDER
ESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES
Perfecta Combinación entre Energía e Intelecto
Distribución platicúrtica: Presenta un reducido
c) Medidas de forma grado de concentración alrededor de los valores
centrales de la variable.
Comparan la forma que tiene la representación
gráfica, bien sea el histograma o el diagrama de
barras de la distribución, con la distribución normal.
Medida de asimetría
Diremos que una distribución es simétrica cuando su
mediana, su moda y su media aritmética coinciden.
Diremos que una distribución es asimétrica a la
derecha si las frecuencias (absolutas o relativas)
descienden más lentamente por la derecha que por la d) Medidas de posición
izquierda.
Las medidas de posición dividen un conjunto de
Si las frecuencias descienden más lentamente por la datos en grupos con el mismo número de individuos.
izquierda que por la derecha diremos que la
distribución es asimétrica a la izquierda. Para calcular las medidas de posición es necesario
Existen varias medidas de la asimetría de una que los datos estén ordenados de menor a mayor.
distribución de frecuencias. Una de ellas es Las medidas de posición son:
el Coeficiente de Asimetría de Pearson:
Cuartiles: Los cuartiles son los tres valores de la
variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales. Q1, Q2 y
Su valor es cero cuando la distribución es simétrica, Q3 determinan los valores correspondientes al 25%,
positivo cuando existe asimetría a la derecha y al 50% y al 75% de los datos.Q2 coincide con
negativo cuando existe asimetría a la izquierda. la mediana.
i. Ordenamos los datos de menor a mayor.
ii Buscamos el lugar que ocupa
cada cuartil mediante la expresión.
Deciles: Son ciertos números que dividen la
sucesión de datos ordenados en diez partes
Medida de apuntamiento o curtosis porcentualmente iguales. Son los nueve valores que
dividen al conjunto de datos ordenados en diez
Miden la mayor o menor cantidad de datos que se partes iguales. Se halla por medio de:
agrupan en torno a la moda. Se definen 3 tipos de
distribuciones según su grado de curtosis:
Distribución mesocúrtica: Presenta un grado de
concentración medio alrededor de los valores
centrales de la variable (el mismo que presenta una
distribución normal).
Los Percentiles: Son tal vez las medias más
Distribución leptocúrtica: Presenta un elevado utilizadas para propósitos de ubicación o
grado de concentración alrededor de los valores clasificación de las personas cuando atienden
centrales de la variable. características tales como peso, estatura, etc. Los
percentiles son ciertos números que dividen la
5. UNIVERSIDAD INDUSTRIAL DE SANTANDER
ESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES
Perfecta Combinación entre Energía e Intelecto
sucesión de datos ordenados en cien partes ¿Qué formula usa Excel para calcularlas? Para
porcentuales iguales. De halla por medio de: esto utilice la ayuda del programa.
e) Regresión lineal y correlación
La Regresión lineal Comprende el análisis de los
datos muéstrales para saber qué es y cómo se
relaciona entre si dos o más variables en una
población. El análisis de correlación produce un
número que resume el grado de la correlación entre
dos variables; y el análisis de regresión da lugar a
una ecuación matemática que describe dicha
relación. Se pueden encontrar varios tipos de
regresión:
- Regresión lineal: y= A+ Bx.
- Regresión Logarítmica: y= A + B(ln(x))
-Regresión exponencial: y= Ac(bx)
- Regresión cuadrática: y= A+ Bx +Cx2
Correlación: método por el cual se relacionan dos
variables se puede graficar con un diagrama de
dispersión de puntos, a la cual se le llama nube de
puntos, encuadrado dentro de u grafico de
coordenadas XY en el cual se puede trazar una recta
y cuyos puntos más cercanos de una recta hablara de
una correlación más fuerte. Devuelve la mediana de los números. La mediana es
el número que se encuentra en medio de un conjunto
de números, es decir, la mitad de los números es
mayor que la mediana y la otra mitad es menor.
V. Resuelva lo siguiente:
¿Qué medidas se nombran en los videos?
Medida de tendencia central: media aritmética, Devuelve el valor que se repite con más frecuencia
mediana y moda. Medidas de dispersión: Desviación en una matriz o rango de datos. Al igual que
estándar, varianza. Mediadas de posición: Cuartiles, MEDIANA, MODA es una medida de posición.
deciles, percentiles. Apuntamiento o curtosis,
asimetría o deformación.
5. PREGUNTAS QUE SURGEN DEL
CASO:
¿Cuáles de las medidas que se mencionaron
anteriormente se pueden calcular con Excel?
¿Donde podemos concluir que el trabajo de una
Promedio, mediana, moda, Desviación estándar y tabla de frecuencia es de total efectividad?, o por lo
varianza. contrario, ¿debemos apoyarnos de otro tipo de
tabulación de datos, para dar una mayor veracidad al
análisis?
6. UNIVERSIDAD INDUSTRIAL DE SANTANDER
ESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES
Perfecta Combinación entre Energía e Intelecto
6. CONCLUSIONES. 8. PREGUNTAS ENTRE PARES NO
RESUELTAS:
Después de haber visto el video de apoyo didáctico,
lo que se nos enseña allí es una unos casos, en los Todas las preguntas que surgieron fueron respuestas
cuales, van hacer resumidos los datos y se logra a entre las parejas.
través de las tablas de frecuencia; en la cual, se
organizan los datos en clases, es decir, en grupos de
valores que escriben una característica de los datos y 9. BIBLIOGRAFÍA.
muestra el número de observaciones del conjunto de
datos que caen en cada una de las clase. [1] W. H. Freeman and Company, New York
and Basingstoke, Probabilidad y estadística. La
ciencia de la incertidumbre, EDITORIAL
7. VALORACIÓN ENTRE PARES
REVERTÉ, S.A.: Barcelona, España.
Habiendo visto los mostrados en el video nos damos [2] Descripción de términos
http://www.youtube.com/watch?
cuenta que gracias a las tablas de frecuencia
v=BetmKeqtsSk&feature=related
logramos hacer una mejor organización de los datos, [3] Procedimiento para una tabla de frecuencias:
para cuando llegue la hora de analizarlos, se facilite http://www.youtube.com/watch?v=JSDu6TomZ6g
el tratamiento de los mismos, y se haga de la mejor [4] Medición de la estadística:
manera el comprendimiento real de la situación que http://es.wikiversity.org/wiki/Medici
se nos presente. %C3%B3n_en_estad%C3%ADstica.
MIEMBRO/ ESTUDIANTE ROL FECHA
CICLO DE VIDA 1
RESPONSABLE
ASEGURADOR Y
CONTROLADOR
MÓDULO
LECCIÓN
PLANIFICADOR
ACTIVIDADSESP
DIRECTOR
MIEMBROS CALIDAD
CÓDIG APELLIDOS Y ECÍFICA
INICIO
O NOMBRES
2111476 Julián David 1 1.2 Asignar lasX 8 d
Gamboa García actividades Junio
210116 Ronal Andres 1 1.2 Encargado del X 8 d
1 Rengifo Mejia caso Junio
GRAPA 7
210219 Jorge Andres 1 1.2 Generar X 8 d
7 Moreno lozada preguntas: caso Junio
209181 Jose David 1 1.2 Encargado del X 8 d
2 Gomez Ortiz problema Junio
1
I:Inicio, P:Planificar, E:Ejecución, S:Supervisar y controlar, C:Cerrar
7. UNIVERSIDAD INDUSTRIAL DE SANTANDER
ESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES
Perfecta Combinación entre Energía e Intelecto
2
C:Terminada, N:No terminada
3
I:Inmediatamente, 1:Una semana, 2:dos semanas, L:más de dos semanas