SlideShare ist ein Scribd-Unternehmen logo
1 von 18
Downloaden Sie, um offline zu lesen
1
UNIVERSIDAD TECNOLÓGICA NACIONAL
FACULTAD REGIONAL AVELLANEDA
PROBABILIDAD Y ESTADÍSTICA
UNIDAD 1: ESTADÍSTICA DESCRIPTIVA
Autores:
Lic. Andrea Álvarez
Lic Luis Alberto Garaventa
Mg. María Cristina Kanobel
Año 2014
2UNIDAD 1: Estadística descriptiva
Como toda disciplina científica la Estadística tiene un lenguaje que le es propio. En el texto que
sigue encontrarán los conceptos básicos de estadística que necesitan para afrontar el estudio
de la materia.
Esperamos que al finalizar la lectura del siguiente texto puedan diferenciar los conceptos
población de muestra, variable cualitativa de variable cuantitativa y censo de muestreo
¿QUÉ ES LA ESTADÍSTICA?
La Estadística es una ciencia que se ocupa de recolectar, organizar, y analizar
información sobre un grupo de datos de forma tal que podamos obtener
conclusiones válidas sobre ellos.
Podemos clasificar la Estadística en dos ramas:
La ESTADÍSTICA DESCRIPTIVA trata sobre el procesamiento de los datos sin intenciones de
formular inferencias sobre ellos. Se ocupa de recolectar, organizar y procesar los datos sin
intenciones de formular inferencias sobre ellos. Presenta datos por medio de gráficos y tablas
que describen una determinada situación particular. Esta es la noción de estadística que tiene
asociada la mayoría de la gente.
La INFERENCIA ESTADÍSTICA es la disciplina científica que se ocupa de sacar conclusiones
sobre determinado grupo de estudio para poder realizar inferencias a partir de los datos
obtenidos. En este rol de generar procedimientos válidos para el análisis de los datos, la
estadística complace las necesidades de la investigación científica en sus diversas disciplinas.
POBLACIÓN y MUESTRA
Uno de los objetivos de la investigación estadística es explorar las características
de una población de utilizando sólo unas pocas observaciones. Por ejemplo: frente
a una elección, si queremos pronosticar sus resultados, encuestamos a un grupo
reducido de votantes (ya que encuestar a todos sería un proceso engorroso y muy caro). Es
decir que, mediante el grupo que encuestamos estamos analizando el comportamiento de
todos los votantes en las urnas.
Se denomina POBLACIÓN al conjunto de elementos de un grupo en estudio
La Teoría de la Probabilidad es la base del desarrollo y los fundamentos de la
inferencia estadística
3UNIDAD 1: Estadística descriptiva
Una población puede ser finita o infinita. Si podemos listar a los miembros de una población,
entonces la población es finita. En caso contrario decimos que es infinita.
Los términos población y muestra son relativos. Por ejemplo, todos los habitantes de
Córdoba constituyen una población respecto de Córdoba. En cambio, son una muestra cuando
la población en estudio son los habitantes de la Argentina.
Para obtener conclusiones sobre una población infinita o cuando el estudio de una población
finita es costoso, es conveniente trabajar con muestras.
VARIABLES ESTADÍSTICAS
Las variables pueden clasificarse en dos grandes grupos:
 cuantitativa o numérica: son aquellas variables que toman valores numéricos.
 cualitativa o categórica: son aquellas definidas por clases o categorías
Cuando los valores que toma una variable cuantitativa pertenecen a un conjunto finito o infinito
numerable decimos que la variable es discreta. En caso contrario, decimos que es continua.
Cuando en una variable cualitativa podemos ordenar los datos, decimos que la variable es
ordenable. En caso contrario decimos que es no ordenable.
Las variables generadas por la ausencia o presencia de una categoría se denominan
dicotómicas o binarias.
La característica que estudiamos de una población es lo que denominamos
VARIABLE.
Una MUESTRA es el conjunto de elementos que componen una parte
representativa de la población de estudio
4UNIDAD 1: Estadística descriptiva
f
PARÁMETRO Y ESTADÍSTICO
Un parámetro es un número fijo que resume información sobre la población en cambio, el
estadístico depende de la muestra seleccionada.
MATRICES DE DATOS
Cuando se relevan varias características de una población, los datos se
organizan en una matriz llamada matriz de datos.
En una matriz de datos consignamos las unidades de observación en las filas y
las variables en las columnas como en el ejemplo que sigue:
En esta tabla encontramos 5 observaciones de variables vinculadas con una investigación en
empresas constructoras acerca de los salarios de los empleados del área específica de la
construcción.
Edad Sexo Categoría Antigüedad Titulo Salario
25 F J 1 E $8000
35 M SS 10 I $25000
28 F SS 5 A $20000
30 M J 5 M $9000
55 M S 25 I $5000
Por categoría se consigna: J (Junior) SS (Semi – Senior) S (Senior)
Por Antigüedad entendemos el tiempo que lleva trabajando en este empleo o en otras
empresas pero con funciones similares
Por Título categorizamos I: (Ingeniero), A (Arquitecto) E (Estudiante de Ingeniería o
Arquitectura) M (Maestro Mayor de Obras, que no continúa sus estudios superiores)
TABLAS DE FRECUENCIAS
Las tablas de frecuencias permiten ordenar los datos de una muestra para que
se pueda leer la información en forma más clara. Se definen distintos tipos de
frecuencias:
Se simboliza
Se denomina frecuencia absoluta parámetro al número de veces que se
observa un dato
Se denomina parámetro a toda medida que describe una característica de una
población.
Un estadístico es toda medida que describe una característica de una muestra
5UNIDAD 1: Estadística descriptiva
Se calcula como:
Determina en términos de porcentajes qué parte del total de los datos corresponde
al dato determinado. Esto es:
Es decir:
En resumen, es posible organizar la información:
Siempre que sea posible, agrupamos los datos en tablas simples, que son aquellas que toman
un solo valor por categoría, en caso contrario, debemos utilizar tablas agrupadas por intervalos,
en las cuales cada categoría se representa con un intervalo numérico.
Por ejemplo
a) Cantidad de hijos por familia. (Tabla simple)
X 0 1 2 3 4 5
Frecuencia 8 12 20 5 4 1
Se denomina frecuencia acumulada a la cantidad de datos observados
menores o iguales que el dato determinado.
Se denomina frecuencia porcentual a la frecuencia relativa multiplicada
por 100
Se denomina frecuencia relativa a la razón entre la frecuencia relativa y el
número total de datos
100.% frf 
n
f
fr 
11
11


 ifFF
fF
iii
6UNIDAD 1: Estadística descriptiva
b) Concentración de alcohol en una muestra de 40 botellas de vino de mesa (tabla de
datos agrupados)
Concentración [10; 11) [11; 12) [12; 13) [13; 14)
Frecuencia 15 18 5 2
LABORATORIO DE INFORMÁTICA
Analizaremos con un ejemplo cómo construir tablas de frecuencias.
Tabla de frecuencias para variable discreta
Para construir la tabla iremos siguiendo el procedimiento frente a la computadora, a partir del
siguiente ejemplo:
Una revista de la construcción realizó un relevamiento por encuesta para observar los hábitos de
las familias que construyeron una casa nueva en el último año. Al grupo de encuestados se les
consultó cuántos presupuestos, además del de el estudio contratado, solicitaron antes de cerrar el
contrato.
Las respuestas se volcaron en una matriz de datos
1 2 5 0 3 2 6 3 2 5
4 2 3 5 6 6 7 3 5 2
2 3 5 0 0 1 3 5 3 4
Es posible resumir la información anterior en una tabla de frecuencias. Para ello sigan los pasos
detallados en la siguiente imagen:
Luego de aceptar necesitamos copiar la fórmula en toda la tabla de frecuencias. Para ello:
 Cargamos los datos en un rango de celdas (lo llamaremos matriz)
 En una columna escribimos los posibles valores que toma la variable.
 Nos posicionamos en la celda contigua al primer valor de la tabla
 Aplicamos la función estadística FRECUENCIA oprimiendo el asistente de fórmulas (marcado con
un círculo en el gráfico)
En DATOS, seleccionamos el rango de celdas que contienen la matriz
En GRUPOS, seleccionamos el rango de celdas que contienen los valores de la variable.
 Aceptamos.
7UNIDAD 1: Estadística descriptiva
 seleccionamos la celda donde pegamos la fórmula
 Llevamos el puntero hasta el extremo inferior derecho de la celda (el puntero cambiará de
una cruz blanca a una cruz más delgada y negra). En ese punto oprimimos el botón y
arrastramos la fórmula hasta la última celda de la tabla.
 Los datos que van a observar no se corresponden con la respuesta que esperaban. Ahora
deben proceder como se indica en la siguiente pantalla.
Tablas de frecuencias para datos agrupados
Para realizar en Excel una tabla de frecuencias con datos agrupados, procedemos de igual
forma que en la anterior sólo que los datos de la variable los separamos en dos columnas: en
una anotamos los extremos inferiores de los intervalos y en la otra los extremos superiores.
Cuando asignamos la función frecuencia para armar la tabla, seleccionamos como grupo
sólo la columna de los extremos superiores
GRÁFICOS ESTADÍSTICOS
Una forma de describir la información recolectada es mediante gráficos
estadísticos. Entre los más usuales encontramos los siguientes:
Gráfico circular:
Se puede aplicar para todo tipo de
variables y permite ver la distribucion de
los datos en relación proporcional al área
que ocupa cada sector. Una restricción
para el uso de este tipo de gráfico es
que las categorías de la variable deben
ser excluyentes.
Hacer click en este punto. La
pantalla se seleccionará
recuadrando los rangos del
mismo color que las letras
que los referencias. Luego
oprimir
CTL+SHIFT+ENTER
DITRIBUCIÓN DE LOS EMPLEADOS
SEGÚN SEXO
30%
70%
femenino
masculino
Fuente: Registros de la oficina de personal
8UNIDAD 1: Estadística descriptiva
Gráficos de columnas
Se utilizan para diversos tipos de presentaciones.
Cuando la variable representada es cualitativa, se
pueden utilizar barras horizontales (esto permite una
mejor lectura de las categorías), cuando los datos
están agrupados en intervalos se suelen utilizar
histogramas que son gráficos de columnas una a
continuación de la otra
Gráficos de líneas
Son adecuados cuando la variable
analizada es temporal.
En este caso no deben confundirse con
gráficos de funciones continuas, dado que
los valores de la variable son discretos y se
unen los puntos solo para facilitar la
lectura.
Existen otras formas de gráficos que se pueden encontrar en informes o en el menú de la
planilla de cálculo y que son, en cierta forma, variaciones respecto de estos tres modelos.
Algunos aspectos que no deben dejar de tomar en cuenta al construir un gráfico es consignar
en el mismo:
 Un título que es la descripción de la variable que se releva
 El tipo de dato que se representó en cada eje horizontal y, en el eje vertical de las
frecuencias, si los valores son absolutos, relativos o porcentuales.
 Aclarar, cuando no sea absolutamente claro, la fuente de donde se extrajeron los datos
(esto se omite cuando los datos son producidos por el responsable del informe y en ese caso
solamente se aclara en el caso que los datos sean obtenidos de fuentes externas
MEDIDAS DE POSICIÓN Y DISPERSIÓN
Las medidas de posición y dispersión nos facilitan información sobre la serie de
datos que estamos analizando. Son medidas que sintetizan características de una
muestra o de una población.
Las medidas de posición se clasifican en:
a) Medidas de posición central o tendencia central: que informan sobre los valores medios
de la serie de datos.
b) Medidas de posición no centrales: que describen cómo se distribuye el resto de los
valores de la serie.
Describiremos a continuación las siguientes medidas de posición:
Unidades vendidas según tipo
58
43
23
50
20
0
20
40
60
80
2 amb 3 amb 4 amb duplex otros
Años
Cantidadde
unidades
Fuente: Departamento de ventas
Unidades vendidas por año
325 350
198 225
350
0
100
200
300
400
2000 2001 2002 2003 2004
Años
Cantidadde
unidades
Fuente: Departamento de ventas
9UNIDAD 1: Estadística descriptiva
Si kf es la mayor de las frecuencias absolutas, entonces:
Veamos los siguientes ejemplos:
a) En la muestra
25 36 25 36 29 25 15
la moda es 25 porque tiene mayor frecuencia (3)
b) En la siguiente tabla de frecuencias
x f
1 5
2 10
3 15
4 15
Las modas son 3 y 4 porque corresponden a los valores de la variable que tienen mayor
frecuencia.
En ese caso decimos que la muestra es bimodal (tiene dos modas)
LABORATORIO DE INFORMÁTICA
Usando el asistente de fórmulas, seleccionaremos la función estadística
MODA, en el cuadro de diálogo se propone ingresar Número1.
Allí deben ingresar el rango de celdas que contienen los datos, o ingresar uno
por uno los datos llevando el cursor al renglón siguiente.
En la siguiente imagen se explica el procedimiento:
Llamamos moda al valor que tiene mayor frecuencia en un grupo de datos
(muestra o población)
kxmo 
centradas
No centradas
cuartiles
deciles
10UNIDAD 1: Estadística descriptiva
Para calcular la mediana de un conjunto de datos, se ordenan y luego se determina como
mediana el valor central considerando:
 Si el total n de datos es impar, entonces la mediana es el valor central. Esto es,el dato
ésimo
n








1
2
1
Por ejemplo:
Para los datos de la muestra
2 2 4 4 4 7 7 7 9 10 10
11n


61
2
1n
la mediana es el 6°dato 
Significa que los datos que forman la primera mitad (50% de los más chicos), no superan 7 y
los datos que forman la segunda mitad (50% de los más grandes) no son superados por 7.
 Si el total n es par, entonces la mediana es el promedio de los datos ésimo
n






2
y
ésimo
n






1
2
Por ejemplo, si los datos de la muestra son: 2 2 4 4 4 7 7 9 10 10
Entonces será:
10n
Llamamos mediana al valor que divide a la muestra (ordenada de menor a
mayor) en dos subconjuntos que tienen la misma cantidad de datos
7me
2 2 4 4 4 7 7 7 9 10 10
50% 50%
me
11UNIDAD 1: Estadística descriptiva
5
2

n
y  61
2
n
la mediana es el promedio entre el 5° dato y el 6°dato 
Esto significa que los datos que forman la primera mitad (50% de los más chicos), no superan
5,5 y los datos que forman la segunda mitad (50% de los más grandes) no son superados por
5,5.
LABORATORIO DE INFORMÁTICA
En el asistente de fórmulas, usaremos la función estadística es MEDIANA, en
el cuadro de diálogo se propone ingresar Número1. Allí deben Ingresar el
rango de celdas que contienen los datos, o ingresar uno por uno los datos
llevando el cursor al renglón siguiente
Si los datos estuvieran organizados según una tabla de frecuencias, la media es el
promedio ponderado de los valores de la variable, siendo la frecuencia absoluta
( f ) la que proporciona el peso a cada valor.
siendo ix un dato
Llamamos media al promedio aritmético de los valores de la muestra.
n
x
x
n
i
i
 1
5,5
2
74


me
2 2 4 4 4 7 7 9 10 10
50% 50%
Me =5,5
12UNIDAD 1: Estadística descriptiva
siendo ix un valor de la variable X
Por ejemplo
a) el promedio de los siguientes números: 7, 9, 12, 16 es
4
161297
x


b) En la tabla con datos agrupados
x f
 10;0 20
 20;10 15
 30;20 10
 40;30 25
 50;40 5
En este caso decimos que el intervalo modal es  40;30 o bien, que aproximamos la moda
en 35.
En distribuciones representadas mediante histogramas la mediana es el valor que divide al
gráfico en dos partes de igual área
0
10
20
30
40
50
60
kP es el número que supera al k% de los datos más chicos y es superado por el
(100-k)% de los datos más grandes. En particular, 15P es el número que supera al
15% de los datos más chicos y es superado por el 85% de los datos más grandes.
Observación: la mediana es el percentil 50 (me= 50P )
Entre los percentiles se destacan los deciles y los cuartiles:
Los percentiles de una distribución (ordenada de menor a mayor) son los
valores que la dividen en cien partes iguales.
Me
n
fx
x
k
i
ii
 1
.
13UNIDAD 1: Estadística descriptiva
Veamos los siguientes ejemplos:
a) En la siguiente tabla de frecuencias, X representa la cantidad de hijos de un grupo de
personas.
x f F
0 4 4
1 7 11
2 4 15
3 3 18
4 2 20
La matriz de datos es la siguiente:
Buscamos los Cuartiles:
 5
4
20
n
n cada una de las cuatro partes tendrá 5 datos
El promedio entre el último dato de la primera parte y el primero de la segunda parte es el
cuartil 1: 11 Q
Los cuartiles de una distribución (ordenada de menor a mayor) son los
valores que la dividen en cuatro partes iguales.
Los deciles de una distribución (ordenada de menor a mayor) son los
valores que la dividen en diez partes iguales.
909
202
101
...................
PD
PD
PD



753
502
251
PQ
mePQ
PQ



0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 3 3 3 4 4
0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 3 3 3 4 4
11 Q 12 Q 5,23 Q
44 Q
14UNIDAD 1: Estadística descriptiva
El promedio entre el último dato de la segunda parte y el primero de la tercera parte es el
cuartil 2: 12 Q
El promedio entre el último dato de la tercera parte y el primero de la cuarta parte es el
cuartil 3: 5,23 Q
El último dato es el cuartil 4: 44 Q
b) Observen la siguiente muestra de 25 datos
   %75
1 1 2 3 3 4 4 5 5 5 5 6 7 7 8 8 8 8 8 9 9 9 10 11 12
  
%40
El percentil 40 ( 40P ) es el valor que deja a la izquierda el 40% de los valores. El 40% de 25 es
10 por lo tanto el Percentil es 5.
El tercer cuartil 3Q es equivalente al Percentil 75, por lo tanto, el 75% de 25 es 18,75. Por lo
que aproximaremos como 3Q al valor que se encuentra en la posición 19 que es 8.
Simbólicamente escribiremos 8Qy5P 340 
Las técnicas para calcular percentiles y cuartiles son varias, y las diversas bibliografías proponen
fórmulas distintas de cálculo para aproximarlos.
Nosotros trabajaremos con el concepto y aplicando la proporcionalidad directa aproximaremos
los percentiles o, en la mayoría de los casos, recurriremos a la planilla de cálculo.
LABORATORIO DE INFORMÁTICA
Usando el asistente de fórmulas, la función estadística es PERCENTIL, en el
cuadro de diálogo se propone ingresar Número1. Allí deben Ingresar el rango
de celdas que contienen los datos, o ingresar uno por uno los datos llevando el
cursor al renglón siguiente.
¿Es suficiente el promedio para representar una muestra?
Los locales A y B tienen 3 empleados cada una que ganan en promedio $8000
mensuales. Ambos negocios están uno al lado del otro en un shopping center y
P40 Q3
P40
15UNIDAD 1: Estadística descriptiva
venden el mismo tipo de ropa. A simple vista pareciera que ambas tiendas tienen la misma
política salarial, pero veamos el detalle:
Local A
Laura gana $9000.- (es la encargada)
Inés gana $8000.- (es vendedora)
Pedro gana $7000.- (es el cadete)
Local B
Diego gana $12000.- (es el encargado)
Susana gana $8000.- (es la vendedora)
Emiliano es el cadete (cuánto gana?)
Veamos los datos en un gráfico:
En el caso A los tres sueldos están próximos a la recta promedio. En el caso B no lo están. Con
lo que se hace evidente que la media por sí sola no es una buena síntesis de las características
de la muestra.
Se hace necesario buscar un valor para medir esa dispersión ya que en este caso es muy
evidente que no son iguales pero hay casos en los que se hace muy difícil ver cuál es la
muestra en la que los datos están más dispersos.
Una forma de aproximar a esta medida podría ser promediar las diferencias entre cada valor y
el promedio:
Lo calculamos para el local A
     9000 8000 8000 8000 7000 8000
0
3
    
 Pero
da cero siempre.
Una manera de evitar esto es elevar al cuadrado las diferencias para evitar que al sumar los
opuestos se cancelen y la suma de cero.
A la medida que se calcula de esta forma se la llama Varianza muestral y se la simboliza con
2
S
     
3
800070008000800080009000 222
2 
S =666666,67
El inconveniente con el uso de la varianza es que queda expresada en unidades cuadradas. Por
ejemplo para el caso del local A la varianza da 6666,67 pesos al cuadrado.
Para evitar esto y trabajar con una medida que esté expresada en la misma unidad de medida
que la media definimos el desvío estándar que es la raíz cuadrada de la varianza.
MEDIDAS DE DISPERSIÓN
Para describir y resumir el comportamiento de un conjunto de datos se hace
necesario, no sólo conocer las medidas de posición que los caracterizan, sino
también otras medidas que sintetizan cómo se distribuyen dichos datos alrededor
del promedio. Para ello recurrimos a las llamadas medidas de variabilidad o dispersión:
Diego
Laura Inés
Pedro
$
$
$
$
$
$
Susana
Emiliano
16UNIDAD 1: Estadística descriptiva
Para un conjunto de datos se calcula como
Si los datos están organizados según una tabla de frecuencias, la varianza es el promedio
ponderado de los cuadrados de los desvíos de los valores de la variable respecto de la media
aritmética, siendo la frecuencia absoluta ( f ) la que proporciona el peso a cada valor.
Su fórmula es la siguiente:
Es decir:
Es una especie de “desvío promedio”; representa de alguna forma a todos los
desvíos sin contemplar su signo.
LABORATORIO DE INFORMÁTICA
Usando el asistente de fórmulas, la función estadística para el desvío
estándar es DESVEST en el cuadro de diálogo se propone ingresar Número1.
Allí deben Ingresar el rango de celdas que contienen los datos, o ingresar uno
por uno los datos llevando el cursor al renglón siguiente
Definimos desvío standard como la raíz cuadrada de la varianza
Llamamos varianza al promedio de los cuadrados de los desvíos de los
datos respecto de la media aritmética
 
n
xx
s
n
i
i

 1
2
2
 
n
fxx
s
k
i
ii

 1
2
2
2
ss 
17UNIDAD 1: Estadística descriptiva
Se expresa en porcentaje y expresa qué parte de la media representa el desvío. Esto es:
El coeficiente de variación es una medida que relaciona la media y el desvío de una muestra y
permite comparar muestras en función de la homogeneidad. Dadas dos muestras será más
homogénea aquella que tenga el menor coeficiente de variación.
Media acotada
Respecto del coeficiente de variación hay una cuestión que se hace muy importante
para tener en cuenta: cuando una muestra tiene una gran dispersión, la media no
es una medida adecuada como síntesis de información de la muestra y se deben
recurrir a otras medidas como la mediana o la moda para representarla.
Otra estrategia cuando las muestras no son pequeñas cuando se observa una gran dispersión
relativa, es trabajar con los valores centrales y para ello se usa la MEDIA ACOTADA.
Por ejemplo una media acotada al 80% se calcula despreciando el 10% de los valores menores
y el 10% de los valores superiores para evitar que los extremos modifiquen el valor de la media
En la muestra:
15 158 170 195 165 172 185 192 195 1500
Observamos que el 15 y el 1500 son valores extremos. Si calculamos el promedio,
obtenemos 7,294x  que es un valor muy poco representativo de los valores de la muestra. Si
excluimos los valores extremos 15 y 1500 estamos tomando el 80% de los valores centrales y
Media acotada es el promedio de los datos centrales sin considerar
valores extremos.
Coeficiente de variación es la relación entre el desvío estándar y la
media aritmética.
100... %
x
s
vc 
18UNIDAD 1: Estadística descriptiva
el promedio nos da %80x =179 que es un valor comprendido en el rango que determina la
mayor cantidad de datos de la muestra
LABORATORIO DE INFORMÁTICA
Usando el asistente de fórmulas, la función estadística para la media acotada
es MEDIA.ACOTADA. En el cuadro de diálogo se propone ingresar matriz. Allí
se ingresa el rango de celdas que contienen los datos, y en otro renglón se les
solicitará el porcentaje. En este punto deben consignar el porcentaje de datos que, en total,
quitarán de la muestra para recalcular. Por ejemplo para tomar un 80% de los datos centrales
(en el ejemplo que se ve en la pantalla para excluir al 1 y al 150) se debe poner 0,20 que
representa el porcentaje que se excluye de la muestra.
Cálculo de medidas de posición y dispersión en el caso de variables
continuas
Cuando la variable es continua, los datos se agrupan en intervalos de clase
(intervalos de números reales).
Para hallar la media aritmética, la varianza, el desvío estándar y el coeficiente de variación, se
utilizan las mismas definiciones dadas para variables discretas, tomando como ix a la marca de
clase del intervalo.
Para el cálculo de la moda, sólo indicamos el “intervalo modal” (intervalo que contiene la
moda) el cual es el que tiene la mayor frecuencia absoluta. Es decir, es el intervalo al cual
pertenecen la mayoría de los datos. Un valor estimativo de la moda es ix .
Análogamente se procede con el cálculo de la mediana y los percentiles.
Se llama marca de clase al punto medio del intervalo de clase. A este valor
se lo designa como xi

Weitere ähnliche Inhalte

Was ist angesagt?

Arboles - estructura de datos
Arboles - estructura de datos Arboles - estructura de datos
Arboles - estructura de datos Kaneki04
 
2.2 metodo de biseccion
2.2 metodo de biseccion2.2 metodo de biseccion
2.2 metodo de biseccionmorenito9001
 
Interpretacion geometrica de las soluciones
Interpretacion geometrica de las solucionesInterpretacion geometrica de las soluciones
Interpretacion geometrica de las solucionesMORAPANTOJAEDUARDOJO
 
Expansión polinomial en series de taylor
Expansión polinomial en series de taylorExpansión polinomial en series de taylor
Expansión polinomial en series de taylorluis
 
FISICA 2. Humberto Leyva, Tania Leyva.pdf
FISICA 2. Humberto Leyva, Tania Leyva.pdfFISICA 2. Humberto Leyva, Tania Leyva.pdf
FISICA 2. Humberto Leyva, Tania Leyva.pdfHerreraRoger
 
Introducción a los Métodos Numéricos
Introducción a los Métodos NuméricosIntroducción a los Métodos Numéricos
Introducción a los Métodos NuméricosBrianith Navarro
 
Presentacion metodos numerico teoria de errores
Presentacion metodos numerico teoria de errores Presentacion metodos numerico teoria de errores
Presentacion metodos numerico teoria de errores mervismarin23
 
Método de gauss y gauss seidel
Método de gauss y gauss seidelMétodo de gauss y gauss seidel
Método de gauss y gauss seidelLilly Kwang
 
Ejercicios resueltos edo homogéneas
Ejercicios resueltos edo homogéneasEjercicios resueltos edo homogéneas
Ejercicios resueltos edo homogéneasYerikson Huz
 
El método de la secante y secante modificado
El método de la secante y secante modificadoEl método de la secante y secante modificado
El método de la secante y secante modificadoMoises Costa
 
Aplicaciones del cálculo a la ingeniería
Aplicaciones del cálculo a la ingenieríaAplicaciones del cálculo a la ingeniería
Aplicaciones del cálculo a la ingenieríaAbel Rivera Cervantes
 
2.1 metodo de intervalo
2.1 metodo de intervalo2.1 metodo de intervalo
2.1 metodo de intervalomorenito9001
 
VECTOR TANGENTE NORMAL Y BINORMAL
VECTOR TANGENTE NORMAL Y BINORMALVECTOR TANGENTE NORMAL Y BINORMAL
VECTOR TANGENTE NORMAL Y BINORMALMario Muruato
 

Was ist angesagt? (20)

Arboles - estructura de datos
Arboles - estructura de datos Arboles - estructura de datos
Arboles - estructura de datos
 
2.2 metodo de biseccion
2.2 metodo de biseccion2.2 metodo de biseccion
2.2 metodo de biseccion
 
Interpretacion geometrica de las soluciones
Interpretacion geometrica de las solucionesInterpretacion geometrica de las soluciones
Interpretacion geometrica de las soluciones
 
Expansión polinomial en series de taylor
Expansión polinomial en series de taylorExpansión polinomial en series de taylor
Expansión polinomial en series de taylor
 
Practica 3 regla falsa
Practica 3 regla falsaPractica 3 regla falsa
Practica 3 regla falsa
 
Bases sobre pensamiento Sistemico
Bases sobre pensamiento SistemicoBases sobre pensamiento Sistemico
Bases sobre pensamiento Sistemico
 
PUNTO FIJO
PUNTO FIJOPUNTO FIJO
PUNTO FIJO
 
FISICA 2. Humberto Leyva, Tania Leyva.pdf
FISICA 2. Humberto Leyva, Tania Leyva.pdfFISICA 2. Humberto Leyva, Tania Leyva.pdf
FISICA 2. Humberto Leyva, Tania Leyva.pdf
 
Introducción a los Métodos Numéricos
Introducción a los Métodos NuméricosIntroducción a los Métodos Numéricos
Introducción a los Métodos Numéricos
 
Presentacion metodos numerico teoria de errores
Presentacion metodos numerico teoria de errores Presentacion metodos numerico teoria de errores
Presentacion metodos numerico teoria de errores
 
Método de gauss y gauss seidel
Método de gauss y gauss seidelMétodo de gauss y gauss seidel
Método de gauss y gauss seidel
 
82655359 ecuaciones-polinomicas
82655359 ecuaciones-polinomicas82655359 ecuaciones-polinomicas
82655359 ecuaciones-polinomicas
 
Ejercicios resueltos edo homogéneas
Ejercicios resueltos edo homogéneasEjercicios resueltos edo homogéneas
Ejercicios resueltos edo homogéneas
 
El método de la secante y secante modificado
El método de la secante y secante modificadoEl método de la secante y secante modificado
El método de la secante y secante modificado
 
Concepto de realidad y conocimiento
Concepto de realidad y conocimientoConcepto de realidad y conocimiento
Concepto de realidad y conocimiento
 
Metodo de diferencias finitas
Metodo de diferencias finitasMetodo de diferencias finitas
Metodo de diferencias finitas
 
Aplicaciones del cálculo a la ingeniería
Aplicaciones del cálculo a la ingenieríaAplicaciones del cálculo a la ingeniería
Aplicaciones del cálculo a la ingeniería
 
Propiedades y características de los sistemas 7
Propiedades y características de los sistemas  7Propiedades y características de los sistemas  7
Propiedades y características de los sistemas 7
 
2.1 metodo de intervalo
2.1 metodo de intervalo2.1 metodo de intervalo
2.1 metodo de intervalo
 
VECTOR TANGENTE NORMAL Y BINORMAL
VECTOR TANGENTE NORMAL Y BINORMALVECTOR TANGENTE NORMAL Y BINORMAL
VECTOR TANGENTE NORMAL Y BINORMAL
 

Ähnlich wie probabilidad Unidad 1

Ähnlich wie probabilidad Unidad 1 (20)

Presentación1
Presentación1Presentación1
Presentación1
 
Estadística general
Estadística generalEstadística general
Estadística general
 
Presentación1
Presentación1Presentación1
Presentación1
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Alonzo torres manuel-u2_act2
Alonzo torres manuel-u2_act2Alonzo torres manuel-u2_act2
Alonzo torres manuel-u2_act2
 
Organizacion de datos
Organizacion de datosOrganizacion de datos
Organizacion de datos
 
Estadistica 2020
Estadistica 2020Estadistica 2020
Estadistica 2020
 
Taller de tecnologia
Taller de tecnologiaTaller de tecnologia
Taller de tecnologia
 
Estadística Descriptiva
Estadística DescriptivaEstadística Descriptiva
Estadística Descriptiva
 
Teoria 1 y 2 Introducción Estadistica descriptiva Broma 2023.pptx
Teoria 1 y 2 Introducción Estadistica descriptiva Broma 2023.pptxTeoria 1 y 2 Introducción Estadistica descriptiva Broma 2023.pptx
Teoria 1 y 2 Introducción Estadistica descriptiva Broma 2023.pptx
 
Estad libro de estadistica
Estad libro de estadisticaEstad libro de estadistica
Estad libro de estadistica
 
Estadística Lcda. Bella Moran
Estadística Lcda. Bella Moran Estadística Lcda. Bella Moran
Estadística Lcda. Bella Moran
 
Econometria
EconometriaEconometria
Econometria
 
ESTADISTICA DESCRIPTIVA, invesigacion.pptx
ESTADISTICA DESCRIPTIVA, invesigacion.pptxESTADISTICA DESCRIPTIVA, invesigacion.pptx
ESTADISTICA DESCRIPTIVA, invesigacion.pptx
 
Distribucion de frecuencias
Distribucion de frecuenciasDistribucion de frecuencias
Distribucion de frecuencias
 
Información sobre estadisticas
Información sobre estadisticasInformación sobre estadisticas
Información sobre estadisticas
 
Estadistica descriptiva 1
Estadistica descriptiva 1Estadistica descriptiva 1
Estadistica descriptiva 1
 
Estadistica desciptiva 1
Estadistica desciptiva 1Estadistica desciptiva 1
Estadistica desciptiva 1
 
Estadisticas
EstadisticasEstadisticas
Estadisticas
 
Estadistica I
Estadistica IEstadistica I
Estadistica I
 

Mehr von Diego Cravotta

Heladera wrm47 d1 manual de servicio
Heladera wrm47 d1 manual de servicioHeladera wrm47 d1 manual de servicio
Heladera wrm47 d1 manual de servicioDiego Cravotta
 
Dividir por dos cifras
Dividir por dos cifrasDividir por dos cifras
Dividir por dos cifrasDiego Cravotta
 
Motor de corriente continua
Motor de corriente continuaMotor de corriente continua
Motor de corriente continuaDiego Cravotta
 
Circuitos elementales-en-ca.-factor-de-potencia.-distorsión
Circuitos elementales-en-ca.-factor-de-potencia.-distorsiónCircuitos elementales-en-ca.-factor-de-potencia.-distorsión
Circuitos elementales-en-ca.-factor-de-potencia.-distorsiónDiego Cravotta
 
Electrotecnia de ballesteros
Electrotecnia de ballesterosElectrotecnia de ballesteros
Electrotecnia de ballesterosDiego Cravotta
 
Transformadores cenacaf
Transformadores cenacafTransformadores cenacaf
Transformadores cenacafDiego Cravotta
 
Maquinas de cc del ing.macri
Maquinas de cc del ing.macriMaquinas de cc del ing.macri
Maquinas de cc del ing.macriDiego Cravotta
 
Apunte de maquinas de universidad de chile
Apunte de maquinas de universidad de chileApunte de maquinas de universidad de chile
Apunte de maquinas de universidad de chileDiego Cravotta
 
309. maquinas-electricas-ii
309. maquinas-electricas-ii309. maquinas-electricas-ii
309. maquinas-electricas-iiDiego Cravotta
 
maquinas-electricas-ii
 maquinas-electricas-ii maquinas-electricas-ii
maquinas-electricas-iiDiego Cravotta
 
5 las matematicas_en_el_islam
5 las matematicas_en_el_islam5 las matematicas_en_el_islam
5 las matematicas_en_el_islamDiego Cravotta
 
Electrotecniacursoelemental 120830124642-phpapp01
Electrotecniacursoelemental 120830124642-phpapp01Electrotecniacursoelemental 120830124642-phpapp01
Electrotecniacursoelemental 120830124642-phpapp01Diego Cravotta
 
Que es la_estadistica.ppt
Que es la_estadistica.pptQue es la_estadistica.ppt
Que es la_estadistica.pptDiego Cravotta
 
Diccionario matematico
Diccionario matematicoDiccionario matematico
Diccionario matematicoDiego Cravotta
 

Mehr von Diego Cravotta (17)

Heladera wrm47 d1 manual de servicio
Heladera wrm47 d1 manual de servicioHeladera wrm47 d1 manual de servicio
Heladera wrm47 d1 manual de servicio
 
Dividir por dos cifras
Dividir por dos cifrasDividir por dos cifras
Dividir por dos cifras
 
Capitulo1
Capitulo1Capitulo1
Capitulo1
 
Motor de corriente continua
Motor de corriente continuaMotor de corriente continua
Motor de corriente continua
 
Circuitos elementales-en-ca.-factor-de-potencia.-distorsión
Circuitos elementales-en-ca.-factor-de-potencia.-distorsiónCircuitos elementales-en-ca.-factor-de-potencia.-distorsión
Circuitos elementales-en-ca.-factor-de-potencia.-distorsión
 
Electrotecnia de ballesteros
Electrotecnia de ballesterosElectrotecnia de ballesteros
Electrotecnia de ballesteros
 
Transformadores cenacaf
Transformadores cenacafTransformadores cenacaf
Transformadores cenacaf
 
Motores electricos
Motores electricosMotores electricos
Motores electricos
 
Maquinas de cc del ing.macri
Maquinas de cc del ing.macriMaquinas de cc del ing.macri
Maquinas de cc del ing.macri
 
Apunte de maquinas de universidad de chile
Apunte de maquinas de universidad de chileApunte de maquinas de universidad de chile
Apunte de maquinas de universidad de chile
 
309. maquinas-electricas-ii
309. maquinas-electricas-ii309. maquinas-electricas-ii
309. maquinas-electricas-ii
 
maquinas-electricas-ii
 maquinas-electricas-ii maquinas-electricas-ii
maquinas-electricas-ii
 
5 las matematicas_en_el_islam
5 las matematicas_en_el_islam5 las matematicas_en_el_islam
5 las matematicas_en_el_islam
 
Electrotecniacursoelemental 120830124642-phpapp01
Electrotecniacursoelemental 120830124642-phpapp01Electrotecniacursoelemental 120830124642-phpapp01
Electrotecniacursoelemental 120830124642-phpapp01
 
Que es la_estadistica.ppt
Que es la_estadistica.pptQue es la_estadistica.ppt
Que es la_estadistica.ppt
 
Diccionario matematico
Diccionario matematicoDiccionario matematico
Diccionario matematico
 
Mario luna sex crack
Mario luna   sex crackMario luna   sex crack
Mario luna sex crack
 

Kürzlich hochgeladen

Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PCCesarFernandez937857
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxYadi Campos
 
Ecosistemas Natural, Rural y urbano 2021.pptx
Ecosistemas Natural, Rural y urbano  2021.pptxEcosistemas Natural, Rural y urbano  2021.pptx
Ecosistemas Natural, Rural y urbano 2021.pptxolgakaterin
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dstEphaniiie
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoFundación YOD YOD
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.José Luis Palma
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscaeliseo91
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfEjercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfMaritzaRetamozoVera
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdfgimenanahuel
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxzulyvero07
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSjlorentemartos
 

Kürzlich hochgeladen (20)

Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PC
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
Ecosistemas Natural, Rural y urbano 2021.pptx
Ecosistemas Natural, Rural y urbano  2021.pptxEcosistemas Natural, Rural y urbano  2021.pptx
Ecosistemas Natural, Rural y urbano 2021.pptx
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativo
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fisca
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfEjercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 

probabilidad Unidad 1

  • 1. 1 UNIVERSIDAD TECNOLÓGICA NACIONAL FACULTAD REGIONAL AVELLANEDA PROBABILIDAD Y ESTADÍSTICA UNIDAD 1: ESTADÍSTICA DESCRIPTIVA Autores: Lic. Andrea Álvarez Lic Luis Alberto Garaventa Mg. María Cristina Kanobel Año 2014
  • 2. 2UNIDAD 1: Estadística descriptiva Como toda disciplina científica la Estadística tiene un lenguaje que le es propio. En el texto que sigue encontrarán los conceptos básicos de estadística que necesitan para afrontar el estudio de la materia. Esperamos que al finalizar la lectura del siguiente texto puedan diferenciar los conceptos población de muestra, variable cualitativa de variable cuantitativa y censo de muestreo ¿QUÉ ES LA ESTADÍSTICA? La Estadística es una ciencia que se ocupa de recolectar, organizar, y analizar información sobre un grupo de datos de forma tal que podamos obtener conclusiones válidas sobre ellos. Podemos clasificar la Estadística en dos ramas: La ESTADÍSTICA DESCRIPTIVA trata sobre el procesamiento de los datos sin intenciones de formular inferencias sobre ellos. Se ocupa de recolectar, organizar y procesar los datos sin intenciones de formular inferencias sobre ellos. Presenta datos por medio de gráficos y tablas que describen una determinada situación particular. Esta es la noción de estadística que tiene asociada la mayoría de la gente. La INFERENCIA ESTADÍSTICA es la disciplina científica que se ocupa de sacar conclusiones sobre determinado grupo de estudio para poder realizar inferencias a partir de los datos obtenidos. En este rol de generar procedimientos válidos para el análisis de los datos, la estadística complace las necesidades de la investigación científica en sus diversas disciplinas. POBLACIÓN y MUESTRA Uno de los objetivos de la investigación estadística es explorar las características de una población de utilizando sólo unas pocas observaciones. Por ejemplo: frente a una elección, si queremos pronosticar sus resultados, encuestamos a un grupo reducido de votantes (ya que encuestar a todos sería un proceso engorroso y muy caro). Es decir que, mediante el grupo que encuestamos estamos analizando el comportamiento de todos los votantes en las urnas. Se denomina POBLACIÓN al conjunto de elementos de un grupo en estudio La Teoría de la Probabilidad es la base del desarrollo y los fundamentos de la inferencia estadística
  • 3. 3UNIDAD 1: Estadística descriptiva Una población puede ser finita o infinita. Si podemos listar a los miembros de una población, entonces la población es finita. En caso contrario decimos que es infinita. Los términos población y muestra son relativos. Por ejemplo, todos los habitantes de Córdoba constituyen una población respecto de Córdoba. En cambio, son una muestra cuando la población en estudio son los habitantes de la Argentina. Para obtener conclusiones sobre una población infinita o cuando el estudio de una población finita es costoso, es conveniente trabajar con muestras. VARIABLES ESTADÍSTICAS Las variables pueden clasificarse en dos grandes grupos:  cuantitativa o numérica: son aquellas variables que toman valores numéricos.  cualitativa o categórica: son aquellas definidas por clases o categorías Cuando los valores que toma una variable cuantitativa pertenecen a un conjunto finito o infinito numerable decimos que la variable es discreta. En caso contrario, decimos que es continua. Cuando en una variable cualitativa podemos ordenar los datos, decimos que la variable es ordenable. En caso contrario decimos que es no ordenable. Las variables generadas por la ausencia o presencia de una categoría se denominan dicotómicas o binarias. La característica que estudiamos de una población es lo que denominamos VARIABLE. Una MUESTRA es el conjunto de elementos que componen una parte representativa de la población de estudio
  • 4. 4UNIDAD 1: Estadística descriptiva f PARÁMETRO Y ESTADÍSTICO Un parámetro es un número fijo que resume información sobre la población en cambio, el estadístico depende de la muestra seleccionada. MATRICES DE DATOS Cuando se relevan varias características de una población, los datos se organizan en una matriz llamada matriz de datos. En una matriz de datos consignamos las unidades de observación en las filas y las variables en las columnas como en el ejemplo que sigue: En esta tabla encontramos 5 observaciones de variables vinculadas con una investigación en empresas constructoras acerca de los salarios de los empleados del área específica de la construcción. Edad Sexo Categoría Antigüedad Titulo Salario 25 F J 1 E $8000 35 M SS 10 I $25000 28 F SS 5 A $20000 30 M J 5 M $9000 55 M S 25 I $5000 Por categoría se consigna: J (Junior) SS (Semi – Senior) S (Senior) Por Antigüedad entendemos el tiempo que lleva trabajando en este empleo o en otras empresas pero con funciones similares Por Título categorizamos I: (Ingeniero), A (Arquitecto) E (Estudiante de Ingeniería o Arquitectura) M (Maestro Mayor de Obras, que no continúa sus estudios superiores) TABLAS DE FRECUENCIAS Las tablas de frecuencias permiten ordenar los datos de una muestra para que se pueda leer la información en forma más clara. Se definen distintos tipos de frecuencias: Se simboliza Se denomina frecuencia absoluta parámetro al número de veces que se observa un dato Se denomina parámetro a toda medida que describe una característica de una población. Un estadístico es toda medida que describe una característica de una muestra
  • 5. 5UNIDAD 1: Estadística descriptiva Se calcula como: Determina en términos de porcentajes qué parte del total de los datos corresponde al dato determinado. Esto es: Es decir: En resumen, es posible organizar la información: Siempre que sea posible, agrupamos los datos en tablas simples, que son aquellas que toman un solo valor por categoría, en caso contrario, debemos utilizar tablas agrupadas por intervalos, en las cuales cada categoría se representa con un intervalo numérico. Por ejemplo a) Cantidad de hijos por familia. (Tabla simple) X 0 1 2 3 4 5 Frecuencia 8 12 20 5 4 1 Se denomina frecuencia acumulada a la cantidad de datos observados menores o iguales que el dato determinado. Se denomina frecuencia porcentual a la frecuencia relativa multiplicada por 100 Se denomina frecuencia relativa a la razón entre la frecuencia relativa y el número total de datos 100.% frf  n f fr  11 11    ifFF fF iii
  • 6. 6UNIDAD 1: Estadística descriptiva b) Concentración de alcohol en una muestra de 40 botellas de vino de mesa (tabla de datos agrupados) Concentración [10; 11) [11; 12) [12; 13) [13; 14) Frecuencia 15 18 5 2 LABORATORIO DE INFORMÁTICA Analizaremos con un ejemplo cómo construir tablas de frecuencias. Tabla de frecuencias para variable discreta Para construir la tabla iremos siguiendo el procedimiento frente a la computadora, a partir del siguiente ejemplo: Una revista de la construcción realizó un relevamiento por encuesta para observar los hábitos de las familias que construyeron una casa nueva en el último año. Al grupo de encuestados se les consultó cuántos presupuestos, además del de el estudio contratado, solicitaron antes de cerrar el contrato. Las respuestas se volcaron en una matriz de datos 1 2 5 0 3 2 6 3 2 5 4 2 3 5 6 6 7 3 5 2 2 3 5 0 0 1 3 5 3 4 Es posible resumir la información anterior en una tabla de frecuencias. Para ello sigan los pasos detallados en la siguiente imagen: Luego de aceptar necesitamos copiar la fórmula en toda la tabla de frecuencias. Para ello:  Cargamos los datos en un rango de celdas (lo llamaremos matriz)  En una columna escribimos los posibles valores que toma la variable.  Nos posicionamos en la celda contigua al primer valor de la tabla  Aplicamos la función estadística FRECUENCIA oprimiendo el asistente de fórmulas (marcado con un círculo en el gráfico) En DATOS, seleccionamos el rango de celdas que contienen la matriz En GRUPOS, seleccionamos el rango de celdas que contienen los valores de la variable.  Aceptamos.
  • 7. 7UNIDAD 1: Estadística descriptiva  seleccionamos la celda donde pegamos la fórmula  Llevamos el puntero hasta el extremo inferior derecho de la celda (el puntero cambiará de una cruz blanca a una cruz más delgada y negra). En ese punto oprimimos el botón y arrastramos la fórmula hasta la última celda de la tabla.  Los datos que van a observar no se corresponden con la respuesta que esperaban. Ahora deben proceder como se indica en la siguiente pantalla. Tablas de frecuencias para datos agrupados Para realizar en Excel una tabla de frecuencias con datos agrupados, procedemos de igual forma que en la anterior sólo que los datos de la variable los separamos en dos columnas: en una anotamos los extremos inferiores de los intervalos y en la otra los extremos superiores. Cuando asignamos la función frecuencia para armar la tabla, seleccionamos como grupo sólo la columna de los extremos superiores GRÁFICOS ESTADÍSTICOS Una forma de describir la información recolectada es mediante gráficos estadísticos. Entre los más usuales encontramos los siguientes: Gráfico circular: Se puede aplicar para todo tipo de variables y permite ver la distribucion de los datos en relación proporcional al área que ocupa cada sector. Una restricción para el uso de este tipo de gráfico es que las categorías de la variable deben ser excluyentes. Hacer click en este punto. La pantalla se seleccionará recuadrando los rangos del mismo color que las letras que los referencias. Luego oprimir CTL+SHIFT+ENTER DITRIBUCIÓN DE LOS EMPLEADOS SEGÚN SEXO 30% 70% femenino masculino Fuente: Registros de la oficina de personal
  • 8. 8UNIDAD 1: Estadística descriptiva Gráficos de columnas Se utilizan para diversos tipos de presentaciones. Cuando la variable representada es cualitativa, se pueden utilizar barras horizontales (esto permite una mejor lectura de las categorías), cuando los datos están agrupados en intervalos se suelen utilizar histogramas que son gráficos de columnas una a continuación de la otra Gráficos de líneas Son adecuados cuando la variable analizada es temporal. En este caso no deben confundirse con gráficos de funciones continuas, dado que los valores de la variable son discretos y se unen los puntos solo para facilitar la lectura. Existen otras formas de gráficos que se pueden encontrar en informes o en el menú de la planilla de cálculo y que son, en cierta forma, variaciones respecto de estos tres modelos. Algunos aspectos que no deben dejar de tomar en cuenta al construir un gráfico es consignar en el mismo:  Un título que es la descripción de la variable que se releva  El tipo de dato que se representó en cada eje horizontal y, en el eje vertical de las frecuencias, si los valores son absolutos, relativos o porcentuales.  Aclarar, cuando no sea absolutamente claro, la fuente de donde se extrajeron los datos (esto se omite cuando los datos son producidos por el responsable del informe y en ese caso solamente se aclara en el caso que los datos sean obtenidos de fuentes externas MEDIDAS DE POSICIÓN Y DISPERSIÓN Las medidas de posición y dispersión nos facilitan información sobre la serie de datos que estamos analizando. Son medidas que sintetizan características de una muestra o de una población. Las medidas de posición se clasifican en: a) Medidas de posición central o tendencia central: que informan sobre los valores medios de la serie de datos. b) Medidas de posición no centrales: que describen cómo se distribuye el resto de los valores de la serie. Describiremos a continuación las siguientes medidas de posición: Unidades vendidas según tipo 58 43 23 50 20 0 20 40 60 80 2 amb 3 amb 4 amb duplex otros Años Cantidadde unidades Fuente: Departamento de ventas Unidades vendidas por año 325 350 198 225 350 0 100 200 300 400 2000 2001 2002 2003 2004 Años Cantidadde unidades Fuente: Departamento de ventas
  • 9. 9UNIDAD 1: Estadística descriptiva Si kf es la mayor de las frecuencias absolutas, entonces: Veamos los siguientes ejemplos: a) En la muestra 25 36 25 36 29 25 15 la moda es 25 porque tiene mayor frecuencia (3) b) En la siguiente tabla de frecuencias x f 1 5 2 10 3 15 4 15 Las modas son 3 y 4 porque corresponden a los valores de la variable que tienen mayor frecuencia. En ese caso decimos que la muestra es bimodal (tiene dos modas) LABORATORIO DE INFORMÁTICA Usando el asistente de fórmulas, seleccionaremos la función estadística MODA, en el cuadro de diálogo se propone ingresar Número1. Allí deben ingresar el rango de celdas que contienen los datos, o ingresar uno por uno los datos llevando el cursor al renglón siguiente. En la siguiente imagen se explica el procedimiento: Llamamos moda al valor que tiene mayor frecuencia en un grupo de datos (muestra o población) kxmo  centradas No centradas cuartiles deciles
  • 10. 10UNIDAD 1: Estadística descriptiva Para calcular la mediana de un conjunto de datos, se ordenan y luego se determina como mediana el valor central considerando:  Si el total n de datos es impar, entonces la mediana es el valor central. Esto es,el dato ésimo n         1 2 1 Por ejemplo: Para los datos de la muestra 2 2 4 4 4 7 7 7 9 10 10 11n   61 2 1n la mediana es el 6°dato  Significa que los datos que forman la primera mitad (50% de los más chicos), no superan 7 y los datos que forman la segunda mitad (50% de los más grandes) no son superados por 7.  Si el total n es par, entonces la mediana es el promedio de los datos ésimo n       2 y ésimo n       1 2 Por ejemplo, si los datos de la muestra son: 2 2 4 4 4 7 7 9 10 10 Entonces será: 10n Llamamos mediana al valor que divide a la muestra (ordenada de menor a mayor) en dos subconjuntos que tienen la misma cantidad de datos 7me 2 2 4 4 4 7 7 7 9 10 10 50% 50% me
  • 11. 11UNIDAD 1: Estadística descriptiva 5 2  n y  61 2 n la mediana es el promedio entre el 5° dato y el 6°dato  Esto significa que los datos que forman la primera mitad (50% de los más chicos), no superan 5,5 y los datos que forman la segunda mitad (50% de los más grandes) no son superados por 5,5. LABORATORIO DE INFORMÁTICA En el asistente de fórmulas, usaremos la función estadística es MEDIANA, en el cuadro de diálogo se propone ingresar Número1. Allí deben Ingresar el rango de celdas que contienen los datos, o ingresar uno por uno los datos llevando el cursor al renglón siguiente Si los datos estuvieran organizados según una tabla de frecuencias, la media es el promedio ponderado de los valores de la variable, siendo la frecuencia absoluta ( f ) la que proporciona el peso a cada valor. siendo ix un dato Llamamos media al promedio aritmético de los valores de la muestra. n x x n i i  1 5,5 2 74   me 2 2 4 4 4 7 7 9 10 10 50% 50% Me =5,5
  • 12. 12UNIDAD 1: Estadística descriptiva siendo ix un valor de la variable X Por ejemplo a) el promedio de los siguientes números: 7, 9, 12, 16 es 4 161297 x   b) En la tabla con datos agrupados x f  10;0 20  20;10 15  30;20 10  40;30 25  50;40 5 En este caso decimos que el intervalo modal es  40;30 o bien, que aproximamos la moda en 35. En distribuciones representadas mediante histogramas la mediana es el valor que divide al gráfico en dos partes de igual área 0 10 20 30 40 50 60 kP es el número que supera al k% de los datos más chicos y es superado por el (100-k)% de los datos más grandes. En particular, 15P es el número que supera al 15% de los datos más chicos y es superado por el 85% de los datos más grandes. Observación: la mediana es el percentil 50 (me= 50P ) Entre los percentiles se destacan los deciles y los cuartiles: Los percentiles de una distribución (ordenada de menor a mayor) son los valores que la dividen en cien partes iguales. Me n fx x k i ii  1 .
  • 13. 13UNIDAD 1: Estadística descriptiva Veamos los siguientes ejemplos: a) En la siguiente tabla de frecuencias, X representa la cantidad de hijos de un grupo de personas. x f F 0 4 4 1 7 11 2 4 15 3 3 18 4 2 20 La matriz de datos es la siguiente: Buscamos los Cuartiles:  5 4 20 n n cada una de las cuatro partes tendrá 5 datos El promedio entre el último dato de la primera parte y el primero de la segunda parte es el cuartil 1: 11 Q Los cuartiles de una distribución (ordenada de menor a mayor) son los valores que la dividen en cuatro partes iguales. Los deciles de una distribución (ordenada de menor a mayor) son los valores que la dividen en diez partes iguales. 909 202 101 ................... PD PD PD    753 502 251 PQ mePQ PQ    0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 3 3 3 4 4 0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 3 3 3 4 4 11 Q 12 Q 5,23 Q 44 Q
  • 14. 14UNIDAD 1: Estadística descriptiva El promedio entre el último dato de la segunda parte y el primero de la tercera parte es el cuartil 2: 12 Q El promedio entre el último dato de la tercera parte y el primero de la cuarta parte es el cuartil 3: 5,23 Q El último dato es el cuartil 4: 44 Q b) Observen la siguiente muestra de 25 datos    %75 1 1 2 3 3 4 4 5 5 5 5 6 7 7 8 8 8 8 8 9 9 9 10 11 12    %40 El percentil 40 ( 40P ) es el valor que deja a la izquierda el 40% de los valores. El 40% de 25 es 10 por lo tanto el Percentil es 5. El tercer cuartil 3Q es equivalente al Percentil 75, por lo tanto, el 75% de 25 es 18,75. Por lo que aproximaremos como 3Q al valor que se encuentra en la posición 19 que es 8. Simbólicamente escribiremos 8Qy5P 340  Las técnicas para calcular percentiles y cuartiles son varias, y las diversas bibliografías proponen fórmulas distintas de cálculo para aproximarlos. Nosotros trabajaremos con el concepto y aplicando la proporcionalidad directa aproximaremos los percentiles o, en la mayoría de los casos, recurriremos a la planilla de cálculo. LABORATORIO DE INFORMÁTICA Usando el asistente de fórmulas, la función estadística es PERCENTIL, en el cuadro de diálogo se propone ingresar Número1. Allí deben Ingresar el rango de celdas que contienen los datos, o ingresar uno por uno los datos llevando el cursor al renglón siguiente. ¿Es suficiente el promedio para representar una muestra? Los locales A y B tienen 3 empleados cada una que ganan en promedio $8000 mensuales. Ambos negocios están uno al lado del otro en un shopping center y P40 Q3 P40
  • 15. 15UNIDAD 1: Estadística descriptiva venden el mismo tipo de ropa. A simple vista pareciera que ambas tiendas tienen la misma política salarial, pero veamos el detalle: Local A Laura gana $9000.- (es la encargada) Inés gana $8000.- (es vendedora) Pedro gana $7000.- (es el cadete) Local B Diego gana $12000.- (es el encargado) Susana gana $8000.- (es la vendedora) Emiliano es el cadete (cuánto gana?) Veamos los datos en un gráfico: En el caso A los tres sueldos están próximos a la recta promedio. En el caso B no lo están. Con lo que se hace evidente que la media por sí sola no es una buena síntesis de las características de la muestra. Se hace necesario buscar un valor para medir esa dispersión ya que en este caso es muy evidente que no son iguales pero hay casos en los que se hace muy difícil ver cuál es la muestra en la que los datos están más dispersos. Una forma de aproximar a esta medida podría ser promediar las diferencias entre cada valor y el promedio: Lo calculamos para el local A      9000 8000 8000 8000 7000 8000 0 3       Pero da cero siempre. Una manera de evitar esto es elevar al cuadrado las diferencias para evitar que al sumar los opuestos se cancelen y la suma de cero. A la medida que se calcula de esta forma se la llama Varianza muestral y se la simboliza con 2 S       3 800070008000800080009000 222 2  S =666666,67 El inconveniente con el uso de la varianza es que queda expresada en unidades cuadradas. Por ejemplo para el caso del local A la varianza da 6666,67 pesos al cuadrado. Para evitar esto y trabajar con una medida que esté expresada en la misma unidad de medida que la media definimos el desvío estándar que es la raíz cuadrada de la varianza. MEDIDAS DE DISPERSIÓN Para describir y resumir el comportamiento de un conjunto de datos se hace necesario, no sólo conocer las medidas de posición que los caracterizan, sino también otras medidas que sintetizan cómo se distribuyen dichos datos alrededor del promedio. Para ello recurrimos a las llamadas medidas de variabilidad o dispersión: Diego Laura Inés Pedro $ $ $ $ $ $ Susana Emiliano
  • 16. 16UNIDAD 1: Estadística descriptiva Para un conjunto de datos se calcula como Si los datos están organizados según una tabla de frecuencias, la varianza es el promedio ponderado de los cuadrados de los desvíos de los valores de la variable respecto de la media aritmética, siendo la frecuencia absoluta ( f ) la que proporciona el peso a cada valor. Su fórmula es la siguiente: Es decir: Es una especie de “desvío promedio”; representa de alguna forma a todos los desvíos sin contemplar su signo. LABORATORIO DE INFORMÁTICA Usando el asistente de fórmulas, la función estadística para el desvío estándar es DESVEST en el cuadro de diálogo se propone ingresar Número1. Allí deben Ingresar el rango de celdas que contienen los datos, o ingresar uno por uno los datos llevando el cursor al renglón siguiente Definimos desvío standard como la raíz cuadrada de la varianza Llamamos varianza al promedio de los cuadrados de los desvíos de los datos respecto de la media aritmética   n xx s n i i   1 2 2   n fxx s k i ii   1 2 2 2 ss 
  • 17. 17UNIDAD 1: Estadística descriptiva Se expresa en porcentaje y expresa qué parte de la media representa el desvío. Esto es: El coeficiente de variación es una medida que relaciona la media y el desvío de una muestra y permite comparar muestras en función de la homogeneidad. Dadas dos muestras será más homogénea aquella que tenga el menor coeficiente de variación. Media acotada Respecto del coeficiente de variación hay una cuestión que se hace muy importante para tener en cuenta: cuando una muestra tiene una gran dispersión, la media no es una medida adecuada como síntesis de información de la muestra y se deben recurrir a otras medidas como la mediana o la moda para representarla. Otra estrategia cuando las muestras no son pequeñas cuando se observa una gran dispersión relativa, es trabajar con los valores centrales y para ello se usa la MEDIA ACOTADA. Por ejemplo una media acotada al 80% se calcula despreciando el 10% de los valores menores y el 10% de los valores superiores para evitar que los extremos modifiquen el valor de la media En la muestra: 15 158 170 195 165 172 185 192 195 1500 Observamos que el 15 y el 1500 son valores extremos. Si calculamos el promedio, obtenemos 7,294x  que es un valor muy poco representativo de los valores de la muestra. Si excluimos los valores extremos 15 y 1500 estamos tomando el 80% de los valores centrales y Media acotada es el promedio de los datos centrales sin considerar valores extremos. Coeficiente de variación es la relación entre el desvío estándar y la media aritmética. 100... % x s vc 
  • 18. 18UNIDAD 1: Estadística descriptiva el promedio nos da %80x =179 que es un valor comprendido en el rango que determina la mayor cantidad de datos de la muestra LABORATORIO DE INFORMÁTICA Usando el asistente de fórmulas, la función estadística para la media acotada es MEDIA.ACOTADA. En el cuadro de diálogo se propone ingresar matriz. Allí se ingresa el rango de celdas que contienen los datos, y en otro renglón se les solicitará el porcentaje. En este punto deben consignar el porcentaje de datos que, en total, quitarán de la muestra para recalcular. Por ejemplo para tomar un 80% de los datos centrales (en el ejemplo que se ve en la pantalla para excluir al 1 y al 150) se debe poner 0,20 que representa el porcentaje que se excluye de la muestra. Cálculo de medidas de posición y dispersión en el caso de variables continuas Cuando la variable es continua, los datos se agrupan en intervalos de clase (intervalos de números reales). Para hallar la media aritmética, la varianza, el desvío estándar y el coeficiente de variación, se utilizan las mismas definiciones dadas para variables discretas, tomando como ix a la marca de clase del intervalo. Para el cálculo de la moda, sólo indicamos el “intervalo modal” (intervalo que contiene la moda) el cual es el que tiene la mayor frecuencia absoluta. Es decir, es el intervalo al cual pertenecen la mayoría de los datos. Un valor estimativo de la moda es ix . Análogamente se procede con el cálculo de la mediana y los percentiles. Se llama marca de clase al punto medio del intervalo de clase. A este valor se lo designa como xi