Hay tren grandes tipos de medidas estadísticas:
1.Medidas de tendencia central:
Dan idea de los valores alrdedor de los cuales el resto de los datos tienen tendencia a agruparse = MEDIA, MEDIANA Y MODA.
Media aritmética o media:
- Se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos. Es la suma de todos los valores de la variable observada entre el total de observaciones.
- Es la medida más calculada y utilizada en estadística descriptiva.
PROPIEDADES DE LA MEDIA:
1. La suma de las desviaciones respecto de la media es igual a cero
2. La media no se altera por una transformación lineal de escala:
a) Si a un conjunto de datos cuya media es X, se le suma a cada dato una constante K, la media aumenta en K unidades.
b) Si en un conjunto de datos cuya media es X, se multiplica cada dato por una constante K, la media queda multiplicada por K 4. Es muy sensible a las puntuaciones extremas.
Mediana:
- La mediana es la puntuación que ocupa la posición central de la distribución.
- Para poder hallarla necesitamos que nuestros datos estén ordenados, de forma creciente o decreciente.
- Es el valor de la observación tal que un 50%de los datos es menor y otro 50% es mayor.
- Si la media y la mediana son iguales, la distribución de la variable es simétrica.
- A diferencia de la media aritmética, la mediana es más robusta y menos sensible a los valores extremos.
- Cuando la muestra posee muy pocos datos, o existen valores extremos o datos censurados-truncados, debemos calcular siempre la mediana Medidas de tendencia central
- Si el número de observaciones es impar el valor de la observación será justamente la observación que ocupa la posición (n+1)/2.
- Si el número de observaciones es par, el valor de la mediana corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación(n/2)+1.
Moda:
- Es el valor con mayor frecuencia (que más veces se repite).
- Las distribuciones que contienen una sola moda se llaman unimodales.
- Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más dedos).
- Se puede calcular para cualquier tipo de variable.
- Es la medida de tendencia central menos empleada.
- En una distribución unimodal simétrica, los valores de la media aritmética, mediana y moda coinciden.
- Si los datos están agrupados, se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor (hi/ci)
- En la siguiente distribución de frecuencias 18, 19, 19, 19, 23 Las distribuciones que contienen una sola moda se llaman unimodales
- Las que contienen dos modas se llaman bimodales.
2. Media de posición:
Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos: CUARTILES, DECILES Y PERCENTILES.
Cuantiles:
- Se calculan para variables cuantitativas y, al igual que la mediana, sólo tienen en cuenta la posición de los valores en la muestra.
- Se define el cuantil de orden “n” como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada n.
- Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100, 10 ó 4 partes, respectivamente
Percentiles:
- Dividen la muestra ordenada en 100 partes. Los percentiles son los 99 puntos o valores que dividen la distribución en cien partes iguales. Se representan por P(n).
- El percentil “i” (Pi), es aquél valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i)% restante son mayores.
- Para buscar la posición de un percentil en una serie de datos agrupados, buscamos el intervalo en el que la frecuencia relativa acumulada (Hi) sea superior al valor del percentil.
- El valor del P50corresponde al valor de la mediana
Deciles:
- Dividen la muestra ordenada en 10 partes. Los deciles son los nueve valores que dividen a la distribución en diez partes iguales.
- Cada parte incluye el 10% de los valores de la distribución.
- Se representan por la letra D.
- El decil “i” (Di), es aquél valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores.
- El valor del D5 corresponde al valor de la mediana y, por tanto, al del P50.
3. Medidas de dispersión o variabilidad:
Dan información acerca de la heterogeneidad de nuestra observaciones = RANGO, DESVIACIÓN, MEDIANA, VARIANZA, DESVIACIÓN TIPICA, CEFICIENTE DE VARIACIÓN.
Rango o recorrido: (R)
- Es la medida de dispersión más simple y consiste en tomar la puntuación mayor y restarle la puntuación menor. Es el recorrido de una variable.
Recorrido intercuartílico: (RI)
- Diferencia entre el tercer y el primer cuartil= |Q3Q1|
- Rango Semiintercuartil: También conocido como desviación cuartil, o espectro semicuartil.
- En su cálculo utiliza los valores intermedios y no extremos, lo que le confiere mayor estabilidad que el rango.
Desviación media: (DM)
- Es la media aritmética de las distancias de cada observación con respecto a la media de la muestra.
Medidas de dispersión Varianza: (S2)
- Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.
- Siempre tiene un valor positivo • Se mide en unidades de la variable estudiada (al cuadrado).
- Cuanto menor sea la varianza mayor homogeneidad y menor dispersión.
Medidas de dispersión Desviación típica o estándar: (S)
- Expresa la dispersión de la distribución mediante un valor que siempre es positivo y en las mismas unidades de medida de la variable, siendo la medida de dispersión más utilizada en estadística descriptiva.
- Cuando los datos están muy alejados de la media, el numerador será grande y la varianza y la desviación típica también lo serán.
- Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación típica.
Desviación típica o estándar:
Propiedades
- La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
- Si a todos los valores de la variable se les suma un número la desviación típica no varía.
- Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número.
Observaciones de la desviación típica
- La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las puntuaciones extremas.
- En los casos que no se pueda hallar la media tampoco será posible hallar la desviación típica.
- Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la media.
Coeficiente de variación: (CV)
- También recibe el nombre de variabilidad relativa, puesto que es una medida de dispersión relativa de los datos.
- Se calcula dividiendo la desviación típica entre la media de la muestra, y expresado en porcentaje.
- El CV es un medida adimensional y nos permite comparar la dispersión o variabilidad de dos o más grupos.
- Sin embargo, no debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente.
Comentarios
Publicar un comentario