Ir al contenido principal

ESTADÍSTICOS UNIVERSALES: MEDIDAS RESUMEN PARA VARIABLES CUANTITATIVAS.

Hay tren grandes tipos de medidas estadísticas: 

1.Medidas de tendencia central: 

Dan idea de los valores alrdedor de los cuales el resto de los datos tienen tendencia a agruparse = MEDIA, MEDIANA Y MODA.

Media aritmética o media:

  • Se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos. Es la suma de todos los valores de la variable observada entre el total de observaciones.
  • Es la medida más calculada y utilizada en estadística descriptiva. 

PROPIEDADES DE LA MEDIA:

 1. La suma de las desviaciones respecto de la media es igual a cero 
2. La media no se altera por una transformación lineal de escala: 
a) Si a un conjunto de datos cuya media es X, se le suma a cada dato una constante K, la media aumenta en K unidades.
b) Si en un conjunto de datos cuya media es X, se multiplica cada dato por una constante K, la media queda multiplicada por K 4. Es muy sensible a las puntuaciones extremas. 

 Mediana:

  • La mediana es la puntuación que ocupa la posición central de la distribución.
  • Para poder hallarla necesitamos que nuestros datos estén ordenados, de forma creciente o decreciente.
  • Es el valor de la observación tal que un 50%de  los datos es menor y otro 50% es mayor. 
  • Si la media y la mediana son iguales, la distribución de la variable es simétrica. 
  • A diferencia de la media aritmética, la mediana es más robusta y menos sensible a los valores extremos. 
  • Cuando la muestra posee muy pocos datos, o existen valores extremos o datos censurados-truncados, debemos calcular siempre la mediana Medidas de tendencia central
  • Si el número de observaciones es impar el valor  de la observación será justamente la  observación que ocupa la posición (n+1)/2.
  • Si el número de observaciones es par, el valor de  la mediana corresponde a la media entre los dos  valores centrales, es decir, la media entre la  observación n/2 y la observación(n/2)+1.

Moda:

  • Es el valor con mayor frecuencia (que más veces  se repite).
  • Las distribuciones que contienen una sola moda se llaman unimodales.
  • Si hay más de una se dice que la muestra es  bimodal (dos modas) o multimodal (más dedos).
  • Se puede calcular para cualquier tipo de variable.
  • Es la medida de tendencia central menos empleada. 
  •  En una distribución unimodal simétrica, los valores de la media aritmética, mediana y moda coinciden.
  • Si los datos están agrupados, se habla de clase  modal y corresponde al intervalo en el que el  cociente entre la frecuencia relativa y la amplitud es mayor (hi/ci)
  • En la siguiente distribución de frecuencias 18, 19, 19, 19, 23 Las distribuciones que contienen una sola moda se llaman unimodales
  • Las que contienen dos modas se llaman bimodales.

2. Media de posición:

Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos: CUARTILES, DECILES Y PERCENTILES.

 Cuantiles:

  •  Se calculan para variables cuantitativas y, al  igual que la mediana, sólo tienen en cuenta la  posición de los valores en la muestra. 
  •  Se define el cuantil de orden “n” como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada n. 
  • Los cuantiles más usuales son los  percentiles, los deciles y los cuartiles, según  dividan la muestra ordenada en 100, 10 ó 4  partes, respectivamente

 Percentiles: 

  • Dividen la muestra ordenada en 100 partes. Los percentiles son los 99 puntos o valores que dividen la distribución en cien partes iguales. Se representan por P(n). 
  •  El percentil “i” (Pi), es aquél valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i)% restante son mayores.
  •  Para buscar la posición de un percentil en una serie  de datos agrupados, buscamos el intervalo en el que  la frecuencia relativa acumulada (Hi) sea superior al  valor del percentil.
  •  El valor del P50corresponde al valor de la mediana

Deciles: 

  • Dividen la muestra ordenada en 10 partes. Los deciles son los nueve valores que dividen a la distribución en diez partes iguales.  
  •  Cada parte incluye el 10% de los valores de la distribución. 
  •  Se representan por la letra D. 
  • El decil “i” (Di), es aquél valor que,  ordenadas las observaciones en forma  creciente, el i/10% de ellas son menores  que él y el (100-i)/10% restante son mayores.
  • El valor del D5 corresponde al valor de la mediana y, por tanto, al del P50.

3. Medidas de dispersión o variabilidad: 

Dan información acerca de la heterogeneidad de nuestra observaciones = RANGO, DESVIACIÓN, MEDIANA, VARIANZA, DESVIACIÓN TIPICA, CEFICIENTE DE VARIACIÓN.

Rango o recorrido: (R)

  •  Es la medida de dispersión más simple y consiste en tomar la puntuación mayor y restarle la puntuación menor. Es el recorrido de una variable. 

Recorrido intercuartílico: (RI) 

  •  Diferencia entre el tercer y el primer cuartil= |Q3Q1|
  • Rango Semiintercuartil: También conocido como desviación cuartil, o espectro semicuartil. 
  • En su cálculo utiliza los valores intermedios y no extremos, lo que le confiere mayor estabilidad que el rango.

Desviación media: (DM)

  • Es la media aritmética de las  distancias de cada observación con respecto a  la media de la muestra.

Medidas de dispersión Varianza: (S2) 

  • Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución. 
  • Siempre tiene un valor positivo • Se mide en unidades de la variable estudiada (al cuadrado).
  • Cuanto menor sea la varianza mayor homogeneidad y menor dispersión.

Medidas de dispersión Desviación típica o estándar: (S)

  • Expresa la dispersión de la distribución mediante un valor que siempre es positivo y en las mismas unidades de medida de la variable, siendo la medida de dispersión más utilizada en estadística descriptiva. 
  • Cuando los datos están muy alejados de la media, el numerador será grande y la varianza y la desviación típica también lo serán. 
  • Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación típica.

Desviación típica o estándar:

 Propiedades
  •  La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.  
  • Si a todos los valores de la variable se les suma un número la desviación típica no varía. 
  •  Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número.
Observaciones de la desviación típica 
  • La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las puntuaciones extremas. 
  •  En los casos que no se pueda hallar la media tampoco será posible hallar la desviación típica.
  • Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la media.

Coeficiente de variación: (CV) 

  • También recibe el nombre de variabilidad relativa, puesto que es una medida de dispersión relativa de los datos. 
  •  Se calcula dividiendo la desviación típica entre la media de la muestra, y expresado en porcentaje. 
  •  El CV es un medida adimensional y nos permite comparar la dispersión o variabilidad de dos o más grupos. 
  • Sin embargo, no debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente. 
Bibliografía: Apuntes de clase del Dr. José Antonio Ponce Blandón y Prof. D. Juan Vega Escaño, profesores de ETIC del Centro Universitario de Enfermería de Cruz Roja, adscrito a la Universidad de Sevilla.

Comentarios

Entradas populares de este blog

INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

Estadística descriptiva:  Sirve para describir y resumir datos. Se refiere al tipo de estadísticas que normalmente vemos en los medios de difusión. Describe y analiza una determinada población o muestra sin pretender sacar conclusiones de tipo general. Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Organiza de manera clara y fácil de analizar. Resume los datos. Explora las relaciones entre variables. Es preliminar antes de la inferencia. Estadística inferencial:  Utiliza muestras de datos para sacar conclusiones sobre poblaciones más grandes. Este tipo de método se encuentra más frecuentemente en artículos publicados sobre investigación científica. Interfiere o induce leyes de comportamiento de una población, a partir del estudio del análisis de una muestra. Apo yándose en el cálculo de probabilidad y a partir de datos muestrales, efectúa: ...

PRUEBAS PARAMÉTRICAS MÁS UTILIZADAS EN ENFERMERÍA

LA PRUEA DE CHI: PRUEBA NO PARAMÉTICA. Para comparar dos variables cualitativas (dependiente e independiente).  Razonamiento a seguir: suponemos la hipótesis cierta,  y estudiamos cómo es de probable que siendo iguales  los dos grupos a comparar se obtengan resultados como  los obtenidos o haber encontrado diferencias más  grandes por grupos. La prueba o estadístico Chi cuadrado se utiliza para  comprobar si la diferencia en los datos que observamos: –Es debida al azar: Recordemos que la Ho establece que no hay diferencia, es decir, que hay igualdad. Aceptamos la Ho. –Es debida a algo más, por ejemplo una asociación entre  las variables que estudiamos: rechazamos la H0 y aceptamos la  H1. Condiciones para aplicar la Chi cuadrado:   Las observaciones deben ser independientes. Es decir, al clasificar los sujetos en cada casilla, debe haber sujetos distintos; no  puede haber sujetos repetidos en más de u...

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS.

ESTADÍSTICA INFERENCIAL: Definición: denominamos inferencia estadística al conjunto de procesamientos estadísticos que permiten pasar de los particular, la muestra, a lo general, la población. Población: conjunto de personas, sujetos o unidades que presenta una característica común. Muestra: subconjunto extraído y seleccionado de una población a la que representa. Muestra independiente: está formada por datos independientes, o sea, aquellos obtenidos tras una única observación. Muestra apareada o dependiente: está constituida por datos apareados. Compran el mismo grupo de sujetos en dos tiempos diferentes. Dos formas de inferencia de estadística: Estimación: parámetro-estimador. Contraste de hipótesis. ESTIMACIONES:  Proceso de utilizar información de una muestra para extraer  conclusiones acerca de toda la población Se utiliza la información recogida para estimar un valor. Tipos de estimaciones: A) Estimación puntual: Consiste en...