Estadísticos univariables: medidas resumen para variables cuantitativas.
¡¡Bienvenidos un día más a Enfermera en acción!!
Para empezar con el tema de hoy, primero comentaros que además de las tablas de frecuencia (explicadas en el anterior post), podemos resumir "observaciones" mediante estadísticos.
Los tres grandes tipos de medidas de estadística son:
- Medidas de tendencia central. Dan idea de los valores alrededor de los cuales el resto de los datos tienen tendencia a agruparse. Dentro de este grupo nos encontramos con:
- Media aritmética. Se trata del centro geométrico o de gravedad de nuestros datos. Es la suma de todos valores de la variable observada entre el total de observaciones.Cuando los datos son agrupados, para calcular la media utilizamos como valor de referencia de cada intervalo su marca de clase.
- Mediana. Es el valor de la observación tal que un 50% de los datos es menor y otro 50% es mayor. Si el número de observaciones es impar el valor de la observación será justamente la observación que ocupa la posición (n/2)+1. Si el número de observaciones es par, el valor de la mediana corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación (n/2)+1.
- Moda. Es el valor con mayor frecuencia (que más veces se repite). Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos)
- Medidas de dispersión o variabilidad. Dan información acerca de la heterogeneidad de nuestras observaciones.
- Rango o recorrido. Diferencia entre el mayor y el menor valor de la muestra.
- Desviación media. Media aritmética de las distancias de cada observación con respecto a la media de la muestra.
- Desviación típica. Cuantifica el error que cometemos si representamos una muestra únicamente por su media (el parámetro en la población se representa por σ).
- Varianza. expresa la misma información en valores cuadráticos (en la población el parámetro se expresa por σ2).
- Recorrido intercuartílico. Diferencia entre el tercer y el primer cuartil.
- Coeficiente de variación. Es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas.
- Medidas de posición. Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Entre ellos están:
- Cuantiles. Los más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100, 10 ó 4 partes, respectivamente.
- Percentiles. Dividen la muestra ordenada en 100 partes. El percentil “i” (Pi ), es aquél valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i)% restante son mayores.
- Deciles. Dividen la muestra ordenada en 10 partes. El decil “i” (Di ), es aquél valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores.
- Cuartiles. Dividen la muestra ordenada en 4 partes.
¿Qué son distribuciones normales, de Gauss o gaussianas?
Es una de las distribuciones de probabilidad de
variable continua que con más frecuencia aparece
en fenómenos reales. La gráfica de su función de densidad tiene una
forma acampanada y es simétrica respecto de los
valores posición central (media, mediana y moda,
que coinciden en estas distribuciones).
Esta curva se conoce como campana de Gauss. También pueden ser asimétricas positiva (hacia la derecha) y negativa (hacia la izquierda).
En estas gráficas también hay que destacar el concepto de curtosis, que sirve para medir el grado de
concentración de los valores que toma en
torno a su media. Puede ser de tres tipos:
- Distribución mesocúrtica. Presenta un grado de concentración medio alrededor de los valores centrales de la variable.
- Distribución leptocúrtica. Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
- Distribución platicúrtica. Presenta un reducido grado de concentración alrededor de los valores centrales de la variable.
Hasta aquí hemos llegado chicos, ¡¡nos vemos en el próximo post!!