¡¡Buenas tardes de nuevo!!
En este post hablaré un poco acerca de la estadística descriptiva e inferencial. He de decir que es complicado de entender, así que lo explicaré con la mayor claridad posible. ¡Vamos allá!
Primero recordar que hay varias medidas descriptivas:
- Posición. Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.
- Cuantiles.
- Percentiles. Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados.
- Cuartiles.
- Deciles.
- ...
- Centralización. Indican valores con respecto a los que los datos parecen agruparse.
- Media. Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados.
- Mediana. Es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el número de datos es impar la mediana será el valor central, si es par tomaremos como mediana la media aritmética de los dos valores centrales.
- Moda. Es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser única.
- Dispersión. Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización.
- Varianza. Es el promedio del cuadrado de las distancias entre cada observación y la media aritmética del conjunto de observaciones.
- Desviación típica. La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de la varianza.
- Coeficiente de variación.
- Rango. Es la diferencia entre el valor de las observaciones mayor y el menor.
- Forma.
- Asimetría.
- Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden.
- Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda.
- Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda.
- Apuntamiento o curtosis. Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis:
- Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
- Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
- Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.
Una vez recordado estos conceptos os pregunto, ¿qué es la estadística inferencial?
Apoyándose en el cálculo de probabilidades y a partir de datos de una muestra (procedente de una población), efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
Permite generalizar los datos obtenidos a partir de una muestra a la población de la que proceden. Se basa en la teoría de las probabilidades y trabaja con los datos que le proporciona la estadística descriptiva.
Tipos de error al tomar una decisión:
- Tipo I (alfa). El investigador rechaza la Hipótesis nula siendo esta verdadera en la población (el investigador concluye que existe diferencia cuando en realidad no la hay).
- Tipo II (beta). El investigador no rechaza la Hipótesis nula siendo esta falsa en la población (el investigador concluye que ha sido incapaz de encontrar una diferencia que existe en la realidad).
Pruebas estadísticas de contraste de hipótesis más aplicables a cada situación:
Chi Cuadrado. (cualitativa v.s. cualitativa)
- Se identifican y clasifican las variables (dependiente e independiente).
- Se establecen las hipótesis nula y alternativa.
- Identificación de los valores de la tabla con los que se va a trabajar.
- Se calculan los valores esperados.
- Se calcula el valor de chi cuadrado (x^2):
- Se calcula el grado de libertad:
- Valorar qué hipótesis deberá aceptarse:
Test de T-Student. (cualitativa dicotómica v.s. cuantitativa)
- Se identifican y clasifican las variables (dependiente: cualitativa e independiente: cuantitativa discreta)
- Se establecen las hipótesis nula y alternativa.
- Identificar los valores de la tabla con los que se va a trabajar.
- Cálculo del grado de libertad:
- Cálculo de la desviación típica ponderada (Sp):
- Calcular la t-student:
- Búsqueda del valor en la tabla que asocia el grado de libertad y la probabilidad.
- Valorar que hipótesis deberá aceptarse.
Test Anova. (cualitativa policotómica v.s. cuantitativa)
Para muestras independientes.
- Tipos de variables (resultado: cuantitativa numérica, predictora: cualitativa policotómica)
- Normalidad: Variable resultado siga una distribución normal o de gauss.
- Homogeneidad de las varianzas . Las varianzas de cada grupo deben ser iguales:
- Prueba F de Snedecor
- Test de Barlett
- Test de Levene
Regresión simple. (cuantitativa continua v.s. cuantitativa continua)
- Tipos de variables (dependiente: cuantitativa numérica y independiente: cualitativa policotómica).
- Establecer las hipótesis nula y alternativa.
- Identificar los valores de la tabla con los que se va a trabajar.
- Cálculo de beta1 y beta0:
- Sustitución de los valores de beta1 y beta0 en la ecuación de la recta:
- Cálculo de dos puntos aleatorios en el plano de la recta que mejor define el comportamiento de la nube de puntos.
- Cálculo de los coeficientes de correlación y de determinación y el correspondiente test de hipótesis.
- Calculamos la desviación típica o estándar de Hb y U:
- Coeficiente de correlación de Pearson y de Spearman:
- Porcentaje de explicación del comportamiento de la variable dependiente (Hb) en función del comportamiento de la independiente (U)
- Grado de libertad:
- Búsqueda del valor en la tabla que asocia el grado de libertad y la probabilidad.
- Y por último valorar que hipótesis hay que escoger.
Y bueno mis lectores... hasta aquí este tema. Es muy complicado, pero en las entradas se explicará con más detalle. ¡Hasta la próxima!
No hay comentarios:
Publicar un comentario