martes, 8 de mayo de 2018

¿Qué es la inferencia estadística?

Estimación de parámetros. Hipótesis estadísticas. Contraste de hipótesis. Error tipo I y error tipo II. Contrastes por intervalos de confianza. 

¡¡Buenas tardes!! El tema que vamos a dar hoy está relacionado con uno de los que se han dado en los seminarios y que se encuentra en la página titulada: ¿qué es la estadística descriptiva e inferencial? Por ello, aunque es uno de los temas más complicados, al tener doble apoyo resultará más fácil entenderlo. Así que... ¡vamos allá!

¿Qué es la inferencia estadística?
Es el conjunto de procedimientos estadísticos que permiten pasar de lo particular (la muestra), a lo general (la población). Hay dos formas:

  • Estimación del valor en la población (parámetro) a partir de un valor de la muestra (estimador). Puede ser:
    • Puntual. Consiste en considerar al valor del estadístico muestral como una estimación del parámetro poblacional.
    • Por intervalos. Consiste en calcular dos valores entre los cuales se encuentra el parámetro poblacional que queremos estimar con una probabilidad determinada, habitualmente el 95%. Cuanto más "estrecho" sea, mejor.
  • Contraste de hipótesis, a partir de valores de la muestra, se concluye si hay diferencias entre ellos en la población. Hay:
    • Métodos paramétricos
      • T-student
      • Anova
      • Fisher
      • Pearson
    • Métodos no paramétricos
      • U-Mann Whitney
      • K-W
      • Tablas de contingencia
¿Qué es el error estándar?
Es la medida que trata de captar la variabilidad de los valores del estimador (en este caso la media de los días de curación de la úlcera).
El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población. 
Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar del valor de una muestra concreta. 

Su cálculo depende de cada estimador: 

¿Qué es el teorema central del límite?
Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la de la población y desviación típica igual al error estándar del estimador de que se trate. 
Si sigue una distribución normal, sigue los principios básicos de ésta: 
  • ± 1S 68,26% de las observaciones 
  • ± 2S 95,45% de las observaciones 
  • ± 1,95S 95% de las observaciones 
  • ± 3S 99,73% de las observaciones 
  • ± 2,58S 99% de las observaciones 
¿Qué son intervalos de confianza?
Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio).
Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números. 
Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite.
Mientras mayor sea la confianza que queramos otorgar al intervalo, éste será más amplio, es decir el extremo inferior y el superior del intervalo estarás más distanciados y, por tanto, el intervalo será menos preciso.

¿Cómo se contrastan hipótesis?
Para controlar los errores aleatorios, además del cálculo de intervalos de confianza, contamos con una segunda herramienta en el proceso de inferencia estadística: los tests o contrastes de hipótesis. 
Con los intervalos nos hacemos una idea de un parámetro de una población dando un par de números entre los que confiamos que esté el valor desconocido. 
Con los contrastes (tests) de hipótesis la estrategia es la siguiente: 
  • Establecemos a priori una hipótesis acerca del valor del parámetro.
  • Realizamos la recogida de datos.
  • Analizamos la coherencia de entre la hipótesis previa y los datos obtenidos permite cuantificar la compatibilidad entre una hipótesis previamente establecida y los resultados obtenidos.
Estas son las pautas básicas para entender este tema. ¡Nos vemos el próximo día!

No hay comentarios:

Publicar un comentario