Realización de la prueba de hipótesis

  • Hipótesis nula: H0: ρ = 0
  • Hipótesis alternativa: Ha: ρ ≠ 0
Qué significan las hipótesis en palabras
  • Hipótesis nula H0: El coeficiente de correlación poblacional NO ES significativamente diferente de cero. NO HAY una relación lineal significativa (correlación) entre X1 y X2 en la población.
  • Hipótesis alternativa Ha: El coeficiente de correlación de la población es significativamente diferente de cero. Existe una relación lineal significativa (correlación) entre X1 y X2 en la población.

Dibujar una conclusiónHay dos métodos para tomar la decisión relativa a la hipótesis. El estadístico de prueba para probar esta hipótesis es:

Donde la segunda fórmula es una forma equivalente del estadístico de prueba, n es el tamaño de la muestra y los grados de libertad son n-2. Este es un estadístico t y opera de la misma manera que otras pruebas t. Calcule el valor t y compárelo con el valor crítico de la tabla t con los grados de libertad adecuados y el nivel de confianza que desee mantener. Si el valor calculado está en la cola, entonces no puede aceptar la hipótesis nula de que no existe una relación lineal entre estas dos variables aleatorias independientes. Si el valor t calculado NO está en la cola entonces no puede rechazar la hipótesis nula de que no existe una relación lineal entre las dos variables.

Una forma rápida y abreviada de probar las correlaciones es la relación entre el tamaño de la muestra y la correlación. Si:

entonces esto implica que la correlación entre las dos variables demuestra que existe una relación lineal y es estadísticamente significativa aproximadamente al nivel de significación de 0,05. Como indica la fórmula, existe una relación inversa entre el tamaño de la muestra y la correlación requerida para la significación de una relación lineal. Con sólo 10 observaciones, la correlación requerida para la significación es de 0,6325, para 30 observaciones la correlación requerida para la significación disminuye a 0,3651 y a 100 observaciones el nivel requerido es sólo de 0,2000.

Las correlaciones pueden ser útiles para visualizar los datos, pero no se utilizan adecuadamente para «explicar» una relación entre dos variables. Tal vez no haya una estadística más mal utilizada que el coeficiente de correlación. Citar correlaciones entre las condiciones de salud y todo, desde el lugar de residencia hasta el color de los ojos, tiene el efecto de implicar una relación de causa y efecto. Esto no puede lograrse con un coeficiente de correlación. El coeficiente de correlación es, por supuesto, inocente de esta mala interpretación. El analista tiene el deber de utilizar una estadística diseñada para comprobar las relaciones de causa y efecto y comunicar sólo esos resultados si pretende hacer tal afirmación. El problema es que pasar esta prueba más rigurosa es difícil, por lo que los «investigadores» perezosos y/o sin escrúpulos recurren a las correlaciones cuando no pueden argumentar legítimamente.

Defina una prueba t de un coeficiente de regresión, y dé un ejemplo único de su uso.

Definición:

Una prueba t se obtiene dividiendo un coeficiente de regresión por su error estándar y luego comparando el resultado con los valores críticos de la t de Student con df de error. Proporciona una prueba de la afirmación de que cuando todas las demás variables se han incluido en el modelo de regresión pertinente.

Ejemplo:

Suponga que se sospecha que 4 variables influyen en alguna respuesta. Supongamos que los resultados del ajuste incluyen:

Variable Coeficiente de regresión Error estándar del coeficiente regular
.5 1 -3
.4 2
.02 3 +1
.6 4 -.5

t calculado para las variables 1, 2 y 3 sería 5 o mayor en valor absoluto mientras que el de la variable 4 sería menor que 1. Para la mayoría de los niveles de significación, se rechazaría la hipótesis . Pero, fíjese que esto es para el caso cuando , y se han incluido en la regresión. Para la mayoría de los niveles de significación, la hipótesis continuaría (se mantendría) para el caso en que , y estén en la regresión. A menudo, este patrón de resultados dará lugar a la computación de otra regresión que incluya sólo , y el examen de las relaciones t producidas para ese caso.

La correlación entre las puntuaciones en un test de neuroticismo y las puntuaciones en un test de ansiedad es alta y positiva; por lo tanto

  1. la ansiedad causa el neuroticismo
  2. los que puntúan bajo en un test tienden a puntuar alto en el otro.
  3. Los que puntúan bajo en un test tienden a puntuar bajo en el otro.
  4. No se puede hacer ninguna predicción significativa de un test a otro.

C. Los que puntúan bajo en un test tienden a puntuar bajo en el otro.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *