Eseguire il test d’ipotesi

  • Ipotesi nulla: H0: ρ = 0
  • Ipotesi alternativa: Ha: ρ ≠ 0
Cosa significano le ipotesi in parole
  • Ipotesi nulla H0: Il coefficiente di correlazione della popolazione NON è significativamente diverso da zero. Non c’è una relazione lineare significativa (correlazione) tra X1 e X2 nella popolazione.
  • Ipotesi alternativa Ha: Il coefficiente di correlazione della popolazione è significativamente diverso da zero. C’è una significativa relazione lineare (correlazione) tra X1 e X2 nella popolazione.

Tracciare una conclusioneCi sono due metodi per prendere la decisione riguardante l’ipotesi. La statistica di test per verificare questa ipotesi è:

Dove la seconda formula è una forma equivalente del test statistico, n è la dimensione del campione e i gradi di libertà sono n-2. Questa è una statistica t e funziona allo stesso modo degli altri test t. Calcola il valore t e confrontalo con il valore critico dalla tabella t ai gradi di libertà appropriati e al livello di confidenza che vuoi mantenere. Se il valore calcolato è nella coda, allora non potete accettare l’ipotesi nulla che non ci sia una relazione lineare tra queste due variabili casuali indipendenti. Se il valore t calcolato NON è in coda, allora non si può rifiutare l’ipotesi nulla che non ci sia una relazione lineare tra le due variabili.

Un modo rapido e sintetico per testare le correlazioni è la relazione tra la dimensione del campione e la correlazione. Se:

quindi questo implica che la correlazione tra le due variabili dimostra che esiste una relazione lineare ed è statisticamente significativa a circa il livello di significatività 0,05. Come indica la formula, c’è una relazione inversa tra la dimensione del campione e la correlazione richiesta per la significatività di una relazione lineare. Con solo 10 osservazioni, la correlazione richiesta per la significatività è 0,6325, per 30 osservazioni la correlazione richiesta per la significatività scende a 0,3651 e a 100 osservazioni il livello richiesto è solo 0,2000.

Le correlazioni possono essere utili per visualizzare i dati, ma non sono utilizzate in modo appropriato per “spiegare” una relazione tra due variabili. Forse nessuna statistica è più abusata del coefficiente di correlazione. Citare le correlazioni tra le condizioni di salute e tutto, dal luogo di residenza al colore degli occhi, ha l’effetto di implicare una relazione di causa ed effetto. Questo semplicemente non può essere realizzato con un coefficiente di correlazione. Il coefficiente di correlazione è, naturalmente, innocente di questa interpretazione errata. È dovere dell’analista utilizzare una statistica che è progettata per testare le relazioni di causa ed effetto e riportare solo quei risultati se si intende fare una tale affermazione. Il problema è che superare questo test più rigoroso è difficile, quindi i “ricercatori” pigri e/o senza scrupoli ricorrono alle correlazioni quando non riescono a far valere legittimamente le loro ragioni.

Definire il test t di un coefficiente di regressione e fornire un esempio unico del suo utilizzo.

Definizione:

Un test t si ottiene dividendo un coefficiente di regressione per il suo errore standard e poi confrontando il risultato con i valori critici della t di Student con errore df. Fornisce un test dell’affermazione che quando tutte le altre variabili sono state incluse nel relativo modello di regressione.

Esempio:

Supponiamo che 4 variabili siano sospettate di influenzare qualche risposta. Supponiamo che i risultati del fitting includano:

Variabile Coefficiente di regressione Errore standard del coefficiente regolare
.5 1 -3
.4 2 +2
.02 3 +1
.6 4 -.5

t calcolato per le variabili 1, 2, e 3 sarebbe 5 o più grande in valore assoluto mentre quello per la variabile 4 sarebbe inferiore a 1. Per la maggior parte dei livelli di significatività, l’ipotesi sarebbe rifiutata. Ma, si noti che questo è per il caso in cui , e sono stati inclusi nella regressione. Per la maggior parte dei livelli di significatività, l’ipotesi sarebbe continuata (mantenuta) nel caso in cui , e sono nella regressione. Spesso questo modello di risultati porterà al calcolo di un’altra regressione che coinvolge solo , e l’esame dei rapporti t prodotti per questo caso.

La correlazione tra i punteggi di un test di nevroticismo e i punteggi di un test di ansia è alta e positiva; quindi

  1. l’ansia causa il nevroticismo
  2. chi ottiene un punteggio basso in un test tende a ottenere un punteggio alto nell’altro.
  3. chi ottiene un punteggio basso in un test tende a ottenere un punteggio basso nell’altro.
  4. non si può fare una previsione significativa da un test all’altro.

c. chi ottiene un punteggio basso in un test tende a ottenere un punteggio basso nell’altro.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *