Chi-τετράγωνο Goodness Fit Test

ο chi-square καλή δοκιμασία προσαρμογής είναι μια παραλλαγή της γενικότερης τεστ τετραγώνων. Η ρύθμιση για αυτή τη δοκιμή είναι μια ενιαία κατηγορική μεταβλητή που μπορεί να έχει πολλά επίπεδα. Συχνά σε αυτή την περίπτωση, θα έχουμε ένα θεωρητικό μοντέλο για μια κατηγορηματική μεταβλητή. Μέσα από αυτό το μοντέλο αναμένουμε ορισμένες αναλογίες του πληθυσμού να πέφτουν σε κάθε ένα από αυτά τα επίπεδα. Μια δοκιμασία καλοσύνης προσδιορίζει πόσο καλά οι αναμενόμενες αναλογίες στο θεωρητικό μας μοντέλο ταιριάζουν με την πραγματικότητα.

Ξεκινάμε με μια κατηγορική μεταβλητή με n επίπεδα και αφήστε ΠΕγώ να είναι το ποσοστό του πληθυσμού σε επίπεδο Εγώ. Το θεωρητικό μοντέλο μας έχει αξίες qΕγώ για κάθε μία από τις αναλογίες. Η δήλωση των μηδενικών και εναλλακτικών υποθέσεων έχει ως εξής:

Για μια καλή δοκιμασία προσαρμογής, έχουμε ένα θεωρητικό μοντέλο για τον τρόπο με τον οποίο πρέπει να αναλογούν τα δεδομένα μας. Απλά πολλαπλασιάζουμε αυτές τις αναλογίες με το μέγεθος του δείγματος n για να λάβουμε τις αναμενόμενες μετρήσεις μας.

instagram viewer

Η στατιστική chi-square για τη δοκιμασία καλής κατάστασης προσδιορίζεται με τη σύγκριση της πραγματικής και της αναμενόμενης μέτρησης για κάθε επίπεδο της κατηγορικής μας μεταβλητής. Τα βήματα για τον υπολογισμό του chi-square στατιστικού στοιχείου για μια καλή δοκιμασία προσαρμογής είναι τα εξής:

Εάν το θεωρητικό μας μοντέλο ταιριάζει απόλυτα με τα δεδομένα που έχουν παρατηρηθεί, τότε οι αναμενόμενες μετρήσεις δεν θα παρουσιάσουν καμιά απόκλιση από τις παρατηρούμενες μετρήσεις της μεταβλητής μας. Αυτό θα σημαίνει ότι θα έχουμε ένα chi-square στατιστικό στοιχείο μηδέν. Σε οποιαδήποτε άλλη περίπτωση, η στατιστική chi-square θα είναι ένας θετικός αριθμός.

Το chi-square στατιστικό στοιχείο που υπολογίσαμε αντιστοιχεί σε μια συγκεκριμένη θέση σε μια κατανομή chi-square με τον κατάλληλο αριθμό βαθμών ελευθερίας. ο p-value καθορίζει την πιθανότητα απόκτησης στατιστικού τεστ αυτού του ακραίου, υποθέτοντας ότι η μηδενική υπόθεση είναι αληθής. Μπορούμε να χρησιμοποιήσουμε έναν πίνακα τιμών για μια κατανομή chi-square για να καθορίσουμε την p-τιμή της δοκιμασίας μας. Εάν διαθέτουμε στατιστικό λογισμικό, τότε αυτό μπορεί να χρησιμοποιηθεί για να ληφθεί μια καλύτερη εκτίμηση της τιμής p.

Δημιουργούμε την απόφασή μας για το αν θα απορρίψουμε τη μηδενική υπόθεση βάσει ενός προκαθορισμένου επιπέδου σημασίας. Αν η τιμή p είναι μικρότερη ή ίση με αυτό το επίπεδο σπουδαιότητας, απορρίπτουμε την μηδενική υπόθεση. Διαφορετικά, εμείς αποτυγχάνουν να απορρίψουν η μηδενική υπόθεση.