Παράδειγμα δοκιμής καλής προσαρμογής

ο chi-square καλή δοκιμασία προσαρμογής είναι χρήσιμο να συγκρίνουμε ένα θεωρητικό μοντέλο στα παρατηρούμενα δεδομένα. Αυτή η δοκιμή είναι ένας τύπος της γενικότερης δοκιμής chi-square. Όπως συμβαίνει με οποιοδήποτε θέμα στα μαθηματικά ή στα στατιστικά στοιχεία, μπορεί να είναι χρήσιμο να δουλέψουμε με ένα παράδειγμα για να καταλάβουμε τι συμβαίνει, μέσω ενός παραδείγματος της chi-square goodness of fit test.

Εξετάστε μια τυπική συσκευασία M & Ms σοκολάτας γάλακτος. Υπάρχουν έξι διαφορετικά χρώματα: κόκκινο, πορτοκαλί, κίτρινο, πράσινο, μπλε και καφέ. Ας υποθέσουμε ότι είμαστε περίεργοι για τη διανομή αυτών των χρωμάτων και ρωτάμε, και τα έξι χρώματα εμφανίζονται σε ίσο ποσοστό; Αυτός είναι ο τύπος της ερώτησης που μπορεί να απαντηθεί με μια καλή δοκιμασία προσαρμογής.

Σύνθεση

Ξεκινάμε επισημαίνοντας τη ρύθμιση και γιατί είναι κατάλληλη η καλή συμπεριφορά. Η μεταβλητή του χρώματος είναι κατηγορηματική. Υπάρχουν έξι επίπεδα αυτής της μεταβλητής, που αντιστοιχούν στα έξι χρώματα που είναι δυνατά. Θα υποθέσουμε ότι τα Μ & Μ που μετράμε θα είναι ένα απλό τυχαίο δείγμα από τον πληθυσμό όλων των Μ & Μ.

instagram viewer

Μηδενικές και εναλλακτικές υποθέσεις

ο μηδενικές και εναλλακτικές υποθέσεις για το καλό της δοκιμής προσαρμογής αντανακλούν την υπόθεση ότι κάνουμε για τον πληθυσμό. Εφόσον δοκιμάζουμε αν τα χρώματα εμφανίζονται σε ίσες αναλογίες, η μηδενική μας υπόθεση είναι ότι όλα τα χρώματα εμφανίζονται στην ίδια αναλογία. Πιο επίσημα, αν Π1 είναι η αναλογία πληθυσμού κόκκινων καραμελών, Π2 είναι η αναλογία πληθυσμού πορτοκαλιών καραμελών και ούτω καθεξής, τότε η μηδενική υπόθεση είναι αυτή Π1 = Π2 =... = Π6 = 1/6.

Η εναλλακτική υπόθεση είναι ότι τουλάχιστον μία από τις αναλογίες του πληθυσμού δεν είναι ίση με 1/6.

Πραγματικές και αναμενόμενες μετρήσεις

Οι πραγματικές μετρήσεις είναι ο αριθμός των καραμελών για καθένα από τα έξι χρώματα. Ο αναμενόμενος αριθμός αναφέρεται σε αυτό που θα περίμενε κανείς αν η μηδενική υπόθεση ήταν αληθής. Θα αφήσουμε n να είναι το μέγεθος του δείγματος μας. Ο αναμενόμενος αριθμός κόκκινων καραμελών είναι Π1 n ή n/6. Στην πραγματικότητα, για αυτό το παράδειγμα, ο αναμενόμενος αριθμός καραμελών για καθένα από τα έξι χρώματα είναι απλά n φορές ΠΕγώ, ή n/6.

Chi-square στατιστική για την καλοσύνη του Fit

Θα υπολογίσουμε τώρα ένα chi-square στατιστικό στοιχείο για ένα συγκεκριμένο παράδειγμα. Ας υποθέσουμε ότι έχουμε ένα απλό τυχαίο δείγμα 600 M & M καραμέλες με την ακόλουθη κατανομή:

  • Οι 212 καραμέλες είναι μπλε.
  • 147 από τις καραμέλες είναι πορτοκαλί.
  • 103 από τις καραμέλες είναι πράσινες.
  • Οι 50 καραμέλες είναι κόκκινες.
  • Οι 46 καραμέλες είναι κίτρινες.
  • Οι 42 καραμέλες είναι καφέ.

Εάν η μηδενική υπόθεση ήταν αληθής, τότε οι αναμενόμενες μετρήσεις για κάθε ένα από αυτά τα χρώματα θα ήταν (1/6) x 600 = 100. Τώρα το χρησιμοποιούμε στον υπολογισμό της στατιστικής chi-square.

Υπολογίζουμε τη συνεισφορά στα στατιστικά μας από κάθε ένα από τα χρώματα. Το καθένα έχει τη μορφή (πραγματική - αναμενόμενη)2/Expected.:

  • Για το μπλε έχουμε (212 - 100)2/100 = 125.44
  • Για το πορτοκαλί έχουμε (147 - 100)2/100 = 22.09
  • Για το πράσινο έχουμε (103 - 100)2/100 = 0.09
  • Για το κόκκινο έχουμε (50 - 100)2/100 = 25
  • Για το κίτρινο έχουμε (46 - 100)2/100 = 29.16
  • Για καφέ έχουμε (42 - 100)2/100 = 33.64

Στη συνέχεια, συνυπολογίζουμε όλες αυτές τις συνεισφορές και καθορίζουμε ότι η chi-square στατιστική μας είναι 125.44 + 22.09 + 0.09 + 25 +29.16 + 33.64 = 235.42.

Βαθμοί ελευθερίας

Ο αριθμός των βαθμοί ελευθερίας για μια καλή δοκιμασία προσαρμογής είναι απλά ένα λιγότερο από τον αριθμό των επιπέδων της μεταβλητής μας. Δεδομένου ότι υπήρχαν έξι χρώματα, έχουμε 6 - 1 = 5 βαθμούς ελευθερίας.

Chi-τετράγωνο πίνακα και τιμή P

Το chi-square στατιστικό στοιχείο των 235,42 που υπολογίσαμε αντιστοιχεί σε μια συγκεκριμένη θέση σε μια chi-square κατανομή με πέντε βαθμούς ελευθερίας. Χρειαζόμαστε τώρα ένα p-value, για να προσδιοριστεί η πιθανότητα απόκτησης στατιστικής δοκιμής τουλάχιστον τόσο ακραίας όσο 235,42, ενώ υποθέτουμε ότι η μηδενική υπόθεση είναι αληθής.

Το Excel της Microsoft μπορεί να χρησιμοποιηθεί για αυτόν τον υπολογισμό. Διαπιστώνουμε ότι η στατιστική δοκιμής μας με πέντε βαθμούς ελευθερίας έχει p-τιμή 7,29 x 10-49. Αυτή είναι μια εξαιρετικά μικρή τιμή p.

Κανόνας απόφασης

Δημιουργούμε την απόφασή μας για το αν θα απορρίψουμε τη μηδενική υπόθεση βάσει του μεγέθους της τιμής p. Δεδομένου ότι έχουμε μια πολύ μικρή τιμή p, απορρίπτουμε την μηδενική υπόθεση. Καταλήγουμε στο συμπέρασμα ότι τα M & Ms δεν κατανέμονται ομοιόμορφα στα έξι διαφορετικά χρώματα. Μια ανάλυση παρακολούθησης θα μπορούσε να χρησιμοποιηθεί για τον προσδιορισμό ενός διαστήματος εμπιστοσύνης για την αναλογία πληθυσμού ενός συγκεκριμένου χρώματος.