Μερικές φορές στις στατιστικές, είναι χρήσιμο να δούμε να δουλεύουμε παραδείγματα προβλημάτων. Αυτά τα παραδείγματα μπορούν να μας βοηθήσουν στην εξεύρεση παρόμοιων προβλημάτων. Σε αυτό το άρθρο, θα περάσουμε από τη διαδικασία της διεξαγωγής στατιστικών στοιχείων για ένα αποτέλεσμα που αφορά δύο μέσα πληθυσμού. Όχι μόνο θα δούμε πώς να το κάνουμε δοκιμή υποθέσεων για τη διαφορά των δύο μέσων πληθυσμού, θα κατασκευάσουμε επίσης ένα διάστημα εμπιστοσύνης για αυτή τη διαφορά. Οι μέθοδοι που χρησιμοποιούμε μερικές φορές αποκαλούνται δοκιμή δύο δειγμάτων t και ένα διάστημα δειγματοληψίας δύο δειγμάτων t.
Η δήλωση του προβλήματος
Ας υποθέσουμε ότι θέλουμε να δοκιμάσουμε τη μαθηματική ικανότητα των παιδιών δημοτικού. Μια ερώτηση που μπορεί να έχουμε είναι αν τα υψηλότερα επίπεδα έχουν υψηλότερες μέσες βαθμολογίες δοκιμών.
Ένα απλό τυχαίο δείγμα των 27 τρίτων γκρέιντερ λαμβάνει ένα τεστ μαθηματικών μαθημάτων, οι απαντήσεις τους βαθμολογούνται και τα αποτελέσματα διαπιστώνονται ότι έχουν μέση βαθμολογία 75 βαθμών με ένα τυπική απόκλιση δείγματος από 3 βαθμούς.
Ένα απλό τυχαίο δείγμα των 20 πέμπτων γκρέιντερ δίνει το ίδιο τεστ μαθηματικών και οι απαντήσεις τους βαθμολογούνται. Η μέση βαθμολογία για τον πέμπτο γκρέιντερ είναι 84 μονάδες με τυπική απόκλιση δείγματος 5 βαθμών.
Λαμβάνοντας υπόψη αυτό το σενάριο, θέτουμε τις ακόλουθες ερωτήσεις:
- Τα δείγματα δεδομένων μας παρέχουν στοιχεία ότι η μέση βαθμολογία δοκιμής του πληθυσμού όλων των πέμπτων γκρέιντερ υπερβαίνει τη μέση βαθμολογία δοκιμής του πληθυσμού όλων των τρίτων γκρέιντερ;
- Ποιο είναι το διάστημα εμπιστοσύνης 95% για τη διαφορά στις μέσες βαθμολογίες δοκιμών μεταξύ των πληθυσμών τρίτων γκρέιντερ και πέμπτων γκρέιντερ;
Όροι και διαδικασία
Πρέπει να επιλέξουμε ποια διαδικασία θα χρησιμοποιήσουμε. Με τον τρόπο αυτό πρέπει να διασφαλίσουμε και να ελέγξουμε ότι πληρούνται οι όροι για τη διαδικασία αυτή. Μας ζητείται να συγκρίνουμε δύο μέσα πληθυσμού. Μία συλλογή μεθόδων που μπορούν να χρησιμοποιηθούν για να γίνει αυτό είναι εκείνες για διαδικασίες t-δειγμάτων δύο δειγμάτων.
Προκειμένου να χρησιμοποιηθούν αυτές οι διαδικασίες t για δύο δείγματα, πρέπει να βεβαιωθούμε ότι τηρούνται οι ακόλουθες συνθήκες:
- Έχουμε δύο απλά τυχαία δείγματα από τους δύο πληθυσμούς ενδιαφέροντος.
- Τα απλά τυχαία δείγματα δεν αποτελούν περισσότερο από το 5% του πληθυσμού.
- Τα δύο δείγματα είναι ανεξάρτητα το ένα από το άλλο και δεν υπάρχει αντιστοιχία μεταξύ των θεμάτων.
- Η μεταβλητή κατανέμεται κανονικά.
- Τόσο ο μέσος πληθυσμός όσο και η τυπική απόκλιση είναι άγνωστοι και για τους δύο πληθυσμούς.
Βλέπουμε ότι πληρούνται οι περισσότερες από αυτές τις προϋποθέσεις. Μας είπαν ότι έχουμε απλά τυχαία δείγματα. Οι πληθυσμοί που μελετούμε είναι μεγάλοι, καθώς υπάρχουν εκατομμύρια μαθητών σε αυτά τα επίπεδα.
Η προϋπόθεση που δεν μπορούμε να υποθέσουμε αυτόματα είναι εάν οι βαθμολογίες των δοκιμών διανέμονται κανονικά. Δεδομένου ότι έχουμε ένα αρκετά μεγάλο μέγεθος δείγματος, από την ευρωστία των t-διαδικασιών μας, δεν χρειάζεται απαραιτήτως η κανονικά κατανεμημένη μεταβλητή.
Δεδομένου ότι πληρούνται οι προϋποθέσεις, εκτελούμε δυο προκαταρκτικούς υπολογισμούς.
Πρότυπο σφάλμα
Το τυπικό σφάλμα είναι μια εκτίμηση μιας τυπικής απόκλισης. Για αυτό το στατιστικό, προσθέτουμε τη διακύμανση του δείγματος των δειγμάτων και στη συνέχεια λαμβάνουμε την τετραγωνική ρίζα. Αυτό δίνει τον τύπο:
(μικρό1 2 / n1 + μικρό22 / n2)1/2
Χρησιμοποιώντας τις παραπάνω τιμές, βλέπουμε ότι η τιμή του τυπικού σφάλματος είναι
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
Βαθμοί ελευθερίας
Μπορούμε να χρησιμοποιήσουμε τη συντηρητική προσέγγιση για μας βαθμοί ελευθερίας. Αυτό μπορεί να υποτιμήσει τον αριθμό των βαθμών ελευθερίας, αλλά είναι πολύ πιο εύκολο να υπολογιστεί από τη χρήση της φόρμουλας του Welch. Χρησιμοποιούμε το μικρότερο από τα δύο μεγέθη δείγματος και στη συνέχεια αφαιρούμε ένα από αυτόν τον αριθμό.
Για παράδειγμα, το μικρότερο από τα δύο δείγματα είναι 20. Αυτό σημαίνει ότι ο αριθμός βαθμών ελευθερίας είναι 20 - 1 = 19.
Δοκιμασία Υπόθεσης
Επιθυμούμε να δοκιμάσουμε την υπόθεση ότι οι σπουδαστές πέμπτου βαθμού έχουν ένα μέσο όρο δοκιμής μεγαλύτερο από το μέσο σκορ των σπουδαστών τρίτου βαθμού. Ας μ1 να είναι η μέση βαθμολογία του πληθυσμού όλων των πέμπτων γκρέιντερ. Ομοίως, αφήσαμε μ2 να είναι η μέση βαθμολογία του πληθυσμού όλων των τρίτων γκρέιντερ.
Οι υποθέσεις είναι οι εξής:
- H0: μ1 - μ2 = 0
- Hένα: μ1 - μ2 > 0
Το στατιστικό αποτέλεσμα της δοκιμής είναι η διαφορά μεταξύ του μέσου δειγματοληψίας, το οποίο στη συνέχεια διαιρείται με το τυπικό σφάλμα. Δεδομένου ότι χρησιμοποιούμε τυπικές αποκλίσεις δειγμάτων για την εκτίμηση της τυπικής απόκλισης του πληθυσμού, το στατιστικό αποτέλεσμα της δοκιμής από την κατανομή t.
Η τιμή της στατιστικής δοκιμής είναι (84 - 75) / 1,2583. Αυτό είναι περίπου 7,15.
Τώρα καθορίζουμε ποια είναι η τιμή p για αυτή τη δοκιμασία υποθέσεων. Εξετάζουμε την αξία της στατιστικής δοκιμής και όπου βρίσκεται σε κατανομή t με 19 βαθμούς ελευθερίας. Για αυτή τη διανομή, έχουμε 4,2 x 10-7 ως p-αξία μας. (Ένας τρόπος για να προσδιοριστεί αυτό είναι να χρησιμοποιήσετε τη λειτουργία T.DIST.RT στο Excel.)
Δεδομένου ότι έχουμε μια τόσο μικρή τιμή p, απορρίπτουμε την μηδενική υπόθεση. Το συμπέρασμα είναι ότι η μέση βαθμολογία δοκιμής για τους πέμπτους γκρέιντερ είναι υψηλότερη από τη μέση βαθμολογία δοκιμής για τους τρίτους γκρέιντερ.
Διάστημα εμπιστοσύνης
Δεδομένου ότι έχουμε διαπιστώσει ότι υπάρχει διαφορά μεταξύ των μέσων αποτελεσμάτων, τώρα καθορίζουμε ένα διάστημα εμπιστοσύνης για τη διαφορά μεταξύ αυτών των δύο μέσων. Έχουμε ήδη πολλά από αυτά που χρειαζόμαστε. Το διάστημα εμπιστοσύνης για τη διαφορά πρέπει να έχει εκτίμηση και περιθώριο σφάλματος.
Η εκτίμηση για τη διαφορά δύο μέσων είναι απλή για υπολογισμό. Βρίσκουμε απλά τη διαφορά των μέσων δειγματοληψίας. Αυτή η διαφορά του δείγματος σημαίνει την εκτίμηση της διαφοράς του πληθυσμού.
Για τα δεδομένα μας, η διαφορά στο μέσο δείγματος είναι 84 - 75 = 9.
Το περιθώριο σφάλματος είναι λίγο πιο δύσκολο να υπολογιστεί. Για αυτό, πρέπει να πολλαπλασιάσουμε την κατάλληλη στατιστική με το τυπικό σφάλμα. Το στατιστικό στοιχείο που χρειαζόμαστε βρίσκεται με τη βοήθεια ενός πίνακα ή ενός στατιστικού λογισμικού.
Και πάλι χρησιμοποιώντας τη συντηρητική προσέγγιση, έχουμε 19 βαθμούς ελευθερίας. Για ένα διάστημα εμπιστοσύνης 95% βλέπουμε ότι t* = 2.09. Θα μπορούσαμε να χρησιμοποιήσουμε το T.INV στη λειτουργία Excel για να υπολογίσετε αυτήν την τιμή.
Τώρα βάζουμε τα πάντα μαζί και βλέπουμε ότι το περιθώριο σφάλματος είναι 2,09 x 1,2583, το οποίο είναι περίπου 2,63. Το διάστημα εμπιστοσύνης είναι 9 ± 2,63. Το διάστημα είναι 6,37 έως 11,63 μονάδες στη δοκιμή που επέλεξε ο πέμπτος και ο τρίτος γκρέιντερ.