Δοκιμασία Υπόθεσης για τη σύγκριση δύο αναλογιών

Σε αυτό το άρθρο θα περάσουμε από τα απαραίτητα βήματα για την εκτέλεση ενός δοκιμή υποθέσεων, ή δοκιμασία σημασίας, για τη διαφορά δύο αναλογιών πληθυσμού. Αυτό μας επιτρέπει να συγκρίνουμε δύο άγνωστες αναλογίες και να συναγάγουμε αν δεν είναι ίσες μεταξύ τους ή εάν είναι μεγαλύτερες από τις άλλες.

Επισκόπηση δοκιμής υποθέσεων και φόντο

Προτού αναφερθούμε στις λεπτομέρειες της δοκιμασίας μας, θα εξετάσουμε το πλαίσιο των δοκιμασιών υποθέσεων. Σε μια δοκιμαστική προσπάθεια προσπαθούμε να δείξουμε ότι μια δήλωση σχετικά με την αξία ενός πληθυσμού παράμετρο (ή μερικές φορές η φύση του ίδιου του πληθυσμού) είναι πιθανό να είναι αλήθεια.

Συγκεντρώνουμε στοιχεία για αυτή τη δήλωση διενεργώντας ένα στατιστικό δείγμα. Υπολογίζουμε ένα στατιστικό στοιχείο από αυτό το δείγμα. Η αξία αυτού του στατιστικού στοιχείου είναι αυτό που χρησιμοποιούμε για να προσδιορίσουμε την αλήθεια της αρχικής δήλωσης. Αυτή η διαδικασία περιέχει αβεβαιότητα, ωστόσο είμαστε σε θέση να προσδιορίσουμε ποσοτικά αυτήν την αβεβαιότητα

instagram viewer

Η συνολική διαδικασία για μια δοκιμή υπόθεσης δίνεται από τον παρακάτω κατάλογο:

  1. Βεβαιωθείτε ότι πληρούνται οι προϋποθέσεις που είναι απαραίτητες για τη δοκιμή μας.
  2. Σαφώς δηλώστε το μηδενικές και εναλλακτικές υποθέσεις. Η εναλλακτική υπόθεση μπορεί να περιλαμβάνει μια μονόπλευρη ή μια διπλή εξέταση. Θα πρέπει επίσης να προσδιορίσουμε το επίπεδο σπουδαιότητας, το οποίο θα επισημανθεί με το ελληνικό γράμμα άλφα.
  3. Υπολογίστε το στατιστικό αποτέλεσμα της δοκιμής. Ο τύπος στατιστικής που χρησιμοποιούμε εξαρτάται από τη συγκεκριμένη δοκιμασία που διεξάγουμε. Ο υπολογισμός βασίζεται στο στατιστικό μας δείγμα.
  4. Υπολογίστε το p-value. Το στατιστικό αποτέλεσμα της δοκιμής μπορεί να μεταφραστεί σε μια τιμή p. Μια τιμή p είναι η πιθανότητα τύχης από μόνη της την παραγωγή της αξίας της στατιστικής δοκιμής υπό την προϋπόθεση ότι η μηδενική υπόθεση είναι αληθής. Ο γενικός κανόνας είναι ότι όσο μικρότερη είναι η τιμή p, τόσο μεγαλύτερες είναι οι ενδείξεις κατά της μηδενικής υπόθεσης.
  5. Εξάγουμε ένα συμπέρασμα. Τέλος, χρησιμοποιούμε την τιμή του άλφα που είχε ήδη επιλεγεί ως τιμή κατωφλίου. Ο κανόνας της απόφασης είναι ότι Εάν η τιμή p είναι μικρότερη ή ίση με την άλφα, τότε απορρίπτουμε την μηδενική υπόθεση. Διαφορετικά εμείς αποτυγχάνουν να απορρίψουν η μηδενική υπόθεση.

Τώρα που έχουμε δει το πλαίσιο για μια δοκιμή υποθέσεων, θα δούμε τις λεπτομέρειες για μια δοκιμή υποθέσεων για τη διαφορά δύο αναλογιών πληθυσμού.

Τις συνθήκες

Μια δοκιμή υποθέσεων για τη διαφορά δύο αναλογιών πληθυσμού απαιτεί να πληρούνται οι ακόλουθες προϋποθέσεις:

  • Έχουμε δύο απλά τυχαία δείγματα από μεγάλους πληθυσμούς. Εδώ "μεγάλο" σημαίνει ότι ο πληθυσμός είναι τουλάχιστον 20 φορές μεγαλύτερος από το μέγεθος του δείγματος. Τα μεγέθη του δείγματος θα σημειωθούν με το n1 και n2.
  • Τα άτομα στα δείγματα μας έχουν επιλεγεί ανεξάρτητα το ένα από το άλλο. Οι ίδιοι οι πληθυσμοί πρέπει επίσης να είναι ανεξάρτητοι.
  • Υπάρχουν τουλάχιστον 10 επιτυχίες και 10 αποτυχίες και στα δύο δείγματα.

Όσο πληρούνται αυτές οι συνθήκες, μπορούμε να συνεχίσουμε με τη δοκιμή της υπόθεσής μας.

Οι μηδενικές και εναλλακτικές υποθέσεις

Τώρα πρέπει να εξετάσουμε τις υποθέσεις για τη δοκιμασία μας σημασίας. Η μηδενική υπόθεση είναι η δήλωση μας που δεν έχει αποτέλεσμα. Σε αυτή τη συγκεκριμένη δοκιμασία τύπου υποθέσεων η μηδενική μας υπόθεση είναι ότι δεν υπάρχει διαφορά μεταξύ των δύο αναλογιών του πληθυσμού. Μπορούμε να γράψουμε αυτό ως Η0: Π1 = Π2.

Η εναλλακτική υπόθεση είναι μια από τις τρεις δυνατότητες, ανάλογα με τις ιδιαιτερότητες του τι δοκιμάζουμε:

  • Hένα: Π1 είναι μεγαλύτερο από Π2. Πρόκειται για δοκιμή μονής ή μονής όψης.
  • Hένα: Π1 είναι λιγότερο από Π2. Αυτή είναι και η μονόπλευρη δοκιμή.
  • Hένα: Π1 δεν είναι ίσο με Π2. Πρόκειται για μια δίχωρη ή δοκιμή δύο όψεων.

Όπως πάντα, για να είμαστε προσεκτικοί, θα πρέπει να χρησιμοποιήσουμε την εναλλακτική υπόθεση δύο όψεων αν δεν έχουμε κατεύθυνση πριν λάβουμε το δείγμα μας. Ο λόγος για να γίνει αυτό είναι ότι είναι πιο δύσκολο να απορριφθεί η μηδενική υπόθεση με δοκιμασία δύο όψεων.

Οι τρεις υποθέσεις μπορούν να ξαναγραφούν δηλώνοντας πώς Π1 - Π2 σχετίζεται με την τιμή μηδέν. Για να είμαστε πιο συγκεκριμένοι, η μηδενική υπόθεση θα γίνει Η0:Π1 - Π2 = 0. Οι πιθανές εναλλακτικές υποθέσεις θα γράφονται ως εξής:

  • Hένα: Π1 - Π2 > 0 είναι ισοδύναμο με τη δήλωση "Π1 είναι μεγαλύτερο από Π2."
  • Hένα: Π1 - Π2 <0 είναι ισοδύναμη με τη δήλωση "Π1 είναι λιγότερο από Π2."
  • Hένα: Π1 - Π2 ≠ 0 ισοδυναμεί με τη δήλωση "Π1 δεν είναι ίσο με Π2."

Αυτή η ισοδύναμη διατύπωση μας δείχνει πραγματικά λίγο περισσότερο από αυτό που συμβαίνει πίσω από τις σκηνές. Αυτό που κάνουμε σε αυτή τη δοκιμασία υποθέσεων είναι η μετατροπή των δύο παραμέτρων Π1 και Π2 στην ενιαία παράμετρο Π1 - Π2. Στη συνέχεια δοκιμάζουμε αυτήν τη νέα παράμετρο σε σχέση με την τιμή μηδέν.

Η στατιστική δοκιμών

Ο τύπος της στατιστικής δοκιμής δίνεται στην παραπάνω εικόνα. Ακολουθεί μια εξήγηση για καθέναν από τους όρους:

  • Το δείγμα από τον πρώτο πληθυσμό έχει μέγεθος n1. Ο αριθμός των επιτυχιών από αυτό το δείγμα (που δεν φαίνεται απευθείας στον παραπάνω τύπο) είναι κ1.
  • Το δείγμα από το δεύτερο πληθυσμό έχει μέγεθος n2. Ο αριθμός των επιτυχιών από αυτό το δείγμα είναι κ2.
  • Οι αναλογίες του δείγματος είναι p1-καπέλο = k1 / n1 και π2-hat = k2 / n2 .
  • Στη συνέχεια συνδυάζουμε ή συγκεντρώνουμε τις επιτυχίες και από τα δύο δείγματα και λαμβάνουμε: p-hat = (k1 + k2) / (η1 + n2).

Όπως πάντα, προσέξτε με τη σειρά των λειτουργιών κατά τον υπολογισμό. Όλα κάτω από τη ρίζα πρέπει να υπολογιστούν πριν πάρουμε την τετραγωνική ρίζα.

Η τιμή P

Το επόμενο βήμα είναι να υπολογίσουμε την τιμή p που αντιστοιχεί στο στατιστικό μας τεστ. Χρησιμοποιούμε μια κανονική κανονική κατανομή για τα στατιστικά στοιχεία μας και συμβουλευτείτε έναν πίνακα αξιών ή χρησιμοποιήστε στατιστικό λογισμικό.

Οι λεπτομέρειες του υπολογισμού της τιμής p εξαρτώνται από την εναλλακτική υπόθεση που χρησιμοποιούμε:

  • Για το Ηένα: Π1 - Π2 > 0, υπολογίζουμε το ποσοστό της κανονικής κατανομής που είναι μεγαλύτερο από Ζ.
  • Για το Ηένα: Π1 - Π2 <0, υπολογίζουμε το ποσοστό της κανονικής κατανομής που είναι μικρότερο από Ζ.
  • Για το Ηένα: Π1 - Π2 ≠ 0, υπολογίζουμε το ποσοστό της κανονικής κατανομής που είναι μεγαλύτερο από |Ζ|, η απόλυτη τιμή του Ζ. Μετά από αυτό, για να υπολογίσουμε το γεγονός ότι έχουμε δοκιμασία δύο ουρών, διπλασιάζουμε το ποσοστό.

Κανόνας απόφασης

Τώρα αποφασίζουμε αν θα απορρίψουμε τη μηδενική υπόθεση (και συνεπώς θα αποδεχθούμε την εναλλακτική λύση), ή να μην απορρίψουμε τη μηδενική υπόθεση. Πραγματοποιούμε αυτή την απόφαση συγκρίνοντας την τιμή p με το επίπεδο σημασίας alpha.

  • Εάν η τιμή p είναι μικρότερη ή ίση με την άλφα, τότε απορρίπτουμε την μηδενική υπόθεση. Αυτό σημαίνει ότι έχουμε ένα στατιστικά σημαντικό αποτέλεσμα και ότι θα αποδεχθούμε την εναλλακτική υπόθεση.
  • Αν η τιμή p είναι μεγαλύτερη από την τιμή alpha, τότε αποτυγχάνουμε να απορρίψουμε την μηδενική υπόθεση. Αυτό δεν αποδεικνύει ότι η μηδενική υπόθεση είναι αλήθεια. Αντίθετα, αυτό σημαίνει ότι δεν έχουμε αποκτήσει αρκετά πειστικά στοιχεία για να απορρίψουμε τη μηδενική υπόθεση.

Ειδική σημείωση

ο διάστημα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού δεν συγκεντρώνει τις επιτυχίες, ενώ η δοκιμή της υπόθεσης. Ο λόγος για αυτό είναι ότι η μηδενική μας υπόθεση το προϋποθέτει Π1 - Π2 = 0. Το διάστημα εμπιστοσύνης δεν το κάνει αυτό. Μερικοί στατιστικολόγοι δεν συγκεντρώνουν τις επιτυχίες για αυτή τη δοκιμασία υποθέσεων και χρησιμοποιούν αντίθετα μια ελαφρώς τροποποιημένη έκδοση του παραπάνω στατιστικού τεστ.