Πώς να υπολογίσετε το περιθώριο σφάλματος

Πολλές φορές πολιτικές δημοσκοπήσεις και άλλες εφαρμογές στατιστικών στοιχείων δηλώνουν τα αποτελέσματά τους με ένα περιθώριο σφάλματος. Δεν είναι ασυνήθιστο να βλέπουμε ότι μια δημοσκόπηση λέει ότι υπάρχει υποστήριξη για ένα ζήτημα ή υποψήφιο σε ένα ορισμένο ποσοστό των ερωτηθέντων, συν και μείον ένα ορισμένο ποσοστό. Αυτός ο συν πλην και ο μείος όρος είναι το περιθώριο λάθους. Αλλά πώς υπολογίζεται το περιθώριο σφάλματος; Για ένα απλό τυχαίο δείγμα ενός επαρκώς μεγάλου πληθυσμού, το περιθώριο ή το σφάλμα είναι στην πραγματικότητα απλώς μια ανακεφαλαίωση του μεγέθους του δείγματος και του επιπέδου εμπιστοσύνης που χρησιμοποιείται.

Ο τύπος για το περιθώριο σφάλματος

Στη συνέχεια, θα χρησιμοποιήσουμε τον τύπο για το περιθώριο σφάλματος. Θα προγραμματίσουμε τη χειρότερη περίπτωση, στην οποία δεν έχουμε ιδέα για το ποιο είναι το πραγματικό επίπεδο υποστήριξης τα θέματα της δημοσκόπησης μας. Εάν είχαμε κάποια ιδέα για αυτόν τον αριθμό, πιθανώς μέσω προηγούμενων δεδομένων ψηφοφορίας, θα καταλήγαμε με ένα μικρότερο περιθώριο σφάλματος.

instagram viewer

Ο τύπος που θα χρησιμοποιήσουμε είναι: μι = zα/2/ (2√n)

Το επίπεδο εμπιστοσύνης

Η πρώτη πληροφορία που χρειαζόμαστε για να υπολογίσουμε το περιθώριο σφάλματος είναι να καθορίσουμε το επίπεδο εμπιστοσύνης που επιθυμούμε. Αυτός ο αριθμός μπορεί να είναι οποιοδήποτε ποσοστό μικρότερο από 100%, αλλά τα πιο κοινά επίπεδα εμπιστοσύνης είναι 90%, 95% και 99%. Από αυτά τα τρία, το 95% χρησιμοποιείται συχνότερα.

Αν αφαιρέσουμε το επίπεδο εμπιστοσύνης από το ένα, τότε θα πάρουμε την τιμή του άλφα, γραμμένου ως α, που απαιτείται για τον τύπο.

Η κρίσιμη τιμή

Το επόμενο βήμα στον υπολογισμό του περιθωρίου ή του σφάλματος είναι η εύρεση της κατάλληλης κρίσιμης τιμής. Αυτό υποδηλώνεται από τον όρο zα/2 στον παραπάνω τύπο. Δεδομένου ότι έχουμε πάρει ένα απλό τυχαίο δείγμα ενός μεγάλου πληθυσμού, μπορούμε να χρησιμοποιήσουμε το κανονική κανονική κατανομή του z-ακόμη.

Ας υποθέσουμε ότι εργαζόμαστε με επίπεδο εμπιστοσύνης 95%. Θέλουμε να κοιτάξουμε z-σκορ z *για το οποίο η περιοχή μεταξύ -z * και z * είναι 0,95. Από τον πίνακα βλέπουμε ότι αυτή η κρίσιμη τιμή είναι 1,96.

Θα μπορούσαμε επίσης να βρούμε την κρίσιμη τιμή με τον ακόλουθο τρόπο. Αν σκεφτούμε από άποψη α / 2, αφού α = 1 - 0.95 = 0.05, βλέπουμε ότι α / 2 = 0.025. Τώρα ψάχνουμε στο τραπέζι για να βρούμε το z-Score με μια περιοχή 0,025 στα δεξιά της. Θα καταλήγαμε με την ίδια κρίσιμη τιμή 1,96.

Άλλα επίπεδα εμπιστοσύνης θα μας δώσουν διαφορετικές κρίσιμες τιμές. Όσο υψηλότερο είναι το επίπεδο εμπιστοσύνης, τόσο μεγαλύτερη θα είναι η κρίσιμη τιμή. Η κρίσιμη τιμή για επίπεδο εμπιστοσύνης 90%, με αντίστοιχη τιμή α 0,10, είναι 1,64. Η κρίσιμη τιμή για επίπεδο εμπιστοσύνης 99%, με αντίστοιχη τιμή α 0,01, είναι 2,54.

Το μέγεθος του δείγματος

Ο μόνος άλλος αριθμός που πρέπει να χρησιμοποιήσουμε για να υπολογίσουμε τον τύπο περιθώριο σφάλματος είναι το το μέγεθος του δείγματος, που υποδηλώνεται με n στον τύπο. Στη συνέχεια λαμβάνουμε την τετραγωνική ρίζα αυτού του αριθμού.

Λόγω της θέσης αυτού του αριθμού στον παραπάνω τύπο, τόσο μεγαλύτερη είναι η τιμή το μέγεθος του δείγματος που χρησιμοποιούμε, τόσο μικρότερο θα είναι το περιθώριο σφάλματος. Επομένως, τα μεγάλα δείγματα είναι προτιμότερα από τα μικρότερα. Ωστόσο, δεδομένου ότι η στατιστική δειγματοληψία απαιτεί πόρους χρόνου και χρήματος, υπάρχουν περιορισμοί στο πόσο μπορούμε να αυξήσουμε το μέγεθος του δείγματος. Η παρουσία της τετραγωνικής ρίζας στον τύπο σημαίνει ότι τετραπλασιάζοντας το μέγεθος του δείγματος θα είναι μόνο το ήμισυ του περιθωρίου σφάλματος.

Μερικά παραδείγματα

Για να κατανοήσουμε τη φόρμουλα, ας δούμε μερικά παραδείγματα.

  1. Ποιο είναι το περιθώριο λάθους για ένα απλό τυχαίο δείγμα 900 ατόμων σε ποσοστό 95%επίπεδο εμπιστοσύνης?
  2. Με τη χρήση του πίνακα έχουμε μια κρίσιμη τιμή 1,96, και έτσι το περιθώριο σφάλματος είναι 1,96 / (2 √ 900 = 0,03267, ή περίπου 3,3%.
  3. Ποιο είναι το περιθώριο λάθους για ένα απλό τυχαίο δείγμα 1600 ατόμων με επίπεδο εμπιστοσύνης 95%;
  4. Στο ίδιο επίπεδο αυτοπεποίθηση ως το πρώτο παράδειγμα, η αύξηση του μεγέθους του δείγματος στα 1600 μας δίνει ένα περιθώριο σφάλματος 0.0245 ή περίπου 2.5%.
instagram story viewer