Τα διαστήματα εμπιστοσύνης αποτελούν βασικό μέρος των στατιστικών συμπερασμάτων. Μπορούμε να χρησιμοποιήσουμε κάποιες πιθανότητες και πληροφορίες από ένα κατανομή πιθανότητας για την εκτίμηση μιας παραμέτρου πληθυσμού με τη χρήση ενός δείγματος. Η δήλωση του διάστημα εμπιστοσύνης γίνεται με τέτοιο τρόπο ώστε να είναι εύκολα παρεξηγημένη. Θα εξετάσουμε τη σωστή ερμηνεία των διαστημάτων εμπιστοσύνης και θα διερευνήσουμε τέσσερα λάθη που γίνονται σχετικά με αυτόν τον τομέα στατιστικών.
Τι είναι το διάστημα εμπιστοσύνης;
Ένα διάστημα εμπιστοσύνης μπορεί να εκφραστεί είτε ως εύρος τιμών είτε ως εξής:
Εκτίμηση ± Περιθώριο σφάλματος
Ένα διάστημα εμπιστοσύνης τυπικά δηλώνεται με ένα επίπεδο εμπιστοσύνης.Κοινά επίπεδα εμπιστοσύνης είναι 90%, 95% και 99%.
Θα δούμε ένα παράδειγμα όπου θέλουμε να χρησιμοποιήσουμε ένα δείγμα για να υπολογίσουμε το μέσο όρο ενός πληθυσμού. Υποθέστε ότι αυτό οδηγεί σε ένα διάστημα εμπιστοσύνης από 25 έως 30. Αν λέμε ότι είμαστε 95% βέβαιοι ότι ο άγνωστος πληθυσμός σημαίνω
περιέχεται σε αυτό το διάστημα, τότε πραγματικά λέμε ότι βρήκαμε το διάστημα χρησιμοποιώντας μια μέθοδο που είναι επιτυχής στην απόδοση των σωστών αποτελεσμάτων 95% του χρόνου. Μακροπρόθεσμα, η μέθοδος μας θα είναι ανεπιτυχής 5% του χρόνου. Με άλλα λόγια, θα αποτύχουμε να καταγράψουμε τον πραγματικό πληθυσμό να σημαίνει μόνο ένα από κάθε 20 φορές.Λάθος # 1
Θα εξετάσουμε τώρα μια σειρά διαφορετικών σφαλμάτων που μπορούν να γίνουν όταν πρόκειται για διαστήματα εμπιστοσύνης. Μία λανθασμένη δήλωση που γίνεται συχνά σχετικά με ένα διάστημα εμπιστοσύνης με επίπεδο εμπιστοσύνης 95% είναι ότι υπάρχει πιθανότητα 95% ότι το διάστημα εμπιστοσύνης περιέχει τον πραγματικό μέσο όρο του πληθυσμού.
Ο λόγος ότι πρόκειται για ένα λάθος είναι στην πραγματικότητα αρκετά λεπτή. Η βασική ιδέα που σχετίζεται με ένα διάστημα εμπιστοσύνης είναι ότι η πιθανότητα που χρησιμοποιείται εισέρχεται στην εικόνα με η μέθοδος που χρησιμοποιείται, για τον προσδιορισμό του διαστήματος εμπιστοσύνης είναι ότι αναφέρεται στη μέθοδο που είναι μεταχειρισμένος.
Λάθος # 2
Ένα δεύτερο λάθος είναι η ερμηνεία ενός διαστήματος εμπιστοσύνης 95% λέγοντας ότι το 95% όλων των τιμών δεδομένων στον πληθυσμό εμπίπτουν εντός του διαστήματος. Και πάλι, το 95% μιλάει για τη μέθοδο της δοκιμής.
Για να δούμε γιατί η παραπάνω δήλωση είναι λανθασμένη, θα μπορούσαμε να εξετάσουμε έναν κανονικό πληθυσμό με α τυπική απόκλιση από 1 και μέσο όρο 5. Ένα δείγμα που είχε δύο σημεία δεδομένων, το καθένα με τιμές 6 έχει μέσο δείγματος 6. Ένα διάστημα εμπιστοσύνης 95% για τον μέσο πληθυσμό θα ήταν 4,6 έως 7,4. Αυτό σαφώς δεν συμπίπτει με το 95% του κανονική κατανομή, οπότε δεν θα περιέχει το 95% του πληθυσμού.
Λάθος # 3
Ένα τρίτο λάθος είναι ότι ένα 95% διάστημα εμπιστοσύνης υπονοεί ότι το 95% όλων των πιθανών μέσων δειγματοληψίας εμπίπτει στο εύρος του διαστήματος. Επαναλάβετε το παράδειγμα από την τελευταία ενότητα. Κάθε δείγμα μεγέθους δύο που αποτελείται από τιμές μικρότερες από 4,6 θα είχε μέσο μικρότερο από 4,6. Επομένως, αυτά τα μέσα δειγμάτων θα πέσουν εκτός αυτού του συγκεκριμένου διαστήματος εμπιστοσύνης. Τα δείγματα που αντιστοιχούν στην περιγραφή αυτή αντιπροσωπεύουν περισσότερο από το 5% του συνολικού ποσού. Επομένως, είναι λάθος να πούμε ότι αυτό το διάστημα εμπιστοσύνης συγκεντρώνει το 95% όλων των μέσων δειγματοληψίας.
Λάθος # 4
Ένα τέταρτο λάθος στην αντιμετώπιση των διαστημάτων εμπιστοσύνης είναι να πιστεύουμε ότι αποτελούν τη μόνη πηγή σφάλματος. Ενώ υπάρχει ένα περιθώριο σφάλματος που συνδέεται με ένα διάστημα εμπιστοσύνης, υπάρχουν και άλλα σημεία που τα σφάλματα μπορούν να μετατοπιστούν σε μια στατιστική ανάλυση. Δύο παραδείγματα τέτοιων σφαλμάτων μπορεί να οφείλονται σε λανθασμένο σχεδιασμό του πειράματος, προκατάληψη στη δειγματοληψία ή αδυναμία λήψης δεδομένων από ένα ορισμένο υποσύνολο του πληθυσμού.