Ποια είναι η κανονική προσέγγιση κατά την διωνυμική διανομή;

Τυχαίες μεταβλητές με διωνυμική κατανομή είναι γνωστό ότι είναι διακριτά. Αυτό σημαίνει ότι υπάρχει ένας μετρήσιμος αριθμός αποτελεσμάτων που μπορούν να εμφανιστούν σε μια διωνυμική κατανομή, με διαχωρισμό μεταξύ αυτών των αποτελεσμάτων. Για παράδειγμα, μια διωνυμική μεταβλητή μπορεί να πάρει μια τιμή τριών ή τεσσάρων, αλλά όχι έναν αριθμό μεταξύ τριών και τεσσάρων.

Με τον διακριτό χαρακτήρα μιας διωνυμικής κατανομής, είναι κάπως περίεργο το γεγονός ότι μια συνεχής τυχαία μεταβλητή μπορεί να χρησιμοποιηθεί για να προσεγγίσει μια διωνυμική κατανομή. Για πολλούς διωνυμικές κατανομές, μπορούμε να χρησιμοποιήσουμε μια κανονική κατανομή για να προσεγγίσουμε τις διωνυμικές μας πιθανότητες.

Αυτό μπορεί να διαπιστωθεί όταν κοιτάζετε n το κέρμα και το μίσθωμα Χ είναι ο αριθμός των κεφαλών. Σε αυτή την περίπτωση, έχουμε μια διωνυμική κατανομή με πιθανότητα επιτυχίας, όπως Π = 0,5. Καθώς αυξάνουμε τον αριθμό των ρίψεων, βλέπουμε ότι η πιθανότητα ιστόγραμμα έχει μεγαλύτερη και μεγαλύτερη ομοιότητα με μια κανονική κατανομή.

instagram viewer

Δήλωση της Κανονικής Προσέγγισης

Κάθε κανονική κατανομή ορίζεται πλήρως από δύο πραγματικούς αριθμούς. Αυτοί οι αριθμοί είναι ο μέσος όρος, ο οποίος μετρά το κέντρο της διανομής και το τυπική απόκλιση, η οποία μετρά την εξάπλωση της διανομής. Για μια δεδομένη διωνυμική κατάσταση πρέπει να είμαστε σε θέση να καθορίσουμε ποια κανονική κατανομή θα χρησιμοποιηθεί.

Η επιλογή της σωστής κανονικής κατανομής καθορίζεται από τον αριθμό των δοκιμών n στην διωνυμική ρύθμιση και τη συνεχή πιθανότητα επιτυχίας Π για κάθε μία από αυτές τις δοκιμές. Η κανονική προσέγγιση για τη διωνυμική μας μεταβλητή είναι ένας μέσος όρος np και τυπική απόκλιση της (np(1 - Π)0.5.

Για παράδειγμα, υποθέστε ότι υποθέσαμε σε κάθε μία από τις 100 ερωτήσεις μιας δοκιμής πολλαπλών επιλογών, όπου κάθε ερώτηση είχε μία σωστή απάντηση από τέσσερις επιλογές. Ο αριθμός των σωστών απαντήσεων Χ είναι μια δυαδική τυχαία μεταβλητή με n = 100 και Π = 0.25. Έτσι, αυτή η τυχαία μεταβλητή έχει μέσο όρο 100 (0.25) = 25 και τυπική απόκλιση (100 (0.25) (0.75))0.5 = 4.33. Μια κανονική κατανομή με μέσο όρο 25 και τυπική απόκλιση 4,33 θα λειτουργήσει για την προσέγγιση αυτής της διωνυμικής κατανομής.

Πότε είναι κατάλληλη η προσέγγιση;

Με τη χρήση ορισμένων μαθηματικών μπορεί να αποδειχθεί ότι υπάρχουν μερικές συνθήκες που πρέπει να χρησιμοποιήσουμε μια κανονική προσέγγιση με το διωνυμική κατανομή. Ο αριθμός των παρατηρήσεων n πρέπει να είναι αρκετά μεγάλο, και η αξία του Π έτσι ώστε και οι δύο np και n(1 - Π) είναι μεγαλύτερες ή ίσες με 10. Αυτός είναι ένας βασικός κανόνας, ο οποίος καθοδηγείται από τη στατιστική πρακτική. Η κανονική προσέγγιση μπορεί πάντοτε να χρησιμοποιηθεί, αλλά αν δεν πληρούνται αυτές οι συνθήκες τότε η προσέγγιση δεν μπορεί να είναι τόσο καλή όσο μια προσέγγιση.

Για παράδειγμα, εάν n = 100 και Π = 0.25 τότε δικαιολογείται η χρήση της κανονικής προσέγγισης. Αυτό είναι επειδή np = 25 και n(1 - Π) = 75. Δεδομένου ότι και οι δύο αυτοί αριθμοί είναι μεγαλύτεροι από 10, η κατάλληλη κανονική κατανομή θα κάνει μια αρκετά καλή δουλειά για την εκτίμηση διωνυμικών πιθανοτήτων.

Γιατί να χρησιμοποιήσετε την προσέγγιση;

Οι διωνυμικές πιθανότητες υπολογίζονται χρησιμοποιώντας έναν πολύ απλό τύπο για να βρεθεί ο διωνυμικός συντελεστής. Δυστυχώς, λόγω του factorials στον τύπο, μπορεί να είναι πολύ εύκολο να αντιμετωπίσετε υπολογιστικές δυσκολίες με το διωνυμικός τύπος. Η κανονική προσέγγιση μας επιτρέπει να παρακάμψουμε οποιοδήποτε από αυτά τα προβλήματα με τη συνεργασία με έναν οικείο φίλο, έναν πίνακα αξιών μιας κανονικής κανονικής κατανομής.

Πολλές φορές ο προσδιορισμός μιας πιθανότητας ότι μια διωνυμική τυχαία μεταβλητή εμπίπτει σε ένα εύρος τιμών είναι κουραστική για τον υπολογισμό. Αυτό οφείλεται στο γεγονός ότι για να βρεθεί η πιθανότητα μιας διωνυμικής μεταβλητής Χ είναι μεγαλύτερη από 3 και μικρότερη από 10, θα πρέπει να βρούμε την πιθανότητα Χ ισούται με 4, 5, 6, 7, 8 και 9, και στη συνέχεια προσθέστε όλες αυτές τις πιθανότητες μαζί. Αν μπορεί να χρησιμοποιηθεί η κανονική προσέγγιση, θα πρέπει να καθορίσουμε τις βαθμολογίες z που αντιστοιχούν στα 3 και 10 και στη συνέχεια να χρησιμοποιήσουμε έναν πίνακα z των πιθανοτήτων για το κανονική κανονική κατανομή.