Η τυπική απόκλιση και το εύρος τιμών είναι και τα δύο μέτρα του διάδοση ενός συνόλου δεδομένων. Κάθε αριθμός μας λέει με τον τρόπο του πόσο διαχωρισμένα είναι τα δεδομένα, καθώς είναι και τα δύο ένα μέτρο διακύμανσης. Αν και δεν υπάρχει ρητή σχέση μεταξύ του εύρος και τυπική απόκλιση, υπάρχει ένα κανόνας αυτό μπορεί να είναι χρήσιμο για να συνδέσετε αυτές τις δύο στατιστικές. Αυτή η σχέση αναφέρεται μερικές φορές ως ο κανόνας εύρους για τυπική απόκλιση.
Ο κανόνας εύρους τιμών μας λέει ότι η τυπική απόκλιση ενός δείγματος είναι περίπου ίση με το ένα τέταρτο του εύρους των δεδομένων. Με άλλα λόγιαμικρό = (Μέγιστο - Ελάχιστο) / 4. Αυτός είναι ένας πολύ απλός τύπος για χρήση και θα πρέπει να χρησιμοποιείται μόνο ως πολύ τραχύς εκτίμηση της τυπικής απόκλισης.
Ενα παράδειγμα
Για να δείτε ένα παράδειγμα του τρόπου με τον οποίο λειτουργεί ο κανόνας εύρους, θα δούμε το ακόλουθο παράδειγμα. Ας υποθέσουμε ότι αρχίζουμε με τις τιμές των δεδομένων 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Αυτές οι τιμές έχουν α
σημαίνω των 17 και τυπική απόκλιση περίπου 4,1. Εάν αντ 'αυτού πρώτα υπολογίσουμε το εύρος των δεδομένων μας ως 25 - 12 = 13 και στη συνέχεια διαιρέστε αυτόν τον αριθμό κατά τέσσερις έχουμε την εκτίμηση της τυπικής απόκλισης ως 13/4 = 3.25. Αυτός ο αριθμός είναι σχετικά κοντά στην πραγματική τυπική απόκλιση και καλό για μια τυχαία εκτίμηση.Γιατί λειτουργεί;
Μπορεί να φαίνεται ότι ο κανόνας της εμβέλειας είναι λίγο παράξενος. Γιατί λειτουργεί; Δεν φαίνεται τελείως αυθαίρετο να διαιρούμε ακριβώς την περιοχή κατά τέσσερα; Γιατί δεν θα χωρίζαμε με διαφορετικό αριθμό; Υπάρχει στην πραγματικότητα κάποια μαθηματική δικαιολογία που συμβαίνει πίσω από τις σκηνές.
Ανακαλέστε τις ιδιότητες του καμπύλη καμπάνας και τις πιθανότητες από ένα κανονική κανονική κατανομή. Ένα χαρακτηριστικό σχετίζεται με την ποσότητα δεδομένων που εμπίπτει σε ένα ορισμένο αριθμό τυπικών αποκλίσεων:
- Περίπου το 68% των δεδομένων είναι εντός μιας τυπικής απόκλισης (υψηλότερη ή χαμηλότερη) από τη μέση τιμή.
- Περίπου το 95% των δεδομένων είναι μέσα σε δύο τυπικές αποκλίσεις (υψηλότερες ή χαμηλότερες) από το μέσο όρο.
- Περίπου το 99% βρίσκεται μέσα σε τρεις τυπικές αποκλίσεις (υψηλότερες ή χαμηλότερες) από το μέσο όρο.
Ο αριθμός που θα χρησιμοποιήσουμε έχει να κάνει με το 95%. Μπορούμε να πούμε ότι το 95% από δύο τυπικές αποκλίσεις κάτω από το μέσο όρο σε δύο τυπικές αποκλίσεις πάνω από το μέσο, έχουμε το 95% των δεδομένων μας. Επομένως, σχεδόν όλη η κανονική κατανομή μας θα επεκταθεί σε ένα τμήμα γραμμής που είναι συνολικά τέσσερις τυπικές αποκλίσεις.
Δεν κατανέμονται κανονικά όλα τα δεδομένα και σχηματίζεται καμπύλη καμπάνας. Όμως, τα περισσότερα δεδομένα είναι αρκετά καλά συμπεριφερθέντα ώστε δύο τυπικές αποκλίσεις μακριά από τον μέσο όρο να συλλαμβάνουν σχεδόν όλα τα δεδομένα. Εκτιμούμε και λέμε ότι τέσσερις τυπικές αποκλίσεις είναι περίπου το μέγεθος της κλίμακας, και έτσι η περιοχή που διαιρείται με τέσσερα είναι μια πρόχειρη προσέγγιση της τυπικής απόκλισης.
Χρησιμοποιεί τον Κανόνα εμβέλειας
Ο κανόνας εμβέλειας είναι χρήσιμος σε πολλές ρυθμίσεις. Πρώτον, είναι μια πολύ γρήγορη εκτίμηση της τυπικής απόκλισης. Η τυπική απόκλιση απαιτεί πρώτα να βρούμε τον μέσο όρο, και στη συνέχεια να αφαιρέσουμε αυτόν τον μέσο όρο από κάθε σημείο δεδομένων, τετράγωνο οι διαφορές, προσθέστε αυτές, διαιρέστε με ένα λιγότερο από τον αριθμό των σημείων δεδομένων, στη συνέχεια (τελικά) πάρτε το τετράγωνο ρίζα. Από την άλλη πλευρά, ο κανόνας εύρους απαιτεί μόνο μία αφαίρεση και μία διαίρεση.
Άλλα σημεία όπου ο κανόνας εύρους είναι χρήσιμος είναι όταν έχουμε ελλιπείς πληροφορίες. Οι τύποι όπως για τον προσδιορισμό του μεγέθους του δείγματος απαιτούν τρία τεμάχια πληροφοριών: το επιθυμητό περιθώριο σφάλματος, ο επίπεδο εμπιστοσύνης και την τυπική απόκλιση του πληθυσμού που ερευνάμε. Πολλές φορές είναι αδύνατο να γνωρίζουμε ποιος είναι ο πληθυσμός τυπική απόκλιση είναι. Με τον κανόνα της εμβέλειας, μπορούμε να εκτιμήσουμε αυτό το στατιστικό στοιχείο και στη συνέχεια να μάθουμε πόσο μεγάλος θα πρέπει να κάνουμε το δείγμα μας.