Όταν μετράμε τη μεταβλητότητα ενός συνόλου δεδομένων, υπάρχουν δύο στενά συνδεδεμένα στατιστικά στοιχεία σχετικά με αυτό: το διαφορά και τυπική απόκλιση, οι οποίες υποδεικνύουν αμφότερες τον τρόπο εξάπλωσης των τιμών δεδομένων και τη συμμετοχή παρόμοιων βημάτων στον υπολογισμό τους. Ωστόσο, η μεγάλη διαφορά μεταξύ αυτών των δύο στατιστικών αναλύσεων είναι ότι η τυπική απόκλιση είναι η τετραγωνική ρίζα της διακύμανσης.
Προκειμένου να κατανοήσουμε τις διαφορές μεταξύ αυτών των δύο παρατηρήσεων της στατιστικής εξάπλωσης, πρέπει πρώτα να καταλάβουμε τι αντιπροσωπεύει το καθένα: Η διακύμανση αντιπροσωπεύει όλα τα σημεία δεδομένων σε ένα σύνολο και υπολογίζεται με τον υπολογισμό του μέσου όρου της τετραγωνικής απόκλισης κάθε μέσου ενώ η τυπική απόκλιση είναι ένα μέτρο της εξάπλωσης γύρω από τον μέσο όρο όταν υπολογίζεται η κεντρική τάση μέσω του σημαίνω.
Ως αποτέλεσμα, η διακύμανση μπορεί να εκφραστεί ως η μέση τετραγωνική απόκλιση των τιμών από τα μέσα ή [τετράγωνο απόκλιση των μέσων] διαιρούμενο με τον αριθμό των παρατηρήσεων και την τυπική απόκλιση μπορεί να εκφραστεί ως η τετραγωνική ρίζα του διαφορά.
Κατασκευή Διακύμανσης
Για να κατανοήσουμε πλήρως τη διαφορά μεταξύ αυτών των στατιστικών, πρέπει να κατανοήσουμε τον υπολογισμό της διακύμανσης. Τα βήματα για τον υπολογισμό της διακύμανσης του δείγματος είναι τα εξής:
- Υπολογίστε το μέσο δείγμα των δεδομένων.
- Βρείτε τη διαφορά μεταξύ της μέσης και κάθε τιμής δεδομένων.
- Τετράγωνο αυτές τις διαφορές.
- Προσθέστε τις τετραγωνικές διαφορές μαζί.
- Διαχωρίστε αυτό το ποσό κατά ένα μικρότερο από τον συνολικό αριθμό των τιμών δεδομένων.
Οι λόγοι για κάθε ένα από αυτά τα βήματα είναι οι εξής:
- Ο μέσος όρος παρέχει το κεντρικό σημείο ή μέση τιμή των δεδομένων.
- Οι διαφορές από το μέσο βοηθούν στον προσδιορισμό των αποκλίσεων από αυτό το μέσο. Οι τιμές δεδομένων που απέχουν πολύ από τον μέσο όρο θα παράγουν μεγαλύτερη απόκλιση από αυτές που είναι κοντά στον μέσο όρο.
- Οι διαφορές είναι τετράγωνο, διότι αν οι διαφορές προστεθούν χωρίς τετραγωνισμό, το άθροισμα αυτό θα είναι μηδέν.
- ο προσθήκη αυτών των τετράγωνων αποκλίσεων παρέχει μια μέτρηση της συνολικής απόκλισης.
- Η διαίρεση κατά ένα μικρότερο από το μέγεθος του δείγματος παρέχει ένα είδος μέσης απόκλισης. Αυτό ακυρώνει το αποτέλεσμα της ύπαρξης πολλών σημείων δεδομένων που συμβάλλουν στη μέτρηση της εξάπλωσης.
Όπως αναφέρθηκε προηγουμένως, η τυπική απόκλιση υπολογίζεται απλώς με την εύρεση της τετραγωνικής ρίζας αυτού του αποτελέσματος, η οποία παρέχει το απόλυτο επίπεδο απόκλισης ανεξάρτητα από τον συνολικό αριθμό των τιμών δεδομένων.
Απόκλιση και τυπική απόκλιση
Όταν εξετάζουμε τη διακύμανση, συνειδητοποιούμε ότι υπάρχει ένα μείζον μειονέκτημα στη χρήση του. Όταν ακολουθούμε τα βήματα του υπολογισμού της διακύμανσης, αυτό δείχνει ότι η διακύμανση μετράται σε όρους τετραγωνικών μονάδων επειδή προσθέσαμε τετραγωνικές διαφορές στον υπολογισμό μας. Για παράδειγμα, εάν τα δείγματα των δεδομένων μας μετρούνται σε μετρητές, τότε οι μονάδες για μια διακύμανση θα δίδονται σε τετραγωνικά μέτρα.
Για να τυποποιήσουμε το μέτρο της εξάπλωσής μας, πρέπει να πάρουμε την τετραγωνική ρίζα της διακύμανσης. Αυτό θα εξαλείψει το πρόβλημα των τετραγωνικών μονάδων και μας δίνει ένα μέτρο της εξάπλωσης που θα έχει τις ίδιες μονάδες με το αρχικό μας δείγμα.
Υπάρχουν πολλοί μαθηματικοί τύποι μαθηματικών στατιστικών που έχουν πιο ωραίες μορφές όταν τους δηλώνουμε από άποψη διακύμανσης αντί της τυπικής απόκλισης.