Άθροισμα συντομεύσεων φόρμουλας τετραγώνων

Ο υπολογισμός του a δείγμα διακύμανση ή τυπική απόκλιση αναφέρεται τυπικά ως κλάσμα. Ο αριθμητής αυτού του κλάσματος περιλαμβάνει ένα άθροισμα τετραγωνικών αποκλίσεων από τον μέσο όρο. Στα στατιστικά στοιχεία, ο τύπος για αυτό το συνολικό άθροισμα των τετραγώνων είναι

Σ (xΕγώ - Χ)2

Εδώ το σύμβολο xδ αναφέρεται στον μέσο δείγμα και το σύμβολο Σ λέει να προσθέσουμε τις τετραγωνικές διαφορές (xΕγώ - xτ) για όλους Εγώ.

Ενώ ο τύπος αυτός λειτουργεί για υπολογισμούς, υπάρχει ένας ισοδύναμος τύπος συντόμευσης που δεν απαιτεί από εμάς να υπολογίσουμε πρώτα το μέσο δείγμα. Αυτός ο τύπος συντόμευσης για το άθροισμα των τετραγώνων είναι

Σ (xΕγώ2) - (Σ xΕγώ)2/n

Εδώ η μεταβλητή n αναφέρεται στον αριθμό των σημείων δεδομένων στο δείγμα μας.

Παράδειγμα τυποποιημένου τύπου

Για να δείτε πώς λειτουργεί αυτός ο τύπος συντόμευσης, θα εξετάσουμε ένα παράδειγμα που υπολογίζεται χρησιμοποιώντας και τους δύο τύπους. Ας υποθέσουμε ότι το δείγμα μας είναι 2, 4, 6, 8. Ο μέσος όρος του δείγματος είναι (2 + 4 + 6 + 8) / 4 = 20/4 = 5. Τώρα υπολογίζουμε τη διαφορά κάθε σημείου δεδομένων με το μέσο όρο 5.

instagram viewer
  • 2 – 5 = -3
  • 4 – 5 = -1
  • 6 – 5 = 1
  • 8 – 5 = 3

Τώρα τετράγωνα κάθε έναν από αυτούς τους αριθμούς και προσθέτουμε τους μαζί. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.

Παράδειγμα συντομεύσεων

Τώρα θα χρησιμοποιήσουμε το ίδιο σύνολο δεδομένων: 2, 4, 6, 8, με τον τύπο συντόμευσης για να καθορίσουμε το άθροισμα των τετραγώνων. Πρώτα τετράγωνα κάθε σημείο δεδομένων και να τα προσθέσουμε μαζί: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.

Το επόμενο βήμα είναι να προσθέσουμε μαζί όλα τα δεδομένα και το τετράγωνο αυτό το ποσό: (2 + 4 + 6 + 8)2 = 400. Το διαιρούμε με τον αριθμό των σημείων δεδομένων για να λάβουμε 400/4 = 100.

Αφαιρούμε τώρα αυτόν τον αριθμό από 120. Αυτό μας δίνει ότι το άθροισμα των τετραγωνικών αποκλίσεων είναι 20. Αυτός ήταν ακριβώς ο αριθμός που έχουμε ήδη βρει από την άλλη φόρμουλα.

Πως λειτουργεί αυτό?

Πολλοί άνθρωποι θα δεχθούν απλώς τον τύπο με την ονομαστική τους αξία και δεν έχουν ιδέα γιατί αυτός ο τύπος λειτουργεί. Χρησιμοποιώντας μια μικρή άλγεβρα, μπορούμε να δούμε γιατί αυτός ο τύπος συντόμευσης είναι ισοδύναμος με τον τυπικό, παραδοσιακό τρόπο υπολογισμού του αθροίσματος των τετραγωνικών αποκλίσεων.

Αν και μπορεί να υπάρχουν εκατοντάδες, αν όχι χιλιάδες αξίες σε ένα σύνολο δεδομένων πραγματικού κόσμου, θα υποθέσουμε ότι υπάρχουν μόνο τρεις τιμές δεδομένων: x1, Χ2, Χ3. Αυτό που βλέπουμε εδώ θα μπορούσε να επεκταθεί σε ένα σύνολο δεδομένων που έχει χιλιάδες σημεία.

Ξεκινάμε σημειώνοντας ότι (x1 + x2 + x3) = 3 xτ. Η έκφραση Σ (xΕγώ - Χ)2 = (χ1 - Χ)2 + (χ2 - Χ)2 + (χ3 - Χ)2.

Χρησιμοποιούμε τώρα το γεγονός από τη βασική άλγεβρα που (a + b)2 = α2 + 2ab + β2. Αυτό σημαίνει ότι (x1 - Χ)2 = x12 -2x1 x δ + x δ2. Το κάνουμε αυτό για τους άλλους δύο όρους του αθροίσματος μας και έχουμε:

Χ12 -2x1 x δ + x δ2 + x22 -2x2 x δ + x δ2 + x32 -2x3 x δ + x δ2.

Αλλάζουμε αυτό το θέμα και έχουμε:

Χ12+ x22 + x32+ 3x δ2 - 2x Δ (x1 + x2 + x3) .

Με την επανεγγραφή (x1 + x2 + x3) = 3xτ τα παραπάνω γίνονται:

Χ12+ x22 + x32 - 3x δ2.

Τώρα από τις 3xτ2 = (χ1+ x2 + x3)2/ 3, ο τύπος μας γίνεται:

Χ12+ x22 + x32 - (Χ1+ x2 + x3)2/3

Και αυτή είναι μια ειδική περίπτωση του γενικού τύπου που αναφέρθηκε παραπάνω:

Σ (xΕγώ2) - (Σ xΕγώ)2/n

Είναι πραγματικά μια συντόμευση;

Μπορεί να μην φαίνεται ότι ο τύπος είναι πραγματικά μια συντόμευση. Εξάλλου, στο παραπάνω παράδειγμα φαίνεται ότι υπάρχουν και πολλοί υπολογισμοί. Ένα μέρος αυτού έχει να κάνει με το γεγονός ότι εξετάσαμε μόνο ένα μέγεθος δείγματος που ήταν μικρό.

Καθώς αυξάνουμε το μέγεθος του δείγματος μας, βλέπουμε ότι ο τύπος συντόμευσης μειώνει τον αριθμό των υπολογισμών κατά περίπου το ήμισυ. Δεν χρειάζεται να αφαιρέσουμε τον μέσο όρο από κάθε σημείο δεδομένων και στη συνέχεια να τετραγωνίσουμε το αποτέλεσμα. Αυτό μειώνει σημαντικά τον συνολικό αριθμό εργασιών.

instagram story viewer