Πώς να βρείτε τους εσωτερικούς και εξωτερικούς φράκτες

Ένα χαρακτηριστικό ενός συνόλου δεδομένων που είναι σημαντικό να προσδιοριστεί είναι εάν περιέχει οποιεσδήποτε αποδόσεις. Οι αποκλίσεις θεωρούνται διαισθητικά ως τιμές στη σειρά δεδομένων που διαφέρουν πολύ από την πλειοψηφία των υπόλοιπων δεδομένων. Φυσικά, αυτή η κατανόηση των αποκλίσεων είναι διφορούμενη. Για να θεωρηθεί ως απόκλιση, πόσο πρέπει να αποκλίνει η τιμή από τα υπόλοιπα δεδομένα; Είναι αυτό που ένας ερευνητής ονομάζει ένα απόσπασμα που θα ταιριάζει με το άλλο; Προκειμένου να υπάρξει κάποια συνοχή και ποσοτικό μέτρο για τον προσδιορισμό των ακραίων τιμών, χρησιμοποιούμε εσωτερικούς και εξωτερικούς φράκτες.

Για να βρούμε τους εσωτερικούς και εξωτερικούς φράκτες ενός συνόλου δεδομένων, χρειαζόμαστε πρώτα κάποιες άλλες περιγραφικά στατιστικά. Θα ξεκινήσουμε με τον υπολογισμό των τεταρτημορίων. Αυτό θα οδηγήσει στην εμβέλεια των διακαρρυθίων. Τέλος, με αυτούς τους υπολογισμούς πίσω από μας, θα μπορέσουμε να προσδιορίσουμε τους εσωτερικούς και εξωτερικούς φράκτες.

Τα τεταρτημόρια

instagram viewer

ο πρώτο και τρίτο τεταρτημόριο αποτελούν μέρος του πέντε σύνοψη αριθμών κάθε σύνολο ποσοτικών δεδομένων. Ξεκινάμε με την εύρεση του μέσου ή του μεσαίου σημείου των δεδομένων, αφού όλες οι τιμές παρατίθενται με αύξουσα σειρά. Οι τιμές είναι μικρότερες από τη διάμεση τιμή που αντιστοιχεί στο ήμισυ περίπου των δεδομένων. Βρίσκουμε το μέσο όρο αυτού του μισού του συνόλου δεδομένων και αυτό είναι το πρώτο τεταρτημόριο.

Με παρόμοιο τρόπο, εξετάζουμε τώρα το άνω μισό του συνόλου δεδομένων. Εάν βρούμε τη διάμεση τιμή για αυτό το μισό των δεδομένων, τότε έχουμε τα τρίτα τεταρτημόρια. Αυτά τα τεταρτημόρια αποκτούν το όνομά τους από το γεγονός ότι χωρίζουν το σύνολο δεδομένων σε τέσσερα ίσα μεγέθη ή τετάρτα. Με άλλα λόγια, περίπου το 25% όλων των τιμών δεδομένων είναι μικρότερο από το πρώτο τεταρτημόριο. Με παρόμοιο τρόπο, περίπου το 75% των τιμών δεδομένων είναι μικρότερο από το τρίτο τέταρτο.

Διατεταρτημοριακό εύρος

Πρέπει να βρούμε το επόμενο διατεταρτημοριακό εύρος (IQR). Αυτό είναι ευκολότερο να υπολογιστεί από το πρώτο τεταρτημόριο q1 και το τρίτο τεταρτημόριο q3. Το μόνο που πρέπει να κάνουμε είναι να κάνουμε τη διαφορά αυτών των δύο τεταρτημορίων. Αυτό μας δίνει τον τύπο:

IQR = Q3 - Q1

Το IQR μας λέει πώς κατανέμεται το μεσαίο μισό του συνόλου δεδομένων μας.

Βρείτε τους εσωτερικούς φράχτες

Μπορούμε τώρα να βρούμε τους εσωτερικούς φράχτες. Αρχίζουμε με το IQR και πολλαπλασιάζουμε αυτόν τον αριθμό κατά 1,5. Στη συνέχεια αφαιρούμε αυτόν τον αριθμό από το πρώτο τεταρτημόριο. Προσθέτουμε επίσης αυτόν τον αριθμό στο τρίτο τεταρτημόριο. Αυτοί οι δύο αριθμοί αποτελούν τον εσωτερικό φράκτη μας.

Βρείτε τα εξωτερικά περιφράγματα

Για τους εξωτερικούς φράκτες, ξεκινάμε με το IQR και πολλαπλασιάζουμε αυτόν τον αριθμό κατά 3. Στη συνέχεια αφαιρούμε αυτόν τον αριθμό από το πρώτο τεταρτημόριο και προσθέτουμε το στο τρίτο τεταρτημόριο. Αυτοί οι δύο αριθμοί είναι οι εξωτερικοί φράκτες μας.

Ανίχνευση υπερβολικών τιμών

Η ανίχνευση του υπερβολικά υψηλά γίνεται πλέον τόσο εύκολη όσο ο καθορισμός των τιμών των δεδομένων που βρίσκονται σε σχέση με τους εσωτερικούς και εξωτερικούς φράκτες μας. Αν μια μοναδική τιμή δεδομένων είναι πιο ακραία από οποιαδήποτε από τις εξωτερικές φράκτες μας, τότε αυτό είναι μια απόκλιση και μερικές φορές αναφέρεται ως ένα ισχυρό outlier. Αν η τιμή των δεδομένων μας βρίσκεται μεταξύ ενός αντίστοιχου εσωτερικού και εξωτερικού φράχτη, τότε αυτή η τιμή είναι μια ύποπτη απόκλιση ή μια ήπια απόκλιση. Θα δούμε πώς λειτουργεί αυτό με το παρακάτω παράδειγμα.

Παράδειγμα

Ας υποθέσουμε ότι έχουμε υπολογίσει το πρώτο και το τρίτο τέταρτο των δεδομένων μας και βρήκαμε αυτές τις τιμές στα 50 και 60 αντίστοιχα. Το διακταριακό εύρος IQR = 60 - 50 = 10. Στη συνέχεια, βλέπουμε ότι 1,5 x IQR = 15. Αυτό σημαίνει ότι οι εσωτερικοί φράκτες είναι 50 - 15 = 35 και 60 + 15 = 75. Αυτό είναι 1,5 x IQR μικρότερο από το πρώτο τεταρτημόριο, και περισσότερο από το τρίτο τεταρτημόριο.

Τώρα υπολογίζουμε 3 x IQR και βλέπουμε ότι αυτό είναι 3 x 10 = 30. Οι εξωτερικοί φράκτες είναι 3 x IQR πιο ακραίες από το πρώτο και το τρίτο τεταρτημόριο. Αυτό σημαίνει ότι οι εξωτερικοί φράκτες είναι 50 - 30 = 20 και 60 + 30 = 90.

Οποιεσδήποτε τιμές δεδομένων είναι μικρότερες από 20 ή μεγαλύτερες από 90, θεωρούνται υπερβολικές τιμές. Οποιεσδήποτε τιμές δεδομένων είναι μεταξύ 29 και 35 ή μεταξύ 75 και 90 είναι ύποπτες τιμές.

instagram story viewer