Ο κανόνας της διακλαδικής εμβέλειας είναι χρήσιμος για την ανίχνευση της ύπαρξης υπερβολικών τιμών. Απόσβεση είναι μεμονωμένες τιμές που δεν εμπίπτουν στο συνολικό πρότυπο ενός συνόλου δεδομένων. Αυτός ο ορισμός είναι κάπως αόριστος και υποκειμενικός, οπότε είναι χρήσιμο να υπάρχει ένας κανόνας που να ισχύει όταν καθορίζοντας εάν ένα σημείο δεδομένων είναι πραγματικά ένα απομακρυσμένο - αυτό είναι όπου ο κανόνας της διακτίκλειας Έρχεται σε.
Κάθε σύνολο δεδομένων μπορεί να περιγραφεί από το δικό του σύνοψη πέντε αριθμών. Αυτοί οι πέντε αριθμοί, οι οποίοι σας δίνουν τις πληροφορίες που χρειάζεστε για να βρείτε μοτίβα και απόκλιση, αποτελούνται από (κατά αύξουσα σειρά):
Αυτοί οι πέντε αριθμοί λένε ένα πρόσωπο περισσότερα για τα δεδομένα τους από το να κοιτάς τους αριθμούς ταυτόχρονα θα μπορούσαν, ή τουλάχιστον να το κάνουν πολύ πιο εύκολο. Για παράδειγμα, το εύρος, το οποίο είναι το ελάχιστο που αφαιρείται από το μέγιστο, είναι ένας δείκτης του τρόπου διάδοσης των δεδομένων σε ένα σετ (σημείωση: το εύρος είναι πολύ ευαίσθητο στις υπερβατικές τιμές - εάν η απόκλιση είναι επίσης ελάχιστη ή μέγιστη, η περιοχή δεν θα είναι μια ακριβής αναπαράσταση του εύρους δεδομένων σειρά).
Εύρος θα ήταν δύσκολο να παρεκκλίνει διαφορετικά. Παρόμοια με την κλίμακα, αλλά λιγότερο ευαίσθητη στις υπερβατικές τιμές, είναι η περιοχή μεταξύ τεταρτοταγών. ο διατεταρτημοριακό εύρος υπολογίζεται με τον ίδιο τρόπο όπως και το εύρος. Το μόνο που κάνετε για να το βρείτε είναι να αφαιρέσετε το πρώτο τέταρτο του τρίτου τεταρτημορίου:
Το εύρος μεταξύ τεταρτοταγών δείχνει τον τρόπο διάδοσης των δεδομένων σχετικά με το διάμεσο. Είναι λιγότερο ευαίσθητο από ό, τι το εύρος σε υπερβολικά υψηλά επίπεδα και μπορεί συνεπώς να είναι πιο χρήσιμο.
Παρόλο που δεν επηρεάζεται συχνά από αυτά, η περιοχή των διακταριτιδίων μπορεί να χρησιμοποιηθεί για την ανίχνευση των ακραίων τιμών. Αυτό γίνεται χρησιμοποιώντας τα εξής βήματα:
Θυμηθείτε ότι ο κανόνας των διατρακτυλεών είναι ένας βασικός κανόνας που ισχύει γενικά αλλά δεν ισχύει σε κάθε περίπτωση. Σε γενικές γραμμές, θα πρέπει πάντα να παρακολουθείτε την αναλυτική ανάλυσή σας μελετώντας τις προκύπτουσες αποκλίσεις για να δείτε αν έχουν νόημα. Οποιαδήποτε δυνητική απόκλιση που προκύπτει από τη μέθοδο διατρακτυλίωσης θα πρέπει να εξετάζεται στο πλαίσιο ολόκληρου του συνόλου δεδομένων.
Δείτε τον κανόνα της εμβέλειας μεταξύ τεταρτημορίων στην εργασία με ένα παράδειγμα. Ας υποθέσουμε ότι έχετε το ακόλουθο σύνολο δεδομένων: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. Η σύνοψη πέντε αριθμών για αυτό το σύνολο δεδομένων είναι ελάχιστο = 1, πρώτο τεταρτημόριο = 4, διάμεσος = 7, τρίτο τεταρτημόριο = 10 και μέγιστο = 17. Μπορείτε να δείτε τα δεδομένα και να δηλώσετε αυτόματα ότι το 17 είναι μια απόκλιση, αλλά τι λέει ο κανόνας της εμβέλειας μεταξύ των τετραγωνίων;
Τώρα πολλαπλασιάστε την απάντησή σας με 1,5 για να πάρετε 1,5 x 6 = 9. Εννέα λιγότερο από το πρώτο τεταρτημόριο είναι 4 - 9 = -5. Δεν υπάρχουν δεδομένα λιγότερο από αυτό. Εννέα περισσότερο από το τρίτο τέταρτο είναι 10 + 9 = 19. Δεν υπάρχουν δεδομένα μεγαλύτερα από αυτό. Παρά το γεγονός ότι η μέγιστη τιμή είναι πενταπλάσια από το πλησιέστερο σημείο δεδομένων, ο κανόνας διακλαδικής εμβέλειας δείχνει ότι πιθανότατα δεν θα έπρεπε να θεωρηθεί πλεονάζουσα για αυτό το σύνολο δεδομένων.