Το εύρος μεταξύ τεταρτημορίων (IQR) είναι η διαφορά μεταξύ του πρώτου τεταρτημορίου και του τρίτου τεταρτημορίου. Ο τύπος για αυτό είναι:
IQR = Q3 - Q1
Υπάρχουν πολλές μετρήσεις της μεταβλητότητας ενός συνόλου δεδομένων. Και τα δύο εύρος και τυπική απόκλιση πείτε μας πόσο απλωμένα είναι τα δεδομένα μας. Το πρόβλημα με αυτά τα περιγραφικά στατιστικά στοιχεία είναι ότι είναι αρκετά ευαίσθητα στις αποκλίσεις. Μία μέτρηση της εξάπλωσης ενός συνόλου δεδομένων που είναι πιο ανθεκτική στην παρουσία υπερβολικών τιμών είναι το εύρος μεταξύ τεταρτοταγών.
Ορισμός της διακταρτηρικής εμβέλειας
Όπως φαίνεται παραπάνω, το εύρος μεταξύ τεταρτοταγών περιοχών βασίζεται στον υπολογισμό άλλων στατιστικών στοιχείων. Προτού καθορίσουμε το εύρος των διακρυσταλλίων, πρέπει πρώτα να γνωρίζουμε τις τιμές του πρώτου τεταρτημορίου και του τρίτου τεταρτημορίου. (Φυσικά, το πρώτο και το τρίτο τεταρτημόριο εξαρτώνται από την αξία του διάμεσου).
Μόλις προσδιορίσουμε τις τιμές του πρώτου και του τρίτου τεταρτημορίου, η περιοχή μεταξύ τεταρτημορίων είναι πολύ εύκολο να υπολογιστεί. Το μόνο που πρέπει να κάνουμε είναι να αφαιρέσουμε το πρώτο τεταρτημόριο από το τρίτο τεταρτημόριο. Αυτό εξηγεί τη χρήση του όρου interquartile περιοχή για αυτήν την στατιστική.
Παράδειγμα
Για να δούμε ένα παράδειγμα υπολογισμού ενός διακρυσταλλικού εύρους, θα εξετάσουμε το σύνολο των δεδομένων: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. ο πέντε σύνοψη αριθμών για αυτό το σύνολο δεδομένων είναι:
- Ελάχιστο 2
- Πρώτο τεταρτημόριο 3,5
- Διάμεση 6
- Τρίτο τεταρτημόριο 8
- Μέγιστο 9
Έτσι, βλέπουμε ότι η περιοχή μεταξύ τεταρτοταγών είναι 8 - 3,5 = 4,5.
Η Σημασία της Διατρατεράλεπτης Περιοχής
Η γκάμα μας δίνει μια μέτρηση του τρόπου διάδοσης του συνόλου των δεδομένων μας. Η περιοχή των τεταρτημορίων, η οποία μας λέει πόσο μακριά είναι η απόσταση πρώτο και τρίτο τεταρτημόριο είναι, δείχνει πόσο απλωμένο είναι το μεσαίο 50% των δεδομένων μας.
Αντοχή στις υπερβάσεις
Το κύριο πλεονέκτημα της χρήσης της κλίμακας μεταξύ τετρακλέτων και όχι του εύρους για τη μέτρηση της εξάπλωσης ενός συνόλου δεδομένων είναι ότι το εύρος των διακταρτίλλων δεν είναι ευαίσθητο στις υπερβολικές τιμές. Για να δούμε αυτό, θα δούμε ένα παράδειγμα.
Από το σύνολο των δεδομένων που προαναφέρθηκαν έχουμε μια περιοχή μεταξύ τεταρτοταγών 3,5, μια περιοχή 9 - 2 = 7 και μια τυπική απόκλιση 2,34. Εάν αντικαταστήσουμε την υψηλότερη τιμή 9 με ακραία απόκλιση των 100, τότε η τυπική απόκλιση γίνεται 27,37 και η περιοχή είναι 98. Παρόλο που έχουμε πολύ δραστικές μετατοπίσεις αυτών των αξιών, το πρώτο και το τρίτο τεταρτημόριο δεν επηρεάζονται και έτσι η διασταυρωτή περιοχή δεν αλλάζει.
Χρήση του Interquartile Range
Πέραν του ότι είναι λιγότερο ευαίσθητο μέτρο της εξάπλωσης ενός συνόλου δεδομένων, η περιοχή των τεταρτοταγών περιοχών έχει μια άλλη σημαντική χρήση. Λόγω της αντοχής του στις τιμές απόκλισης, η περιοχή μεταξύ τεταρτημορίων είναι χρήσιμη για τον προσδιορισμό του πότε μια τιμή είναι μια απόκλιση.
ο μεταξύ των τεταρτημορίων είναι αυτό που μας ενημερώνει εάν έχουμε ένα ήπιο ή ισχυρό outlier. Για να αναζητήσουμε μια απόκλιση, πρέπει να κοιτάξουμε κάτω από το πρώτο τεταρτημόριο ή πάνω από το τρίτο τεταρτημόριο. Ο βαθμός στον οποίο πρέπει να πάμε εξαρτάται από την αξία της διασταυρωμένης κλίμακας.