Συνοπτικά στατιστικά στοιχεία όπως η διάμεση τιμή, πρώτο τεταρτημόριο και τρίτο τεταρτημόριο είναι οι μετρήσεις της θέσης. Αυτό οφείλεται στο γεγονός ότι αυτοί οι αριθμοί υποδεικνύουν πού βρίσκεται ένα καθορισμένο ποσοστό της κατανομής των δεδομένων. Για παράδειγμα, ο διάμεσος είναι η μεσαία θέση των υπό έρευνα δεδομένων. Τα μισά από τα δεδομένα έχουν τιμές μικρότερες από τη διάμεση. Ομοίως, το 25% των δεδομένων έχουν τιμές μικρότερες από το πρώτο τεταρτημόριο και το 75% των δεδομένων έχουν τιμές μικρότερες από το τρίτο τέταρτο.
Αυτή η έννοια μπορεί να γενικευθεί. Ένας τρόπος για να το κάνετε αυτό είναι να εξετάσετε εκατοστημόρια. Το 90ο εκατοστημόριο υποδεικνύει το σημείο όπου το 90% των δεδομένων έχουν τιμές μικρότερες από αυτόν τον αριθμό. Γενικότερα, το Πτο εκατοστημόριο είναι ο αριθμός n για το οποίο Π% των δεδομένων είναι μικρότερο από n.
Συνεχείς τυχαίες μεταβλητές
Αν και τα στατιστικά στοιχεία της διάταξης του διάμεσου, του πρώτου τεταρτημορίου και του τρίτου τεταρτημορίου εισάγονται τυπικά σε a με μια διακριτή ομάδα δεδομένων, αυτά τα στατιστικά στοιχεία μπορούν επίσης να οριστούν για μια συνεχή τυχαία σειρά μεταβλητός. Δεδομένου ότι εργαζόμαστε με μια συνεχή διανομή, χρησιμοποιούμε το ολοκλήρωμα. ο
Πτο εκατοστημόριο είναι ένας αριθμός n έτσι ώστε:∫-₶nφά ( Χ ) dx = Π/100.
Εδώ φά ( Χ ) είναι μια συνάρτηση πυκνότητας πιθανότητας. Έτσι μπορούμε να αποκτήσουμε οποιοδήποτε εκατοστημόριο που θέλουμε για ένα συνεχής διανομή.
Ποσότητες
Μια περαιτέρω γενίκευση είναι να σημειώσουμε ότι τα στατιστικά στοιχεία της παραγγελίας μας χωρίζουν τη διανομή με την οποία εργαζόμαστε. Ο διάμεσος διαιρεί το σύνολο δεδομένων στο μισό και το διάμεσο ή 50ο εκατοστημόριο μιας συνεχούς κατανομής διαιρεί τη διανομή σε μισό σε όρους περιοχής. Το πρώτο τεταρτημόριο, διάμεσος και το τρίτο τεταρτημόριο χωρίζει τα δεδομένα μας σε τέσσερα κομμάτια με τον ίδιο αριθμό σε κάθε ένα. Μπορούμε να χρησιμοποιήσουμε το παραπάνω ολοκλήρωμα για να αποκτήσουμε το 25ο, 50ο και 75ο εκατοστημόριο και να διαιρέσουμε μια συνεχή κατανομή σε τέσσερα τμήματα ίσων περιοχών.
Μπορούμε να γενικεύσουμε αυτή τη διαδικασία. Το ερώτημα με το οποίο μπορούμε να ξεκινήσουμε είναι ένας φυσικός αριθμός n, πώς μπορούμε να χωρίσουμε τη διανομή μιας μεταβλητής σε n κομμάτια ίσου μεγέθους; Αυτό μιλάει άμεσα στην ιδέα των ποσοστών.
ο n τα ποσοτικά μεγέθη για ένα σύνολο δεδομένων βρίσκονται περίπου με την ταξινόμηση των δεδομένων με σειρά και στη συνέχεια με τη διάσπαση αυτής της κατάταξης n - 1 ισαπέχοντα σημεία στο διάστημα.
Αν έχουμε μια συνάρτηση πυκνότητας πιθανότητας για μια συνεχή τυχαία μεταβλητή, χρησιμοποιούμε το παραπάνω ολοκλήρωμα για να βρούμε τα ποσοστά. Για n ποσοτικά, θέλουμε:
- Οι πρώτοι που έχουν 1 /n της περιοχής διανομής στα αριστερά του.
- Το δεύτερο που έχει 2 /n της περιοχής διανομής στα αριστερά του.
- ο rνα έχει r/n της περιοχής διανομής στα αριστερά του.
- Το τελευταίο έχει (n - 1)/n της περιοχής διανομής στα αριστερά του.
Αυτό το βλέπουμε για κάθε φυσικό αριθμό n, ο n ποσοστά αντιστοιχούν στα 100r/nτα εκατοστημόρια, όπου r μπορεί να είναι οποιοσδήποτε φυσικός αριθμός από 1 έως n - 1.
Κοινές ποσότητες
Ορισμένοι τύποι ποσοτήτων χρησιμοποιούνται συνήθως αρκετά ώστε να έχουν συγκεκριμένα ονόματα. Παρακάτω είναι μια λίστα με τα παρακάτω:
- Τα 2 ποσοτικά ονομάζονται διάμεσος
- Τα 3 ποσοτικά ονομάζονται terciles
- Τα 4 ποσοτικά ονομάζονται τεταρτημόρια
- Τα 5 ποσοτικά ονομάζονται πεμπτηρίδες
- Τα 6 ποσοστά ονομάζονται σεξίνες
- Τα 7 ποσοτικά ονομάζονται θηλές
- Τα 8 ποσοτικά ονομάζονται γραφικά
- Τα 10 ποσοτικά ονομάζονται deciles
- Τα 12 ποσοτικά ονομάζονται «δωδεκάδες»
- Τα 20 ποσοτικά ονομάζονται βιγκίντιλα
- Τα 100 ποσοστά ονομάζονται εκατοστημόρια
- Τα 1000 ποσοστά ονομάζονται permilles
Φυσικά, υπάρχουν και άλλα ποσοτικά όρια πέρα από αυτά της παραπάνω λίστας. Πολλές φορές οι συγκεκριμένες ποσότητες που χρησιμοποιούνται ταιριάζουν με το μέγεθος του δείγματος από ένα συνεχές διανομή.
Χρήση των ποσοτήτων
Εκτός από τον προσδιορισμό της θέσης ενός συνόλου δεδομένων, τα ποσοστά είναι χρήσιμα με άλλους τρόπους. Ας υποθέσουμε ότι έχουμε ένα απλό τυχαίο δείγμα από έναν πληθυσμό και η κατανομή του πληθυσμού είναι άγνωστη. Για να μπορέσουμε να διαπιστώσουμε εάν ένα μοντέλο, όπως μια κανονική διανομή ή η διανομή Weibull είναι μια καλή εφαρμογή για τον πληθυσμό από τον οποίο ερευνήσαμε, μπορούμε να δούμε τα ποσοτικά μεγέθη των δεδομένων και του μοντέλου μας.
Με την αντιστοίχιση των ποσοστών από τα δείγματα των δεδομένων μας με τα ποσοτικά μεγέθη από ένα συγκεκριμένο κατανομή πιθανότητας, το αποτέλεσμα είναι μια συλλογή ζευγαρωμένων δεδομένων. Σχεδιάζουμε αυτά τα δεδομένα σε ένα scatterplot, γνωστό ως ένα quantile-quantile plot ή q-q plot. Εάν το προκύπτον scatterplot είναι κατά προσέγγιση γραμμικό, τότε το μοντέλο είναι μια καλή εφαρμογή για τα δεδομένα μας.