Κατηγορίες ιστόγραμμα: Πληροφορίες και παραδείγματα

Δεν υπάρχει κανένας κανόνας για το πόσες τάξεις πρέπει να υπάρχουν. Υπάρχουν μερικά πράγματα που πρέπει να λάβετε υπόψη για τον αριθμό των τάξεων. Εάν υπήρχε μόνο μία τάξη, τότε όλα τα δεδομένα θα πέσουν σε αυτή την τάξη. Το ιστόγραμμα μας θα είναι απλά ένα ενιαίο ορθογώνιο με ύψος που δίνεται από τον αριθμό των στοιχείων στο σύνολο δεδομένων μας. Αυτό δεν θα ήταν πολύ χρήσιμο ή χρήσιμο ιστόγραμμα.

Στο άλλο άκρο, θα μπορούσαμε να έχουμε ένα πλήθος τάξεων. Αυτό θα είχε ως αποτέλεσμα ένα πλήθος μπαρ, κανένας από τους οποίους θα ήταν πιθανώς πολύ ψηλός. Θα ήταν πολύ δύσκολο να προσδιοριστούν τυχόν διακριτικά χαρακτηριστικά από τα δεδομένα χρησιμοποιώντας αυτό το είδος ιστόγραμμα.

Για να προφυλαχτούμε από αυτά τα δύο άκρα, έχουμε έναν βασικό κανόνα που πρέπει να χρησιμοποιήσουμε για να καθορίσουμε τον αριθμό των τάξεων για ένα ιστόγραμμα. Όταν έχουμε σχετικά μικρό σύνολο δεδομένων, χρησιμοποιούμε συνήθως περίπου πέντε κατηγορίες. Αν το σύνολο δεδομένων είναι σχετικά μεγάλο, τότε χρησιμοποιούμε περίπου 20 κατηγορίες.

instagram viewer

Και πάλι, ας υπογραμμίσουμε ότι αυτός είναι ένας βασικός κανόνας, όχι μια απόλυτη στατιστική αρχή. Μπορεί να υπάρχουν σοβαροί λόγοι για να υπάρχει ένας διαφορετικός αριθμός κατηγοριών για δεδομένα. Θα δούμε ένα παράδειγμα αυτού παρακάτω.

Πριν εξετάσουμε μερικά παραδείγματα, θα δούμε πώς να καθορίσουμε ποιες είναι οι τάξεις. Αρχίζουμε αυτή τη διαδικασία βρίσκοντας το εύρος των δεδομένων μας. Με άλλα λόγια, αφαιρούμε τη χαμηλότερη τιμή δεδομένων από την υψηλότερη τιμή δεδομένων.

Όταν το σύνολο δεδομένων είναι σχετικά μικρό, διαιρούμε το εύρος κατά πέντε. Το πηλίκο είναι το πλάτος των τάξεων για το ιστόγραμμα μας. Ίσως χρειαστεί να κάνουμε κάποια στρογγυλοποίηση στη διαδικασία αυτή, πράγμα που σημαίνει ότι ο συνολικός αριθμός των τάξεων δεν μπορεί να φτάσει τα πέντε.

Όταν το σύνολο δεδομένων είναι σχετικά μεγάλο, διαιρούμε το εύρος κατά 20. Όπως και πριν, αυτό το πρόβλημα διαίρεσης μας δίνει το πλάτος των τάξεων για το ιστόγραμμά μας. Επίσης, όπως είδαμε προηγουμένως, η στρογγυλοποίηση μπορεί να έχει ως αποτέλεσμα ελαφρώς περισσότερες ή ελαφρώς λιγότερες από 20 κατηγορίες.

Σε μία από τις περιπτώσεις μεγάλων ή μικρών συνόλων δεδομένων, αρχίζουμε την πρώτη τάξη να αρχίζει σε ένα σημείο ελαφρώς μικρότερο από τη μικρότερη τιμή δεδομένων. Πρέπει να το κάνουμε με τέτοιο τρόπο ώστε η πρώτη τιμή δεδομένων να πέφτει στην πρώτη τάξη. Οι άλλες επόμενες κλάσεις καθορίζονται από το πλάτος που καθορίστηκε όταν διαιρέσαμε το εύρος. Γνωρίζουμε ότι βρισκόμαστε στην τελευταία τάξη όταν η υψηλότερη τιμή δεδομένων μας περιέχεται από αυτή την τάξη.

Για παράδειγμα, θα προσδιορίσουμε ένα κατάλληλο εύρος κλάσης και τάξεις για το σύνολο δεδομένων: 1.1, 1.9, 2.3, 3.0, 3.2, 4.1, 4.2, 4.4, 5.5, 5.5, 5.6, 5.7, 5.9, 6.2, 7.1, 7.9, 8.3, 9.0, 9.2, 11.1, 11.2, 14.4, 15.5, 15.5, 16.7, 18.9, 19.2.

Βλέπουμε ότι υπάρχουν 27 σημεία δεδομένων στο σύνολο μας. Αυτό είναι ένα σχετικά μικρό σύνολο και έτσι θα διαιρέσουμε το εύρος κατά πέντε. Το εύρος είναι 19,2 - 1,1 = 18,1. Διαχωρίζουμε 18,1 / 5 = 3,62. Αυτό σημαίνει ότι ένα εύρος κλάσης 4 θα ήταν κατάλληλο. Η μικρότερη τιμή δεδομένων μας είναι 1,1, οπότε ξεκινάμε την πρώτη τάξη σε ένα σημείο μικρότερο από αυτό. Δεδομένου ότι τα δεδομένα μας αποτελούνται από θετικούς αριθμούς, θα ήταν λογικό να φτάσουμε στην πρώτη τάξη από 0 σε 4.

Για ένα παράδειγμα αυτού, υποθέστε ότι υπάρχει μια δοκιμή πολλαπλών επιλογών με 35 ερωτήσεις σχετικά με αυτό, και 1000 μαθητές σε ένα γυμνάσιο να λάβει τη δοκιμή. Θέλουμε να σχηματίσουμε ένα ιστόγραμμα που να δείχνει τον αριθμό των μαθητών που πέτυχαν συγκεκριμένες βαθμολογίες στη δοκιμασία. Βλέπουμε ότι 35/5 = 7 και αυτό το 35/20 = 1,75. Παρά τον κανόνα μας που μας δίνει τις επιλογές των τάξεων πλάτους 2 ή 7 που θα χρησιμοποιήσουμε για το ιστόγραμμα μας, ίσως είναι καλύτερο να έχουμε τάξεις πλάτους 1. Αυτές οι κλάσεις αντιστοιχούν σε κάθε ερώτηση που ο φοιτητής απάντησε σωστά στη δοκιμή. Η πρώτη από αυτές θα επικεντρώνεται στο 0 και η τελευταία θα επικεντρώνεται σε 35.

instagram story viewer