Στην κατασκευή ενός ιστόγραμμα, υπάρχουν μερικά βήματα που πρέπει να αναλάβουμε προτού να τραβήξουμε το γράφημά μας. Μετά τη ρύθμιση του τάξεις που θα χρησιμοποιήσουμε, εκχωρούμε κάθε μία από τις τιμές των δεδομένων σε μία από αυτές τις κλάσεις, μετράμε τότε τον αριθμό των τιμών δεδομένων που εμπίπτουν σε κάθε κλάση και σχεδιάζουμε τα ύψη των γραμμών. Αυτά τα ύψη μπορούν να καθοριστούν με δύο διαφορετικούς τρόπους που αλληλοσυνδέονται: συχνότητα ή σχετική συχνότητα.
Η συχνότητα μιας κλάσης είναι η καταμέτρηση του πόσες τιμές δεδομένων εμπίπτουν σε μια συγκεκριμένη κλάση όπου οι κλάσεις με μεγαλύτερες συχνότητες έχουν υψηλότερες ράβδους και οι κλάσεις με μικρότερες συχνότητες έχουν χαμηλότερες ράβδους. Από την άλλη πλευρά, η σχετική συχνότητα απαιτεί ένα επιπλέον βήμα, καθώς είναι το μέτρο του ποσοστού ή του ποσοστού των τιμών των δεδομένων που εμπίπτουν σε μια συγκεκριμένη κλάση.
Ένας απλός υπολογισμός προσδιορίζει τη σχετική συχνότητα από τη συχνότητα προσθέτοντας όλες τις συχνότητες των κλάσεων και διαιρώντας την καταμέτρηση ανά τάξη με το άθροισμα αυτών των συχνοτήτων.
Η διαφορά μεταξύ συχνότητας και σχετικής συχνότητας
Για να δείτε τη διαφορά μεταξύ συχνότητας και σχετικής συχνότητας, θα εξετάσουμε το ακόλουθο παράδειγμα. Ας υποθέσουμε ότι εξετάζουμε τους βαθμούς ιστορίας των φοιτητών της 10ης τάξης και τα μαθήματα που αντιστοιχούν σε βαθμούς επιστολών: A, B, C, D, F. Ο αριθμός καθενός από αυτούς τους βαθμούς μας δίνει μια συχνότητα για κάθε κατηγορία:
- 7 μαθητές με F
- 9 μαθητές με Δ
- 18 μαθητές με Γ
- 12 μαθητές με Β
- 4 μαθητές με Α
Για να προσδιορίσουμε τη σχετική συχνότητα για κάθε κατηγορία προσθέτουμε πρώτα τον συνολικό αριθμό σημείων δεδομένων: 7 + 9 + 18 + 12 + 4 = 50. Στη συνέχεια, διαιρέστε κάθε συχνότητα με αυτό το ποσό 50.
- 0,14 = 14% φοιτητές με πτυχίο F
- 0,18 = 18% φοιτητές με Δ
- 0,36 = 36% φοιτητές με πτυχίο C
- 0,24 = 24% φοιτητές με Β
- 0.08 = 8% φοιτητές με Α
Το αρχικό σύνολο δεδομένων με τον αριθμό των φοιτητών που εμπίπτουν σε κάθε τάξη (βαθμός επιστολής) θα είναι ενδεικτική της συχνότητας, ενώ το ποσοστό στο δεύτερο σύνολο δεδομένων αντιπροσωπεύει τη σχετική συχνότητα αυτούς τους βαθμούς.
Ένας εύκολος τρόπος για να ορίσετε τη διαφορά μεταξύ συχνότητας και σχετικής συχνότητας είναι ότι η συχνότητα βασίζεται στις πραγματικές τιμές κάθε κατηγορίας σε ένα σύνολο στατιστικών δεδομένων, ενώ σχετική συχνότητα συγκρίνει αυτές τις μεμονωμένες τιμές με τα συνολικά σύνολα όλων των κατηγοριών που αφορούν ένα δεδομένο σειρά.
Ιστογράμματα
Μπορούν να χρησιμοποιηθούν είτε συχνότητες είτε σχετικές συχνότητες για ένα ιστόγραμμα. Αν και οι αριθμοί κατά μήκος του κατακόρυφου άξονα θα είναι διαφορετικοί, το συνολικό σχήμα του ιστόγραμμα θα παραμείνει αμετάβλητο. Αυτό συμβαίνει επειδή τα ύψη σε σχέση με το άλλο είναι τα ίδια είτε χρησιμοποιούμε συχνότητες είτε σχετικές συχνότητες.
Τα σχετικά ιστογράμματα συχνοτήτων είναι σημαντικά επειδή τα ύψη μπορούν να ερμηνευτούν ως πιθανότητες. Αυτά τα ιστογράμματα πιθανότητας παρέχουν μια γραφική απεικόνιση ενός a κατανομή πιθανότητας, τα οποία μπορούν να χρησιμοποιηθούν για τον προσδιορισμό της πιθανότητας εμφάνισης ορισμένων αποτελεσμάτων εντός ενός συγκεκριμένου πληθυσμού.
Τα ιστογράμματα είναι χρήσιμα εργαλεία για την ταχεία παρακολούθηση των τάσεων στους πληθυσμούς, προκειμένου για τους στατιστικολόγους, τους νομοθέτες και τους οι κοινοτικοί διοργανωτές να είναι σε θέση να καθορίσουν την καλύτερη πορεία δράσης για να επηρεάσουν τους περισσότερους ανθρώπους σε μια συγκεκριμένη πληθυσμός.