Υπάρχουν πολλά κατανομών πιθανοτήτων που χρησιμοποιούνται σε όλες τις στατιστικές. Για παράδειγμα, η κανονική κανονική κατανομή, ή καμπύλη καμπάνας, είναι ίσως η πιο αναγνωρισμένη. Οι κανονικές κατανομές είναι μόνο ένας τύπος διανομής. Μια πολύ χρήσιμη κατανομή πιθανότητας για τη μελέτη των μεταβλητών του πληθυσμού ονομάζεται κατανομή F. Θα εξετάσουμε πολλές από τις ιδιότητες αυτού του τύπου διανομής.
Βασικές ιδιότητες
Ο τύπος πυκνότητας πιθανότητας για την κατανομή F είναι πολύ περίπλοκος. Στην πράξη, δεν χρειάζεται να ασχολούμαστε με αυτόν τον τύπο. Μπορεί όμως να είναι αρκετά χρήσιμο να γνωρίζουμε κάποιες από τις λεπτομέρειες των ιδιοτήτων που αφορούν τη διανομή F. Μερικά από τα πιο σημαντικά χαρακτηριστικά αυτής της διανομής αναφέρονται παρακάτω:
- Η κατανομή F είναι μια οικογένεια διανομών. Αυτό σημαίνει ότι υπάρχει ένας άπειρος αριθμός διαφορετικών κατανομών F. Η συγκεκριμένη κατανομή F που χρησιμοποιούμε για μια εφαρμογή εξαρτάται από τον αριθμό των βαθμοί ελευθερίας ότι το δείγμα μας έχει. Αυτό το χαρακτηριστικό της κατανομής F είναι παρόμοιο με το t-διανομή και την κατανομή chi-square.
- Η κατανομή F είναι είτε μηδενική είτε θετική, επομένως δεν υπάρχουν αρνητικές τιμές για φά. Αυτό το χαρακτηριστικό της κατανομής F είναι παρόμοιο με την κατανομή chi-square.
- Η κατανομή F είναι λοξή δεξιά. Επομένως, αυτή η κατανομή πιθανότητας είναι ασύμμετρη. Αυτό το χαρακτηριστικό της κατανομής F είναι παρόμοιο με την κατανομή chi-square.
Αυτά είναι μερικά από τα πιο σημαντικά και εύκολα προσδιορισμένα χαρακτηριστικά. Θα εξετάσουμε πιο προσεκτικά τους βαθμούς ελευθερίας.
Βαθμοί ελευθερίας
Ένα χαρακτηριστικό που μοιράζεται με τις διανομές chi-square, τις διανομές t και τις κατανομές F είναι ότι υπάρχει πραγματικά μια άπειρη οικογένεια καθεμιάς από αυτές τις διανομές. Μια ιδιαίτερη διανομή ξεχωρίζει γνωρίζοντας τον αριθμό των βαθμών ελευθερίας. Για ένα t διανομή, ο βαθμός ελευθερίας είναι μικρότερος από το μέγεθος του δείγματος. Ο αριθμός βαθμών ελευθερίας για μια κατανομή F προσδιορίζεται με διαφορετικό τρόπο από ότι για τη διανομή t ή ακόμη και την τετραγωνική κατανομή.
Θα δούμε παρακάτω πώς ακριβώς προκύπτει μια κατανομή F. Προς το παρόν, θα εξετάσουμε μόνο αρκετά για να καθορίσουμε τον αριθμό των βαθμών ελευθερίας. Η κατανομή F προέρχεται από μια αναλογία που περιλαμβάνει δύο πληθυσμούς. Υπάρχει ένα δείγμα από κάθε έναν από αυτούς τους πληθυσμούς και έτσι υπάρχουν βαθμοί ελευθερίας και για τα δύο αυτά δείγματα. Στην πραγματικότητα, αφαιρούμε ένα από τα δύο μεγέθη δείγματος για να καθορίσουμε τους δύο βαθμούς ελευθερίας μας.
Οι στατιστικές από αυτούς τους πληθυσμούς συνδυάζονται σε ένα κλάσμα για την στατιστική F. Τόσο ο αριθμητής όσο και ο παρονομαστής έχουν βαθμούς ελευθερίας. Αντί να συνδυάσουμε αυτούς τους δύο αριθμούς σε έναν άλλο αριθμό, διατηρούμε και τα δύο. Επομένως, οποιαδήποτε χρήση ενός πίνακα διανομής F απαιτεί να βρούμε δύο διαφορετικούς βαθμούς ελευθερίας.
Χρήσεις της F-Διανομής
Η κατανομή F προκύπτει από επαγωγική στατιστική όσον αφορά τις μεταβολές του πληθυσμού. Συγκεκριμένα, χρησιμοποιούμε μια κατανομή F όταν μελετούμε τον λόγο των διακυμάνσεων δύο κανονικά κατανεμημένων πληθυσμών.
Η κατανομή F δεν χρησιμοποιείται αποκλειστικά για την κατασκευή διαστημάτων εμπιστοσύνης και υποθέσεις δοκιμών σχετικά με τις μεταβολές του πληθυσμού. Αυτός ο τύπος διανομής χρησιμοποιείται επίσης σε έναν παράγοντα ανάλυση της διακύμανσης (ANOVA). Η ANOVA ασχολείται με τη σύγκριση της διακύμανσης μεταξύ διαφόρων ομάδων και την παραλλαγή μέσα σε κάθε ομάδα. Για να το πετύχουμε, χρησιμοποιούμε μια αναλογία διακυμάνσεων. Αυτή η αναλογία των διακυμάνσεων έχει την κατανομή F. Μια κάπως πολύπλοκη φόρμουλα μας επιτρέπει να υπολογίσουμε μια στατιστική F ως στατιστικό τεστ.