Τι είναι η διανομή δειγμάτων;

Στατιστική δειγματοληψία χρησιμοποιείται αρκετά συχνά στις στατιστικές. Σε αυτή τη διαδικασία, στοχεύουμε να προσδιορίσουμε κάτι για έναν πληθυσμό. Δεδομένου ότι οι πληθυσμοί είναι συνήθως μεγάλοι σε μέγεθος, δημιουργούμε ένα στατιστικό δείγμα επιλέγοντας ένα υποσύνολο του πληθυσμού που έχει προκαθορισμένο μέγεθος. Μελετώντας το δείγμα μπορούμε να χρησιμοποιήσουμε στατιστικά στοιχεία για να προσδιορίσουμε κάτι για τον πληθυσμό.

Ένα στατιστικό δείγμα μεγέθους n περιλαμβάνει μια ενιαία ομάδα n άτομα ή άτομα που έχουν επιλεγεί τυχαία από τον πληθυσμό. Σε στενή σχέση με την έννοια ενός στατιστικού δείγματος είναι η κατανομή δειγματοληψίας.

Καταγωγή των διανομών δειγματοληψίας

Μια κατανομή δειγματοληψίας εμφανίζεται όταν σχηματίσουμε περισσότερα από ένα απλό τυχαίο δείγμα του ίδιου μεγέθους από έναν δεδομένο πληθυσμό. Αυτά τα δείγματα θεωρούνται ανεξάρτητα το ένα από το άλλο. Έτσι, αν ένα άτομο είναι σε ένα δείγμα, τότε έχει την ίδια πιθανότητα να βρίσκεται στο επόμενο δείγμα που λαμβάνεται.

Υπολογίζουμε ένα συγκεκριμένο στατιστικό στοιχείο για κάθε δείγμα. Αυτό θα μπορούσε να είναι ένα δείγμα

instagram viewer
σημαίνω, διακύμανση δείγματος ή αναλογία δείγματος. Δεδομένου ότι ένα στατιστικό στοιχείο εξαρτάται από το δείγμα που έχουμε, κάθε δείγμα θα παράγει τυπικά διαφορετική τιμή για το στατιστικό ενδιαφέρον. Το φάσμα των τιμών που έχουν παραχθεί είναι αυτό που μας δίνει τη διανομή δειγματοληψίας.

Δειγματοληψία διανομή για τα μέσα

Για παράδειγμα, θα εξετάσουμε την κατανομή δειγματοληψίας για τον μέσο όρο. Ο μέσος όρος ενός πληθυσμού είναι μια παράμετρος που είναι συνήθως άγνωστη. Εάν επιλέξουμε ένα δείγμα μεγέθους 100, τότε ο μέσος όρος αυτού του δείγματος υπολογίζεται εύκολα προσθέτοντας όλες τις τιμές μαζί και στη συνέχεια διαιρώντας με τον συνολικό αριθμό σημείων δεδομένων, στην περίπτωση αυτή 100. Ένα δείγμα μεγέθους 100 μπορεί να μας δώσει μέσο όρο 50. Ένα άλλο τέτοιο δείγμα μπορεί να έχει μέσο όρο 49. Ένα άλλο 51 και ένα άλλο δείγμα θα μπορούσαν να έχουν μέσο όρο 50,5.

Η κατανομή αυτών των μέσων δειγμάτων μας δίνει μια κατανομή δειγματοληψίας. Θα θέλαμε να εξετάσουμε περισσότερα από τέσσερα δείγματα, όπως κάναμε παραπάνω. Με αρκετά περισσότερα μέσα δειγματοληψίας θα έχουμε καλή ιδέα για το σχήμα της κατανομής δειγματοληψίας.

Γιατί μας ενδιαφέρει;

Δειγματοληψία Οι διανομές μπορεί να φαίνονται αρκετά αφηρημένες και θεωρητικές. Ωστόσο, υπάρχουν κάποιες πολύ σημαντικές συνέπειες από τη χρήση αυτών. Ένα από τα κύρια πλεονεκτήματα είναι ότι εξαλείφουμε τη μεταβλητότητα που υπάρχει στα στατιστικά στοιχεία.

Για παράδειγμα, ας υποθέσουμε ότι ξεκινάμε με έναν πληθυσμό με μέση τιμή μ και τυπική απόκλιση σ. Η τυπική απόκλιση μας δίνει μια μέτρηση του τρόπου διάδοσης της κατανομής. Θα το συγκρίνουμε με μια κατανομή δειγματοληψίας που λαμβάνεται με το σχηματισμό απλών τυχαίων δειγμάτων μεγέθους n. Η κατανομή δειγματοληψίας του μέσου θα έχει ακόμα μέση τιμή μ, αλλά η τυπική απόκλιση είναι διαφορετική. Η τυπική απόκλιση για μια κατανομή δειγματοληψίας γίνεται σ / √ n.

Έτσι έχουμε τα εξής

  • Ένα μέγεθος δείγματος 4 μας επιτρέπει να έχουμε μια κατανομή δειγματοληψίας με τυπική απόκλιση σ / 2.
  • Ένα μέγεθος δείγματος 9 μας επιτρέπει να έχουμε μια κατανομή δειγματοληψίας με τυπική απόκλιση σ / 3.
  • Ένα μέγεθος δείγματος 25 μας επιτρέπει να έχουμε μια κατανομή δειγματοληψίας με τυπική απόκλιση σ / 5.
  • Ένα μέγεθος δείγματος 100 μας επιτρέπει να έχουμε μια κατανομή δειγματοληψίας με τυπική απόκλιση σ / 10.

Στην πράξη

Στην πρακτική των στατιστικών, σπάνια δημιουργούμε διανομές δειγματοληψίας. Αντ 'αυτού, αντιμετωπίζουμε στατιστικά στοιχεία που προέρχονται από ένα απλό τυχαίο δείγμα μεγέθους n σαν να είναι ένα σημείο κατά μήκος μιας αντίστοιχης κατανομής δειγματοληψίας. Αυτό υπογραμμίζει και πάλι γιατί επιθυμούμε να έχουμε σχετικά μεγάλα μεγέθη δειγμάτων. Όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο μικρότερη είναι η διακύμανση που θα έχουμε στη στατιστική μας.

Σημειώστε ότι, εκτός από το κέντρο και την εξάπλωση, δεν μπορούμε να πούμε τίποτα για το σχήμα της διανομής δειγματοληψίας μας. Αποδεικνύεται ότι κάτω από κάποιες αρκετά ευρείες συνθήκες, το Θεώρημα κεντρικού ορίου μπορεί να εφαρμοστεί για να μας πει κάτι πολύ εκπληκτικό για το σχήμα μιας κατανομής δειγματοληψίας.

instagram story viewer