Παράδειγμα Bootstrapping σε Στατιστικά

Εκκίνηση είναι μια ισχυρή στατιστική τεχνική. Είναι ιδιαίτερα χρήσιμο όταν το δείγμα το μέγεθος με το οποίο εργαζόμαστε είναι μικρό. Κάτω από συνηθισμένες συνθήκες, τα μεγέθη δειγμάτων κάτω των 40 δεν μπορούν να αντιμετωπιστούν με την υπόθεση a κανονική κατανομή ή α t διανομή. Οι τεχνικές εκκίνησης λειτουργούν αρκετά καλά με δείγματα που έχουν λιγότερα από 40 στοιχεία. Ο λόγος για αυτό είναι ότι η bootstrapping περιλαμβάνει αναδειγματοληψία. Αυτά τα είδη τεχνικών δεν παίρνουν τίποτα για το διανομή των δεδομένων μας.

Το bootstrapping έχει γίνει πιο δημοφιλές καθώς οι υπολογιστικοί πόροι έχουν γίνει πιο εύκολα διαθέσιμοι. Αυτό συμβαίνει επειδή για να είναι πρακτική η εκκίνηση του bootstrapping πρέπει να χρησιμοποιηθεί ένας υπολογιστής. Θα δούμε πώς λειτουργεί αυτό στο ακόλουθο παράδειγμα bootstrapping.

Αρχίζουμε με ένα στατιστικό δείγμα από έναν πληθυσμό για τον οποίο δεν γνωρίζουμε τίποτα. Ο στόχος μας θα είναι ένα διάστημα εμπιστοσύνης 90% σχετικά με τη μέση τιμή του δείγματος. Αν και άλλες στατιστικές τεχνικές που χρησιμοποιήθηκαν για τον προσδιορισμό

instagram viewer
διαστήματα εμπιστοσύνης υποθέσουμε ότι γνωρίζουμε τη μέση ή τυπική απόκλιση του πληθυσμού μας, η εκκίνηση δεν απαιτεί τίποτα άλλο από το δείγμα.

Για τους σκοπούς του παραδείγματός μας, θα υποθέσουμε ότι το δείγμα είναι 1, 2, 4, 4, 10.

Αναλύουμε τώρα με αντικατάσταση από το δείγμα μας για να σχηματίσουμε τα γνωστά ως δείγματα bootstrap. Κάθε δείγμα bootstrap θα έχει μέγεθος πέντε, ακριβώς όπως το αρχικό μας δείγμα. Δεδομένου ότι επιλέγουμε τυχαία και στη συνέχεια αντικαθιστούμε κάθε τιμή, τα δείγματα εκκίνησης μπορεί να είναι διαφορετικά από το αρχικό δείγμα και το ένα από το άλλο.

Για παραδείγματα που θα μπορούσαμε να αντιμετωπίσουμε στον πραγματικό κόσμο, θα κάνουμε αυτό το δειγματοληψία εκατοντάδες αν όχι χιλιάδες φορές. Σε ό, τι ακολουθεί παρακάτω, θα δούμε ένα παράδειγμα 20 δειγμάτων bootstrap:

Δεδομένου ότι χρησιμοποιούμε την εκκίνηση για να υπολογίσουμε ένα διάστημα εμπιστοσύνης για τον μέσο όρο του πληθυσμού, υπολογίζουμε τώρα τα μέσα κάθε δείγματος εκκίνησης. Αυτά τα μέσα, διατεταγμένα κατά αύξουσα σειρά, είναι: 2, 2,4, 2,6, 2,6, 2,8, 3, 3, 3,2, 3,4, 3,6, 3,8, 4, 4, 4,2, 4,6, 5,2,6,6,6,6,7,6.

Τώρα αποκτάται από τον κατάλογο μας δείγμα bootstrap σημαίνει ένα διάστημα εμπιστοσύνης. Δεδομένου ότι θέλουμε ένα διάστημα εμπιστοσύνης 90%, χρησιμοποιούμε το 95ο και το 5ο εκατοστημόριο ως τα τελικά σημεία των διαστημάτων. Ο λόγος για αυτό είναι ότι χωρίσαμε 100% - 90% = 10% στο μισό, έτσι ώστε να έχουμε το μεσαίο 90% όλων των δειγμάτων bootstrap.