Τι είναι η εκκίνηση σε σχέση με τις στατιστικές;

Το bootstrapping είναι μια στατιστική τεχνική που εμπίπτει στην ευρύτερη επικεφαλίδα της αναδειγματοληψίας. Αυτή η τεχνική περιλαμβάνει μια σχετικά απλή διαδικασία αλλά επαναλαμβάνεται τόσες φορές που εξαρτάται σε μεγάλο βαθμό από υπολογισμούς υπολογιστών. Το bootstrapping παρέχει μια μέθοδο διαφορετική από τα διαστήματα εμπιστοσύνης για την εκτίμηση μιας παραμέτρου πληθυσμού. Το bootstrapping φαίνεται να λειτουργεί σαν μαγικό. Διαβάστε παρακάτω για να δείτε πώς αποκτά το ενδιαφέρον του όνομα.

Μια επεξήγηση για το Bootstrapping

Ένας στόχος της επαγωγική στατιστική είναι να προσδιοριστεί η τιμή μιας παραμέτρου ενός πληθυσμού. Είναι συνήθως πολύ ακριβό ή και αδύνατο να μετρηθεί αυτό άμεσα. Έτσι χρησιμοποιούμε στατιστική δειγματοληψία. Δοκιμάζουμε έναν πληθυσμό, μετράμε ένα στατιστικό δείγμα αυτού του δείγματος και στη συνέχεια χρησιμοποιούμε αυτό το στατιστικό για να πούμε κάτι για το αντίστοιχη παράμετρο του πληθυσμού.

Για παράδειγμα, σε ένα εργοστάσιο σοκολάτας, ίσως να θέλουμε να εγγυηθούμε ότι οι καραμέλες έχουν ιδιαίτερη σημασία

instagram viewer
σημαίνω βάρος. Δεν είναι εφικτό να ζυγίζουμε κάθε καραμέλα που παράγεται, γι 'αυτό και χρησιμοποιούμε τεχνικές δειγματοληψίας για την τυχαία επιλογή 100 bar candy bars. Υπολογίζουμε το μέσο όρο των 100 γραμμών καραμελών και λέμε ότι ο μέσος όρος του πληθυσμού πέφτει μέσα σε ένα περιθώριο σφάλματος από το μέσο όρο του δείγματος μας.

Ας υποθέσουμε ότι λίγους μήνες αργότερα θέλουμε να γνωρίζουμε με μεγαλύτερη ακρίβεια - ή λιγότερο από ένα περιθώριο σφάλματος - ποιο ήταν το μέσο βάρος του ζαχαρωτού κατά την ημέρα της δειγματοληψίας της γραμμής παραγωγής. Δεν μπορούμε να χρησιμοποιήσουμε τις σημερινές καραμέλες, όπως και εγώ πολλές μεταβλητές έχουν εισέλθει στην εικόνα (διαφορετικές παρτίδες γάλακτος, ζάχαρης και κακάο, διαφορετικές ατμοσφαιρικές συνθήκες, διαφορετικοί υπάλληλοι στη γραμμή κ.λπ.). Το μόνο που έχουμε από την ημέρα που είμαστε περίεργοι είναι τα 100 βάρη. Χωρίς μια μηχανή χρόνου πίσω σε εκείνη την ημέρα, φαίνεται ότι το αρχικό περιθώριο λάθους είναι το καλύτερο που μπορούμε να ελπίζουμε.

Ευτυχώς, μπορούμε να χρησιμοποιήσουμε το τεχνική του bootstrapping. Σε αυτή την περίπτωση, εμείς τυχαία δείγμα με αντικατάσταση από τα 100 γνωστά βάρη. Κατόπιν ονομάζουμε ένα δείγμα bootstrap. Δεδομένου ότι επιτρέπουμε αντικατάσταση, αυτό το δείγμα εκκίνησης πιθανότατα δεν είναι ταυτόσημο με το αρχικό μας δείγμα. Ορισμένα σημεία δεδομένων ενδέχεται να αντιγραφούν και άλλα σημεία δεδομένων από το αρχικό 100 ενδέχεται να παραλειφθούν σε ένα δείγμα εκκίνησης. Με τη βοήθεια ενός υπολογιστή, χιλιάδες δείγματα εκκίνησης μπορούν να κατασκευαστούν σε σχετικά σύντομο χρονικό διάστημα.

Ενα παράδειγμα

Όπως αναφέρθηκε, για να χρησιμοποιήσουμε πραγματικά τις τεχνικές bootstrap πρέπει να χρησιμοποιήσουμε έναν υπολογιστή. Το παρακάτω αριθμητικό παράδειγμα θα σας βοηθήσει να δείξετε πώς λειτουργεί η διαδικασία. Αν ξεκινήσουμε με το δείγμα 2, 4, 5, 6, 6, τότε όλα τα παρακάτω είναι πιθανά δείγματα εκκίνησης:

  • 2 ,5, 5, 6, 6
  • 4, 5, 6, 6, 6
  • 2, 2, 4, 5, 5
  • 2, 2, 2, 4, 6
  • 2, 2, 2, 2, 2
  • 4,6, 6, 6, 6

Ιστορία της Τεχνικής

Οι τεχνικές bootstrap είναι σχετικά νέες στον τομέα των στατιστικών. Η πρώτη χρήση δημοσιεύθηκε σε μια δημοσίευση του 1979 από τον Bradley Efron. Καθώς η υπολογιστική ισχύς έχει αυξηθεί και καθίσταται λιγότερο δαπανηρή, οι τεχνικές εκκίνησης έχουν γίνει πιο διαδεδομένες.

Γιατί το όνομα Bootstrapping;

Το όνομα "bootstrapping" προέρχεται από τη φράση "Να σηκωθείς από τα bootstraps του." Αυτό αναφέρεται σε κάτι που είναι παράλογο και αδύνατο. Δοκιμάστε όσο πιο σκληρά μπορείτε, δεν μπορείτε να σηκωθείτε στον αέρα τραβώντας τα κομμάτια του δέρματος στις μπότες σας.

Υπάρχει κάποια μαθηματική θεωρία που δικαιολογεί τεχνικές εκκίνησης. Ωστόσο, η χρήση bootstrapping αισθάνεται σαν να κάνετε το αδύνατο. Παρόλο που δεν φαίνεται ότι θα μπορούσατε να βελτιώσετε την εκτίμηση του πληθυσμιακού στατιστικού στοιχείου χρησιμοποιώντας το ίδιο δείγμα ξανά και ξανά, το bootstrapping μπορεί στην πραγματικότητα να το κάνει αυτό.