Ποια είναι η σταθερότητα στις στατιστικές;

Σε στατιστική, ο όρος ισχυρή ή ανθεκτικότητα αναφέρεται στην ισχύ ενός στατιστικού μοντέλου, των δοκιμών και των διαδικασιών σύμφωνα με τις ειδικές συνθήκες της στατιστικής ανάλυσης που επιθυμεί να επιτύχει μια μελέτη. Δεδομένου ότι πληρούνται αυτές οι προϋποθέσεις μιας μελέτης, τα μοντέλα μπορούν να επαληθευτούν για να είναι αληθινά μέσω της χρήσης μαθηματικών αποδείξεων.

Πολλά μοντέλα βασίζονται σε ιδανικές καταστάσεις που δεν υπάρχουν όταν εργάζονται με δεδομένα πραγματικού κόσμου και ως εκ τούτου το μοντέλο μπορεί να παρέχει σωστά αποτελέσματα ακόμη και αν δεν πληρούνται ακριβώς οι συνθήκες.

Σταθερά στατιστικά στοιχεία, συνεπώς, είναι οποιαδήποτε στατιστικά στοιχεία που αποδίδουν καλές επιδόσεις όταν λαμβάνονται δεδομένα από ένα ευρύ φάσμα κατανομές πιθανοτήτων οι οποίες είναι σε μεγάλο βαθμό ανεπηρέαστες από υπερβάσεις ή μικρές αποκλίσεις από υποθέσεις μοντέλων σε δεδομένο σύνολο δεδομένων. Με άλλα λόγια, μια ισχυρή στατιστική είναι ανθεκτική στα σφάλματα στα αποτελέσματα.

Ένας τρόπος να παρατηρήσουμε μια ευρέως διαδεδομένη αξιόπιστη στατιστική διαδικασία, δεν πρέπει να κοιτάξουμε πέρα ​​από τις διαδικασίες t, οι οποίες χρησιμοποιούν δοκιμασίες υποθέσεων για να καθορίσουν τις πιο ακριβείς στατιστικές προβλέψεις.

instagram viewer

Παρατηρώντας τις Τ-Διαδικασίες

Για παράδειγμα ευρωστίας, θα εξετάσουμε t-διαδικασίες, οι οποίες περιλαμβάνουν το διάστημα εμπιστοσύνης για έναν μέσο πληθυσμό με άγνωστη τυπική απόκλιση του πληθυσμού, καθώς και δοκιμασίες υποθέσεων σχετικά με τον μέσο όρο του πληθυσμού.

Η χρήση του t-διαδικασίες προϋποθέτει τα εξής:

  • Το σύνολο των δεδομένων με τα οποία εργαζόμαστε είναι α απλό τυχαίο δείγμα του πληθυσμού.
  • Ο πληθυσμός από τον οποίο έχουμε δειγματοληψία κατανέμεται κανονικά.

Στην πράξη, με παραδείγματα πραγματικής ζωής, οι στατιστικολόγοι σπάνια έχουν έναν πληθυσμό που διανέμεται κανονικά, οπότε το ερώτημα καθίσταται, "Πόσο ισχυρή είναι η μας t-διαδικασίες; "

Γενικά η προϋπόθεση ότι έχουμε ένα απλό τυχαίο δείγμα είναι πιο σημαντική από την προϋπόθεση ότι έχουμε δειγματοληψία από έναν κανονικά κατανεμημένο πληθυσμό. ο λόγος για αυτό είναι ότι το κεντρικό οριακό όριο εξασφαλίζει μια κατανομή δειγματοληψίας που είναι περίπου κανονικό - όσο μεγαλύτερος είναι το μέγεθος του δείγματός μας, τόσο πιο κοντά είναι ότι υπάρχει η κατανομή δειγματοληψίας του δείγματος κανονικός.

Πώς οι διαδικασίες T λειτουργούν ως ισχυρές στατιστικές

Έτσι ευρωστία για t- οι διαδικασίες εξαρτώνται από το μέγεθος του δείγματος και τη διανομή του δείγματος μας. Οι εκτιμήσεις για αυτό περιλαμβάνουν:

  • Εάν το μέγεθος του δείγματος είναι μεγάλο, δηλαδή έχουμε 40 ή περισσότερες παρατηρήσεις t-οι διαδικασίες μπορούν να χρησιμοποιηθούν ακόμα και με διανομές που είναι λοξές.
  • Εάν το μέγεθος του δείγματος είναι μεταξύ 15 και 40, τότε μπορούμε να το χρησιμοποιήσουμε t-διαδικασίες για τυχόν διαμορφωμένη κατανομή, εκτός εάν υπάρχουν υπερβολικές τιμές ή υψηλός βαθμός ασυμβατότητας.
  • Εάν το μέγεθος του δείγματος είναι μικρότερο από 15, τότε μπορούμε να το χρησιμοποιήσουμε t- διαδικασίες για δεδομένα που δεν έχουν αποδόσεις, μία μόνο κορυφή και είναι σχεδόν συμμετρικά.

Στις περισσότερες περιπτώσεις, η ευρωστία έχει καθιερωθεί μέσω της τεχνικής εργασίας σε μαθηματικές στατιστικές και, ευτυχώς, δεν χρειάζεται απαραίτητα να κάνουμε αυτούς τους προχωρημένους μαθηματικούς υπολογισμούς για να το κάνουμε σωστά να τα χρησιμοποιούν. πρέπει να κατανοήσουμε μόνο ποιες είναι οι γενικές κατευθυντήριες γραμμές για την ευρωστία της συγκεκριμένης στατιστικής μεθόδου μας.

Οι διαδικασίες T λειτουργούν ως αξιόπιστες στατιστικές, επειδή συνήθως αποδίδουν καλές επιδόσεις ανά μοντέλα, παράγοντας το μέγεθος του δείγματος στη βάση για την εφαρμογή της διαδικασίας.

instagram story viewer