Η ανισότητα του Chebyshev στην πιθανότητα

Η ανισότητα του Chebyshev λέει ότι τουλάχιστον 1-1 /κ2 των δεδομένων από ένα δείγμα πρέπει να εμπίπτει κ τυπικές αποκλίσεις από τον μέσο όρο (εδώ κ είναι θετική πραγματικός αριθμός μεγαλύτερο από ένα).

Οποιοδήποτε σύνολο δεδομένων διανέμεται κανονικά ή έχει σχήμα καμπύλη καμπάνας, έχει πολλά χαρακτηριστικά. Ένας από αυτούς ασχολείται με την εξάπλωση των δεδομένων σε σχέση με τον αριθμό των τυπικών αποκλίσεων από τον μέσο όρο. Σε μια κανονική κατανομή, γνωρίζουμε ότι το 68% των δεδομένων είναι μία τυπική απόκλιση από το μέσο όρο, το 95% είναι δύο τυπικές αποκλίσεις από τον μέσο όρο και περίπου το 99% είναι εντός τριών τυπικών αποκλίσεων από τον μέσο όρο.

Αλλά εάν το σύνολο δεδομένων δεν είναι κατανεμημένο σε σχήμα καμπύλης καμπάνας, τότε μια διαφορετική ποσότητα θα μπορούσε να είναι εντός μιας τυπικής απόκλισης. Η ανισότητα του Chebyshev παρέχει έναν τρόπο να γνωρίζει ποιο τμήμα των δεδομένων εμπίπτει κ τυπικές αποκλίσεις από τον μέσο όρο για όποιος σύνολο δεδομένων.

Πραγματικά στοιχεία για την ανισότητα

instagram viewer

Μπορούμε επίσης να δηλώσουμε την παραπάνω ανισότητα αντικαθιστώντας τη φράση "δεδομένα από ένα δείγμα" με κατανομή πιθανότητας. Αυτό συμβαίνει επειδή η ανισότητα του Chebyshev είναι αποτέλεσμα της πιθανότητας, η οποία στη συνέχεια μπορεί να εφαρμοστεί στις στατιστικές.

Είναι σημαντικό να σημειωθεί ότι αυτή η ανισότητα είναι ένα αποτέλεσμα που έχει αποδειχθεί μαθηματικά. Δεν είναι όπως το εμπειρική σχέση μεταξύ του μέσου και του τρόπου λειτουργίας ή του κανόνας που συνδέει την εμβέλεια και την τυπική απόκλιση.

Εικονογράφηση της ανισότητας

Για να δείξουμε την ανισότητα, θα το εξετάσουμε για λίγες αξίες κ:

  • Για κ = 2 έχουμε 1 - 1 /κ2 = 1 - 1/4 = 3/4 = 75%. Έτσι, η ανισότητα του Chebyshev λέει ότι τουλάχιστον το 75% των τιμών των δεδομένων οποιασδήποτε κατανομής πρέπει να είναι εντός δύο τυπικών αποκλίσεων του μέσου όρου.
  • Για κ = 3 έχουμε 1 - 1 /κ2 = 1 - 1/9 = 8/9 = 89%. Έτσι, η ανισότητα του Chebyshev λέει ότι τουλάχιστον το 89% των τιμών δεδομένων οποιασδήποτε κατανομής πρέπει να είναι μέσα σε τρεις τυπικές αποκλίσεις του μέσου όρου.
  • Για κ = 4 έχουμε 1 - 1 /κ2 = 1 - 1/16 = 15/16 = 93.75%. Έτσι, η ανισότητα του Chebyshev λέει ότι τουλάχιστον το 93,75% των τιμών δεδομένων οποιασδήποτε κατανομής πρέπει να είναι μέσα σε δύο τυπικές αποκλίσεις του μέσου όρου.

Παράδειγμα

Ας υποθέσουμε ότι έχουμε δειγματοληψία των βαρών των σκύλων στο τοπικό καταφύγιο ζώων και βρήκαμε ότι το δείγμα μας έχει μέσο όρο 20 κιλά με τυπική απόκλιση των 3 κιλών. Με τη χρήση της ανισότητας του Chebyshev, γνωρίζουμε ότι τουλάχιστον το 75% των σκύλων που έχουμε δειγματοληψία έχουν βάρη που είναι δύο τυπικές αποκλίσεις από τον μέσο όρο. Δύο φορές η τυπική απόκλιση μας δίνει 2 x 3 = 6. Αφαιρέστε και προσθέστε αυτό από το μέσο όρο των 20. Αυτό μας λέει ότι το 75% των σκύλων έχουν βάρος από 14 κιλά έως 26 λίβρες.

Χρήση της ανισότητας

Εάν γνωρίζουμε περισσότερα για τη διανομή με την οποία εργαζόμαστε, τότε μπορούμε συνήθως να εγγυηθούμε ότι περισσότερα δεδομένα είναι ένας ορισμένος αριθμός τυποποιημένων αποκλίσεων μακριά από τον μέσο όρο. Για παράδειγμα, αν γνωρίζουμε ότι έχουμε μια κανονική κατανομή, τότε το 95% των δεδομένων είναι δύο τυπικές αποκλίσεις από το μέσο όρο. Η ανισότητα του Chebyshev λέει ότι σε αυτή την κατάσταση το γνωρίζουμε τουλάχιστον Το 75% των δεδομένων είναι δύο τυπικές αποκλίσεις από τον μέσο όρο. Όπως μπορούμε να δούμε σε αυτήν την περίπτωση, θα μπορούσε να είναι πολύ περισσότερο από αυτό το 75%.

Η αξία της ανισότητας είναι ότι μας δίνει ένα σενάριο «χειρότερης περίπτωσης» στο οποίο τα μόνα πράγματα που γνωρίζουμε σχετικά με τα δειγματοληπτικά μας δεδομένα (ή την κατανομή πιθανοτήτων) είναι ο μέσος όρος και τυπική απόκλιση. Όταν δεν γνωρίζουμε τίποτα άλλο για τα δεδομένα μας, η ανισότητα του Chebyshev παρέχει κάποια συμπληρωματική εικόνα του τρόπου διάδοσης του συνόλου δεδομένων.

Ιστορία της ανισότητας

Η ανισότητα ονομάζεται από τον Ρώσο μαθηματικό Pafnuty Chebyshev, ο οποίος δήλωσε για πρώτη φορά την ανισότητα χωρίς απόδειξη το 1874. Δέκα χρόνια αργότερα η ανισότητα αποδείχθηκε από τον Μάρκοφ στο Ph.D. διατριβή. Λόγω διαφορών ως προς τον τρόπο εκπροσώπησης του ρωσικού αλφάβητου στα αγγλικά, ο Chebyshev ονομάζεται επίσης Tchebysheff.

instagram story viewer