Το Excel της Microsoft είναι χρήσιμο για την εκτέλεση βασικών υπολογισμών στα στατιστικά στοιχεία. Μερικές φορές είναι χρήσιμο να γνωρίζετε όλες τις λειτουργίες που είναι διαθέσιμες για να δουλέψετε με ένα συγκεκριμένο θέμα. Εδώ θα εξετάσουμε τις λειτουργίες στο Excel που σχετίζονται με τη διανομή του Student. Εκτός από τους άμεσους υπολογισμούς με τη διανομή t, το Excel μπορεί επίσης να υπολογίσει διαστήματα εμπιστοσύνης και να εκτελέσει δοκιμές υποθέσεων.
Λειτουργίες σχετικά με την κατανομή T
Υπάρχουν πολλές λειτουργίες στο Excel που λειτουργούν απευθείας με τη διανομή t. Δεδομένης μιας τιμής κατά μήκος της διανομής t, οι ακόλουθες λειτουργίες επιστρέφουν το ποσοστό της διανομής που βρίσκεται στην καθορισμένη ουρά.
Ένα ποσοστό στην ουρά μπορεί επίσης να ερμηνευθεί ως μια πιθανότητα. Αυτές οι πιθανότητες ουράς μπορούν να χρησιμοποιηθούν για τιμές ρ σε δοκιμές υποθέσεων.
- Η συνάρτηση T.DIST επιστρέφει την αριστερή ουρά της διανομής t του Student. Αυτή η λειτουργία μπορεί επίσης να χρησιμοποιηθεί για την απόκτηση του y-value για οποιοδήποτε σημείο κατά μήκος της καμπύλης πυκνότητας.
- Η λειτουργία T.DIST.RT επιστρέφει τη σωστή ουρά της διανομής του Student.
- Η συνάρτηση T.DIST.2T επιστρέφει και τις δύο ουρές της διανομής t του Student.
Όλες αυτές οι λειτουργίες έχουν παρόμοια επιχειρήματα. Αυτά τα επιχειρήματα είναι, προκειμένου:
- Η αξία Χ, η οποία υποδηλώνει πού βρίσκεται κατά μήκος του Χ άξονα είμαστε κατά μήκος της διανομής
- Ο αριθμός των βαθμοί ελευθερίας.
- Η συνάρτηση T.DIST έχει ένα τρίτο επιχείρημα, το οποίο μας επιτρέπει να επιλέξουμε μεταξύ μιας αθροιστικής κατανομής (εισάγοντας ένα) ή όχι (εισάγοντας ένα 0). Αν εισάγουμε ένα 1, τότε αυτή η συνάρτηση θα επιστρέψει μια τιμή p. Αν εισάγουμε ένα 0 τότε αυτή η λειτουργία θα επιστρέψει το y- τιμή της καμπύλης πυκνότητας για την δεδομένη Χ.
Αντίστροφες λειτουργίες
Όλες οι λειτουργίες T.DIST, T.DIST.RT και T.DIST.2T μοιράζονται μια κοινή ιδιότητα. Βλέπουμε πως όλες αυτές οι λειτουργίες αρχίζουν με μια τιμή κατά μήκος της κατανομής t και στη συνέχεια να επιστρέφουν ένα ποσοστό. Υπάρχουν περιπτώσεις στις οποίες θα θέλαμε να αντιστρέψουμε αυτή τη διαδικασία. Αρχίζουμε με ένα ποσοστό και επιθυμούμε να γνωρίζουμε την τιμή του t που αντιστοιχεί σε αυτό το ποσοστό. Σε αυτή την περίπτωση χρησιμοποιούμε την κατάλληλη αντίστροφη λειτουργία στο Υπερτερώ.
- Η συνάρτηση T.INV επιστρέφει το αριστερό επακόλουθο αντίστροφο της διανομής T του σπουδαστή.
- Η συνάρτηση T.INV.2T επιστρέφει το αντίστροφο των δύο αντικειμένων της διανομής T του Student.
Υπάρχουν δύο επιχειρήματα για κάθε μια από αυτές τις λειτουργίες. Η πρώτη είναι η πιθανότητα ή το ποσοστό της διανομής. Ο δεύτερος είναι ο αριθμός των βαθμών ελευθερίας για τη συγκεκριμένη διανομή που είμαστε περίεργοι.
Παράδειγμα T.INV
Θα δούμε ένα παράδειγμα των λειτουργιών T.INV και T.INV.2T. Ας υποθέσουμε ότι εργαζόμαστε με μια διανομή t με 12 βαθμούς ελευθερίας. Αν θέλουμε να γνωρίζουμε το σημείο κατά μήκος της κατανομής που αντιστοιχεί στο 10% της περιοχής κάτω από την καμπύλη στα αριστερά του σημείου αυτού, τότε εισάγουμε = T.INV (0,1,12) σε ένα κενό κελί. Το Excel επιστρέφει την τιμή -1.356.
Εάν αντίθετα χρησιμοποιούμε τη συνάρτηση T.INV.2T, βλέπουμε ότι η είσοδος = T.INV.2T (0.1,12) θα επιστρέψει την τιμή 1.782. Αυτό σημαίνει ότι το 10% της περιοχής κάτω από το γράφημα της συνάρτησης κατανομής είναι στα αριστερά του -1.782 και στα δεξιά του 1.782.
Γενικά, από τη συμμετρία της κατανομής t, για μια πιθανότητα Π και τους βαθμούς ελευθερίας ρε έχουμε T.INV.2T (Π, ρε) = ABS (T.INV (Π/2,ρε), όπου το ABS είναι η απόλυτη τιμή λειτουργία στο Excel.
Διαστήματα εμπιστοσύνης
Ένα από τα θέματα σχετικά με τις στατιστικές των συμπερασμάτων περιλαμβάνει την εκτίμηση μιας πληθυσμιακής παραμέτρου. Η εκτίμηση αυτή λαμβάνει τη μορφή ενός διαστήματος εμπιστοσύνης. Για παράδειγμα, η εκτίμηση του μέσου όρου του πληθυσμού είναι ένας μέσος δείκτης. Η εκτίμηση έχει επίσης ένα περιθώριο σφάλματος, το οποίο το Excel θα υπολογίσει. Για αυτό το περιθώριο λάθους πρέπει να χρησιμοποιήσουμε τη λειτουργία CONFIDENCE.T.
Η τεκμηρίωση του Excel λέει ότι η συνάρτηση CONFIDENCE.T λέγεται ότι επιστρέφει το διάστημα εμπιστοσύνης χρησιμοποιώντας τη διανομή t του Student. Αυτή η λειτουργία επιστρέφει το περιθώριο σφάλματος. Τα επιχειρήματα για αυτή τη λειτουργία είναι, με τη σειρά που πρέπει να εισαχθούν:
- Alpha - αυτό είναι το επίπεδο σπουδαιότητας. Το άλφα είναι επίσης 1 - C, όπου το C δηλώνει το επίπεδο εμπιστοσύνης. Για παράδειγμα, αν θέλουμε 95% εμπιστοσύνη, τότε πρέπει να εισάγουμε 0,05 για alpha.
- Τυπική απόκλιση - αυτή είναι η τυπική απόκλιση δείγματος από το σύνολο δεδομένων μας.
- Το μέγεθος του δείγματος.
Ο τύπος που χρησιμοποιεί το Excel για αυτόν τον υπολογισμό είναι:
Μ = t*μικρό/ √n
Εδώ M είναι για το περιθώριο, t* είναι η κρίσιμη τιμή που αντιστοιχεί στο επίπεδο εμπιστοσύνης, μικρό είναι η τυπική απόκλιση δείγματος και n είναι το μέγεθος του δείγματος.
Παράδειγμα διαστήματος εμπιστοσύνης
Ας υποθέσουμε ότι έχουμε ένα απλό τυχαίο δείγμα 16 μπισκότων και τους ζυγίζουμε. Βρίσκουμε ότι το μέσο βάρος τους είναι 3 γραμμάρια με τυπική απόκλιση 0,25 γραμμάρια. Ποιο είναι το 90% διάστημα εμπιστοσύνης για το μέσο βάρος όλων των cookies αυτής της μάρκας;
Εδώ απλά πληκτρολογούμε τα παρακάτω σε ένα κενό κελί:
= CONFIDENCE.T (0.1,0.25,16)
Το Excel επιστρέφει 0,109565647. Αυτό είναι το περιθώριο σφάλματος. Αφαιρούμε και προσθέτουμε αυτό στο δείγμα μας και έτσι το διάστημα εμπιστοσύνης μας είναι 2,89 γραμμάρια έως 3,11 γραμμάρια.
Δοκιμές Σημασίας
Το Excel θα εκτελέσει επίσης δοκιμές υποθέσεων που σχετίζονται με τη διανομή t. Η λειτουργία T.TEST επιστρέφει το p-value για αρκετές διαφορετικές δοκιμές σημαντικής. Τα επιχειρήματα για τη λειτουργία T.TEST είναι:
- Ο πίνακας 1, ο οποίος δίνει το πρώτο σύνολο δειγμάτων δεδομένων.
- Ο πίνακας 2, ο οποίος δίνει το δεύτερο σύνολο δειγμάτων δεδομένων
- Ουρά, στην οποία μπορούμε να εισάγουμε είτε 1 είτε 2.
- Ο τύπος 1 υποδηλώνει ένα ζευγαρωμένο t-test, 2 μια δοκιμή δύο δειγμάτων με την ίδια διακύμανση του πληθυσμού και 3 μια δοκιμή δύο δειγμάτων με διαφορετικές μεταβολές του πληθυσμού.