Η γραμμική παλινδρόμηση είναι ένα στατιστικό εργαλείο που καθορίζει πόσο καλά μια ευθεία γραμμή ταιριάζει σε ένα σύνολο ζευγαρωμένα δεδομένα. Η ευθεία που ταιριάζει καλύτερα σε αυτά τα δεδομένα ονομάζεται γραμμή παλινδρόμησης ελάχιστων τετραγώνων. Αυτή η γραμμή μπορεί να χρησιμοποιηθεί με διάφορους τρόπους. Μία από αυτές τις χρήσεις είναι η εκτίμηση της τιμής μιας μεταβλητής απόκρισης για μια δεδομένη τιμή μιας επεξηγηματικής μεταβλητής. Σχετική με αυτή την ιδέα είναι αυτή ενός υπολείμματος.
(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)
Για να υπολογίσετε το υπόλοιπο στα σημεία Χ = 5, αφαιρούμε την προβλεπόμενη τιμή από την παρατηρούμενη τιμή μας. Δεδομένου ότι το y η συντεταγμένη του σημείου δεδομένων μας ήταν 9, αυτό δίνει ένα υπόλοιπο 9 - 10 = -1.
Υπάρχουν διάφορες χρήσεις για υπολείμματα. Μία χρήση είναι να μας βοηθήσουμε να προσδιορίσουμε αν έχουμε ένα σύνολο δεδομένων που έχει μια συνολική γραμμική τάση ή εάν πρέπει να εξετάσουμε ένα διαφορετικό μοντέλο. Ο λόγος για αυτό είναι ότι τα υπολείμματα συμβάλλουν στην ενίσχυση οποιουδήποτε μη γραμμικού σχεδίου στα δεδομένα μας. Αυτό που μπορεί να είναι δύσκολο να δούμε κοιτάζοντας ένα scatterplot μπορεί να παρατηρηθεί ευκολότερα εξετάζοντας τα υπολείμματα και ένα αντίστοιχο υπολειπόμενο οικόπεδο.
Ένας άλλος λόγος για να ληφθούν υπόψη τα υπολείμματα είναι να ελεγχθεί ότι πληρούνται οι συνθήκες για την εξαγωγή της γραμμικής παλινδρόμησης. Μετά την επαλήθευση μιας γραμμικής τάσης (ελέγχοντας τα υπολείμματα), ελέγξουμε επίσης τη διανομή των υπολειμμάτων. Προκειμένου να μπορέσουμε να εκτελέσουμε συμπεράσματα παλινδρόμησης, θέλουμε τα κατάλοιπα της γραμμής παλινδρόμησης να κατανέμονται περίπου κανονικά. ΕΝΑ ιστόγραμμα ή stemplot των υπολειμμάτων θα βοηθήσει στην επαλήθευση της τήρησης αυτής της προϋπόθεσης.