Στη στατιστική ένα δείγμα είναι μέρος ενός πληθυσμού. Το δείγμα επιλέγεται προσεκτικά. Πρέπει να αντιπροσωπεύει δίκαια το σύνολο του πληθυσμού, χωρίς προκατάληψη. Ο λόγος για τον οποίο χρειάζονται δείγματα είναι ότι οι πληθυσμοί μπορεί να είναι τόσο μεγάλοι που η καταμέτρηση όλων των ατόμων μπορεί να μην είναι δυνατή ή πρακτική.
Επομένως, η επίλυση ενός προβλήματος στη στατιστική ξεκινά συνήθως με τη δειγματοληψία. Η δειγματοληψία αφορά την επιλογή των δεδομένων που θα ληφθούν για μεταγενέστερη ανάλυση. Ως παράδειγμα, ας υποθέσουμε ότι πρέπει να αναλυθεί η ρύπανση μιας λίμνης για μια μελέτη. Ανάλογα με το πού ελήφθησαν τα δείγματα νερού, οι μελέτες μπορεί να έχουν διαφορετικά αποτελέσματα. Κατά γενικό κανόνα, τα δείγματα πρέπει να είναι τυχαία. Αυτό σημαίνει ότι η πιθανότητα ή η πιθανότητα επιλογής ενός ατόμου είναι η ίδια με την πιθανότητα επιλογής οποιουδήποτε άλλου ατόμου.
Στην πράξη, τα τυχαία δείγματα λαμβάνονται πάντοτε μέσω μιας σαφώς καθορισμένης διαδικασίας. Μια διαδικασία είναι ένα σύνολο κανόνων, μια ακολουθία βημάτων που καταγράφονται σε χαρτί και ακολουθούνται κατά γράμμα. Ακόμη και έτσι, μπορεί να παραμείνει κάποια μεροληψία στο δείγμα. Σκεφτείτε το πρόβλημα του σχεδιασμού ενός δείγματος για την πρόβλεψη του αποτελέσματος μιας εκλογικής δημοσκόπησης. Όλες οι γνωστές μέθοδοι έχουν τα προβλήματά τους, και τα αποτελέσματα μιας εκλογικής διαδικασίας είναι συχνά διαφορετικά από τις προβλέψεις που βασίζονται σε ένα δείγμα. Εάν συλλέγετε απόψεις χρησιμοποιώντας τηλέφωνα ή συναντώντας ανθρώπους στο δρόμο, το δείγμα έχει πάντα προκατάληψη. Επομένως, σε περιπτώσεις όπως αυτή ένα εντελώς ουδέτερο δείγμα δεν είναι ποτέ δυνατό. Σε τέτοιες περιπτώσεις ένας στατιστικολόγος θα σκεφτεί πώς να μετρήσει το μέγεθος της μεροληψίας, και υπάρχουν τρόποι για να το εκτιμήσει.
Μια παρόμοια κατάσταση συμβαίνει όταν οι επιστήμονες μετρούν μια φυσική ιδιότητα, π.χ. το βάρος ενός κομματιού μετάλλου ή την ταχύτητα του φωτός. Αν ζυγίσουμε ένα αντικείμενο με ευαίσθητο εξοπλισμό θα έχουμε ελάχιστα διαφορετικά αποτελέσματα. Κανένα σύστημα μέτρησης δεν είναι ποτέ τέλειο. Παίρνουμε μια σειρά από εκτιμήσεις, κάθε μία από τις οποίες αποτελεί μια μέτρηση. Πρόκειται για δείγματα, με ορισμένο βαθμό σφάλματος. Η στατιστική έχει σχεδιαστεί για να περιγράφει το σφάλμα και να πραγματοποιεί αναλύσεις σε αυτού του είδους τα δεδομένα.
Υπάρχουν διάφορα είδη δειγμάτων:

