Η κανονικοποίηση βάσεων δεδομένων είναι μια προσέγγιση για το σχεδιασμό βάσεων δεδομένων που εισήχθη από τον Edgar F. Codd τη δεκαετία του 1970. Ορισμένες βάσεις δεδομένων, γνωστές ως σχεσιακές βάσεις δεδομένων, επιτρέπουν την αποθήκευση δεδομένων σε ξεχωριστές ομάδες. Κάθε ομάδα ονομάζεται συνήθως πίνακας. Για την παροχή χρήσιμων πληροφοριών, οι ομάδες αυτές συνδέονται μεταξύ τους. Για παράδειγμα, οι μαθητές μπορούν να αποθηκεύονται σε μια ομάδα και οι τάξεις σε μια άλλη ομάδα. Για να φανεί ότι ένας μαθητής είναι εγγεγραμμένος σε μια τάξη, δημιουργείται μια "σχέση" από τη μια ομάδα στην άλλη. Ένας μαθητής θα μπορούσε να έχει μια σχέση με πολλές τάξεις, σε καθεμία από τις οποίες θα ήταν εγγεγραμμένος, ενώ μια τάξη θα είχε μια σχέση με πολλούς μαθητές.

Μια παραδοσιακή εναλλακτική λύση είναι η "βάση δεδομένων επίπεδου αρχείου", όπου όλα τα δεδομένα ομαδοποιούνται όπως σε ένα λογιστικό φύλλο. Το πρόβλημα με τις βάσεις δεδομένων επίπεδου αρχείου είναι ότι μπορεί να έχουν πολλά κενά και ότι υπάρχουν πολλές πληροφορίες που πρέπει να επαναλαμβάνονται για κάθε καταχώρηση. Αυτό σημαίνει ότι η βάση δεδομένων είναι μεγαλύτερη από ό,τι πρέπει να είναι και καθιστά πιο πιθανό να περιέχει λάθη. Οι σχεσιακές βάσεις δεδομένων, με το σπάσιμο των δεδομένων σε ομάδες, μειώνουν την πιθανότητα να συμβούν λάθη και δεν καταλαμβάνουν περισσότερο χώρο από όσο χρειάζεται. Αλλά για να λειτουργήσει πρέπει να είναι καλά σχεδιασμένη.

Η κανονικοποίηση βάσεων δεδομένων είναι μια μέθοδος σχεδιασμού καλών σχεσιακών βάσεων δεδομένων. Υπάρχουν διάφορες "κανονικές μορφές", καθεμία από τις οποίες έχει κανόνες τους οποίους η βάση δεδομένων θα πρέπει να σχεδιάζεται ώστε να πληροί. Ο Codd προσδιόρισε αρχικά τρία σύνολα κριτηρίων που πρέπει να πληρούν οι διάφορες βάσεις δεδομένων: την πρώτη, τη δεύτερη και την τρίτη κανονική μορφή.

Εάν μια σχέση (ή ένας "πίνακας βάσης δεδομένων") πληροί μια συγκεκριμένη κανονική μορφή, δεν είναι ευάλωτη σε ορισμένες τροποποιήσεις που θα επηρεάσουν την ακεραιότητα των δεδομένων. Το μειονέκτημα της ικανοποίησης ενός τέτοιου συνόλου κριτηρίων είναι συνήθως ότι η αναζήτηση ορισμένων δεδομένων από τη βάση δεδομένων θα γίνει πιο δύσκολη.