Ο νόμος του Zipf είναι ένας εμπειρικός νόμος, ο οποίος διατυπώνεται με τη χρήση μαθηματικών στατιστικών και πήρε το όνομά του από τον γλωσσολόγο George Kingsley Zipf, ο οποίος τον πρότεινε πρώτος.

Ο νόμος του Zipf ορίζει ότι, δεδομένου ενός μεγάλου δείγματος χρησιμοποιούμενων λέξεων, η συχνότητα κάθε λέξης είναι αντιστρόφως ανάλογη της κατάταξής της στον πίνακα συχνοτήτων. Έτσι, η λέξη με αριθμό n έχει συχνότητα ανάλογη του 1/n.

Έτσι, η πιο συχνή λέξη θα εμφανίζεται περίπου δύο φορές πιο συχνά από τη δεύτερη πιο συχνή λέξη, τρεις φορές πιο συχνά από την τρίτη πιο συχνή λέξη κ.λπ. Για παράδειγμα, σε ένα δείγμα λέξεων της αγγλικής γλώσσας, η πιο συχνά εμφανιζόμενη λέξη, "the", αντιπροσωπεύει σχεδόν το 7% του συνόλου των λέξεων (69.971 από λίγο πάνω από 1 εκατομμύριο). Πιστή στο νόμο του Zipf, η δεύτερη στη σειρά λέξη "of" αντιπροσωπεύει λίγο πάνω από το 3,5% των λέξεων (36.411 εμφανίσεις), ακολουθούμενη από τη λέξη "and" (28.852). Μόνο περίπου 135 λέξεις χρειάζονται για να αντιπροσωπεύσουν το μισό δείγμα λέξεων σε ένα μεγάλο δείγμα.

Η ίδια σχέση εμφανίζεται και σε πολλές άλλες κατατάξεις, που δεν σχετίζονται με τη γλώσσα, όπως οι κατατάξεις του πληθυσμού των πόλεων σε διάφορες χώρες, τα μεγέθη των επιχειρήσεων, οι κατατάξεις του εισοδήματος κ.λπ. Η εμφάνιση της κατανομής στις κατατάξεις των πόλεων με βάση τον πληθυσμό παρατηρήθηκε για πρώτη φορά από τον Felix Auerbach το 1913.

Δεν είναι γνωστό γιατί ο νόμος του Zipf ισχύει για τις περισσότερες γλώσσες.