Zipfs lag är en empirisk lag, formulerad med hjälp av matematisk statistik, uppkallad efter lingvisten George Kingsley Zipf, som först föreslog den.

Zipfs lag säger att om ett stort urval av ord används, är frekvensen av ett ord omvänt proportionell mot dess rang i frekvenstabellen. Ord nummer n har alltså en frekvens som är proportionell mot 1/n.

Det mest frekventa ordet kommer alltså att förekomma ungefär dubbelt så ofta som det näst mest frekventa ordet, tre gånger så ofta som det tredje mest frekventa ordet osv. I ett urval av ord i det engelska språket utgör till exempel det mest frekvent förekommande ordet, "the", nästan 7 % av alla ord (69 971 av drygt 1 miljon ord). I enlighet med Zipfs lag står ordet "of" på andra plats för drygt 3,5 % av alla ord (36 411 förekomster), följt av "and" (28 852). Det behövs endast cirka 135 ord för att stå för hälften av alla ord i ett stort urval.

Samma förhållande finns i många andra rankningar som inte har med språk att göra, t.ex. befolkningsrankningar av städer i olika länder, företagsstorlekar, inkomstrankningar osv. Felix Auerbach uppmärksammade först 1913 att fördelningen förekommer i rangordningar av städer efter befolkningstal.

Man vet inte varför Zipfs lag gäller för de flesta språk.