Inom statistiken är ett urval en del av en population. Urvalet är noggrant utvalt. Det ska representera hela populationen på ett rättvist sätt, utan fördomar.

När ett urval behandlas som en datamängd representeras det ofta av stora bokstäver som {\displaystyle X} och {\displaystyle Y} , medan dess beståndsdelar representeras med små bokstäver (t.ex. {\displaystyle x_{3}} ) och urvalsstorleken representeras av bokstaven n .

Anledningen till att prov behövs är att populationer kan vara så stora att det inte är möjligt eller praktiskt att räkna alla individer. Därför börjar lösningen av ett problem inom statistiken vanligtvis med provtagning. Provtagning handlar om att välja vilka uppgifter som ska tas ut för senare analys. Som ett exempel kan man anta att föroreningarna i en sjö ska analyseras för en studie. Beroende på var vattenproverna togs kan studierna ge olika resultat.

Som en allmän regel gäller att stickproven måste vara slumpmässiga. Detta innebär att chansen eller sannolikheten att välja en individ är densamma som chansen att välja vilken annan individ som helst.

I praktiken tas alltid slumpmässiga urval genom ett väldefinierat förfarande. Ett förfarande är en uppsättning regler, en sekvens av steg som är nedskrivna och exakt följda. Trots detta kan en viss bias finnas kvar i urvalet. Tänk på problemet med att utforma ett urval för att förutsäga resultatet av en valundersökning. Alla kända metoder har sina problem, och valresultatet skiljer sig ofta från de förutsägelser som baseras på ett urval. Om du samlar in åsikter genom att använda telefoner eller genom att träffa människor på gatan, kommer du inte att fråga människor som inte svarar på telefonsamtal eller som inte går på gatan. I fall som detta är ett helt neutralt urval därför aldrig möjligt. I sådana fall kommer en statistiker att fundera på hur man ska mäta omfattningen av bias, och det finns sätt att uppskatta detta.

En liknande situation uppstår när forskare mäter en fysisk egenskap, t.ex. vikten av en metallbit eller ljusets hastighet. Om vi väger ett föremål med känslig utrustning får vi mycket olika resultat. Inget mätsystem är någonsin perfekt. Vi får en serie uppskattningar, där varje uppskattning är en mätning. Dessa är stickprov, med en viss grad av fel. Statistiken är utformad för att beskriva fel och utföra analyser av denna typ av uppgifter.

Det finns olika typer av prover:

  • Ett fullständigt prov omfattar alla element som har en viss egenskap.
  • Ett opartiskt eller representativt urval framställs genom att man tar ett fullständigt urval och väljer ut element ur det, i en process som inte är beroende av elementens egenskaper.

Det sätt på vilket urvalet tas fram, tillsammans med urvalets storlek, kommer att ha betydelse för hur uppgifterna betraktas.