Students t-fördelning | sannolikhetsfördelning

Studentens t-fördelning är en sannolikhetsfördelning som utvecklades av William Sealy Gosset 1908. Student är den pseudonym han använde när han publicerade den artikel som beskriver fördelningen.

En normalfördelning beskriver en hel population, medan t-fördelningar beskriver stickprov från en hel population. Följaktligen är t-fördelningen annorlunda för varje stickprovsstorlek, och ju större stickprov, desto mer liknar fördelningen en normalfördelning.

T-fördelningen spelar en roll i många allmänt använda statistiska analyser, bland annat studentens t-test för att bedöma den statistiska betydelsen av skillnaden mellan två urvalsmedelvärden, konstruktionen av konfidensintervall för skillnaden mellan två populationsmedelvärden och i linjär regressionsanalys. Studentens t-fördelning förekommer också i Bayesian-analysen av data från en normalfamilj.

Historia

Gosset arbetade på ett bryggeri och var intresserad av problem med små prover, till exempel kornets kemiska egenskaper. I de problem som han analyserade kunde provstorleken vara så liten som tre. På grund av den lilla provstorleken är det inte möjligt att uppskatta standardavvikelsen. I många fall som Gosset stötte på var sannolikhetsfördelningen för proverna inte heller känd.

En version av pseudonymen är att Gossets arbetsgivare föredrog att personalen använde pseudonymer (istället för sina riktiga namn) när de publicerade vetenskapliga artiklar, så han använde namnet "Student" för att dölja sin identitet. En annan version är att bryggeriet inte ville att deras konkurrenter skulle veta att de använde t-testet för att testa råvarans kvalitet.

Egenskaper

Om vi tar ett urval av n observationer från en normalfördelning kan t-fördelningen med ν = n-1 frihetsgrader definieras som fördelningen av var urvalets medelvärde X ¯ {\displaystyle {\overline {X}}} ${\overline {X}}$ i förhållande till det sanna medelvärdet μ {\displaystyle \mu } $\mu$ , dividerad med urvalets standardavvikelse s {\displaystyle s} $s$ över normaliseringstermen n {\displaystyle {\sqrt {n}}} ${\sqrt {n}}$ (dvs. T = X ¯ - μ s / n {\displaystyle T={\tfrac {{\overline {X}}}-\mu }{s/{\sqrt {n}}}}} $T={\tfrac {{\overline {X}}-\mu }{s/{\sqrt {n}}}}$ ). På detta sätt kan t-fördelningen användas för att uppskatta hur sannolikt det är att det sanna medelvärdet ligger inom ett visst intervall.

T-fördelningen är symmetrisk och klockformad, precis som normalfördelningen, men har större svansar, vilket innebär att den är mer benägen att producera värden som ligger långt från medelvärdet. Detta gör den användbar för att förstå det statistiska beteendet hos vissa typer av förhållanden av slumpmässiga kvantiteter, där variationen i nämnaren förstärks och kan ge avvikande värden när kvotens nämnare hamnar nära noll. Studentens t-fördelning är ett specialfall av den generaliserade hyperboliska fördelningen.

Relaterade sidor

F-fördelning

Frågor och svar

F: Vad är studentens t-fördelning?

S: Student's t-fördelning är en sannolikhetsfördelning som utvecklades av William Sealy Gosset 1908. Den beskriver stickprov från en hel population, och ju större stickprovsstorlek desto mer liknar den en normalfördelning.

F: Vem utvecklade studentens t-fördelning?

S: William Sealy Gosset utvecklade Student's t-fördelning 1908. Han använde pseudonymen "Student" när han publicerade artikeln där han beskrev den.

F: Vilka användningsområden finns för Student's t-fördelning?

S: Studentens t-fördelning spelar en roll i många allmänt använda statistiska analyser, bland annat Studentens t-test för att bedöma den statistiska betydelsen av skillnader mellan två urvalsmedelvärden, konstruera konfidensintervall för skillnader mellan två populationsmedelvärden och linjär regressionsanalys. Den förekommer också i Bayesiansk analys av data från en normalfamilj.

F: Hur påverkar urvalsstorleken formen på en t-fördelning?

Svar: Ju större urvalsstorlek, desto mer liknar den en normalfördelning. För varje olika provstorlek finns det en unik t-fördelning som beskriver den.

F: Finns det något samband mellan studentens T-fördelning och normalfördelningen?

S: Ja - medan normalfördelningar beskriver hela populationer beskriver studentens T-fördelning stickprov som tagits från dessa populationer; som sådana har de likheter men skiljer sig åt beroende på deras respektive storlekar. Som nämnts ovan tenderar större urval att se mer ut som normalfördelningar än vad mindre urval gör.

F: Finns det något annat namn för denna typ av fördelning?

S: Nej - denna typ av fördelning är känd som "Student's T Distribution", uppkallad efter dess utvecklare William Sealy Gosset som använde pseudonymen "Student" när han publicerade sin artikel om den.