Gumbel-fördelning

Gumbelfördelningen är en sannolikhetsfördelning av extrema värden.

Inom sannolikhetsteori och statistik används Gumbelfördelningen för att modellera fördelningen av maximum (eller minimum) för ett antal prov av olika fördelningar.

En sådan fördelning skulle kunna användas för att representera fördelningen av den högsta nivån i en flod under ett visst år om det finns en förteckning över de högsta nivåerna under de senaste tio åren. Den är också användbar för att förutsäga chansen att en extrem jordbävning, översvämning eller annan naturkatastrof kommer att inträffa.

  Gumbels sannolikhetsfördelningsfunktion (PDF)  Zoom
Gumbels sannolikhetsfördelningsfunktion (PDF)  

Gumbel kumulativ fördelningsfunktion (CDF)  Zoom
Gumbel kumulativ fördelningsfunktion (CDF)  

Egenskaper

Gumbelfördelningen är en kontinuerlig sannolikhetsfördelning. Gumbelfördelningar är en familj av fördelningar av samma allmänna form. Dessa fördelningar skiljer sig åt genom sina parametrar för läge och skala: fördelningens medelvärde ("genomsnitt") definierar dess läge, och standardavvikelsen ("variabilitet") definierar skalan.

Man känner igen Gumbels sannolikhetsdensitetsfunktion (PDF) och Gumbels kumulativa distributionsfunktion (CDF).

PDF

I PDF-analysen beräknas sannolikheten P för att ett värde V ska inträffa mellan gränserna A och B, kortfattat uttryckt som P(A<V<B), genom arean under PDF-kurvan mellan A och B.

Exempel på sannolikhet i PDF-filen

I figuren över den normala sannolikhetsdensitetsfunktionen ska värdena på den horisontella axeln vara: μ-3σ, μ-2σ, μ-1σ, μ+1σ, μ+2σ respektive μ+3σ.

μ = medelvärde, σ = standardavvikelse.
Områdena under kurvan i intervallerna, vart och ett med en bredd av en standardavvikelse, ger sannolikheten för förekomst i dessa intervall.
 Exempel: Sannolikheten för att ett värde V ska inträffa i intervallet mellan A=μ+1σ och B=μ+2σ är P(μ+1σ<V<μ+2σ)=13,6 % eller 0,136.

I motsats till normalfördelningen är Gumbels PDF-dokument a-symmetriskt och snett åt höger.

CDF

I CDF-analysen är sannolikheten för att ett värde V är mindre än A direkt lika med CDF-värdet vid A:

P ( V ≤ A ) = C D F ( A ) {\displaystyle P(V\leq A)=CDF(A)}{\displaystyle P(V\leq A)=CDF(A)} .

Exempel på sannolikhet i CDF

I Gumbels CDF-figur visar den röda kurvan att sannolikheten för att V är mindre än 5 är 0,9 (eller 90 %), medan sannolikheten för den mörkblå linjen är 0,7 eller 70 %.

 Den normala sannolikhetstäthetsfunktionen (PDF) är symmetrisk.  Zoom
Den normala sannolikhetstäthetsfunktionen (PDF) är symmetrisk.  

Matematik

CDF

Det matematiska uttrycket för CDF är:

C D F ( A ) = e - e - ( A - μ ) / β , {\displaystyle CDF(A)=e^{-e^{-(A-\mu )/\beta }},} {\displaystyle CDF(A)=e^{-e^{-(A-\mu )/\beta }},}

där μ är modus (det värde där sannolikhetstäthetsfunktionen når sin topp), e är en matematisk konstant, cirka 2,718, och β är ett värde relaterat till standardavvikelsen (σ) :

β = σ 6 / π , {\displaystyle \beta =\sigma {\sqrt {6}}}/\pi ,} {\displaystyle \beta =\sigma {\sqrt {6}}/\pi ,}

där π är den grekiska symbolen för Pi vars värde ligger nära 22/7 eller 3,142, och symbolen {\displaystyle {\sqrt {\,\,}}}{\displaystyle {\sqrt {\,\,}}} står för kvadratroten.

Mode och median

Modus μ kan hittas från medianen M, som är värdet av A där CDF(A)=0,5 och β:

μ = M + β ln ( ln 2 ) , {\displaystyle \mu = M+\beta \ln \ vänster(\ln 2\ höger),} {\displaystyle \mu =M+\beta \ln \left(\ln 2\right),}

där ln är den naturliga logaritmen.

Medelvärde

Medelvärdet, E(x), ges av:

E ( x ) = μ + c β , {\displaystyle \operatorname {E} (x)=\mu +c\beta ,} {\displaystyle \operatorname {E} (x)=\mu +c\beta ,}

där c {\displaystyle c}{\displaystyle c} = Eulerkonstant{\displaystyle \approx } {\displaystyle \approx }0.5772.

 Det finns två dataserier: röd och blå. Båda har samma medelvärde (genomsnitt): 100, men den blå gruppen har en större standardavvikelse (SD=σ=50) än den röda gruppen (SD=σ=10).  Zoom
Det finns två dataserier: röd och blå. Båda har samma medelvärde (genomsnitt): 100, men den blå gruppen har en större standardavvikelse (SD=σ=50) än den röda gruppen (SD=σ=10).  

Uppskattning

I en dataserie kan parametrarna mode (μ) och β uppskattas från genomsnittet, medianen och standardavvikelsen. Beräkningen av de tre sistnämnda storheterna förklaras på respektive Wikisidor. Därefter kan faktorerna μ och β beräknas med hjälp av de formler som anges i föregående avsnitt. På detta sätt kan CDF för den Gumbelfördelning som hör till uppgifterna bestämmas och sannolikheten för intressanta datavärden kan hittas.

 Anpassad kumulativ Gumbel-fördelning för de största regnmängderna under en dag i oktober med hjälp av CumFreq.  Zoom
Anpassad kumulativ Gumbel-fördelning för de största regnmängderna under en dag i oktober med hjälp av CumFreq.  

Ansökan

Inom hydrologin används Gumbelfördelningen för att analysera variabler som månads- och årsmaximumvärden för daglig nederbörd och flodavrinningsvolymer, och även för att beskriva torka.

Den blå bilden visar ett exempel på anpassning av Gumbelfördelningen till de rangordnade maximala regnmängderna under en dag i oktober och visar även det 90-procentiga konfidensbältet baserat på binomialfördelningen.

 

Frågor och svar

F: Vad är Gumbel-fördelningen?


S: Gumbelfördelningen är en sannolikhetsfördelning av extremvärden.

F: Vad används Gumbel-fördelningen till?


S: Gumbelfördelningen används för att modellera fördelningen av det maximala (eller det minimala) värdet i ett antal stickprov av olika fördelningar.

F: Hur kan Gumbel-fördelningen användas för att förutsäga naturkatastrofer?


S: Gumbelfördelningen är användbar för att förutsäga risken för att en extrem jordbävning, översvämning eller annan naturkatastrof ska inträffa.

F: Vad är ett exempel på hur Gumbelfördelningen kan användas för att representera en tidigare händelse?


S: Gumbelfördelningen skulle kunna användas för att representera fördelningen av den högsta nivån i en flod under ett visst år om det fanns en lista över högsta värden för de senaste tio åren.

F: Är Gumbelfördelningen bara användbar för att förutsäga naturkatastrofer?


S: Nej, Gumbelfördelningen kan användas för att modellera fördelningen av extrema värden i alla situationer.

F: Kan Gumbel-fördelningen användas för att modellera det lägsta värdet i en uppsättning stickprov?


S: Ja, Gumbel-fördelningen kan användas för att modellera fördelningen av antingen det maximala eller det minimala värdet i en uppsättning stickprov.

F: Är Gumbel-fördelningen en vanligt förekommande fördelning inom sannolikhetsteori och statistik?


S: Ja, Gumbelfördelningen är en vanligt förekommande fördelning inom sannolikhetsteori och statistik, särskilt för modellering av extremvärden.

AlegsaOnline.com - 2020 / 2023 - License CC3