En tilfældig variabel er en numerisk beskrivelse af resultatet af et statistisk eksperiment. En tilfældig variabel, der kun antager et endeligt tal eller et uendelig værdisekvensen siges at være diskret; en, der kan antage en hvilken som helst værdi i et interval på det reelle tal, siges at være kontinuerlig. For eksempel vil en tilfældig variabel, der repræsenterer antallet af biler, der sælges hos en bestemt forhandler på en dag, være diskret, mens en tilfældig variabel, der repræsenterer vægten af en person i kg (eller pund), vil være kontinuerlig.
Sandsynlighedsfordelingen for en tilfældig variabel beskriver, hvordan sandsynlighederne fordeles over værdierne for den tilfældige variabel. For en diskret tilfældig variabel x , er sandsynlighedsfordelingen defineret af en sandsynlighedsmassefunktion, betegnet med f ( x ). Denne funktion giver sandsynligheden for hver værdi af den tilfældige variabel. I udviklingen af sandsynlighedsfunktionen for en diskret tilfældig variabel skal to betingelser være opfyldt: (1) f ( x ) skal være ikke-negativ for hver værdi af den tilfældige variabel, og (2) summen af sandsynlighederne for hver værdi af den tilfældige variabel skal være lig med en.
En kontinuerlig tilfældig variabel kan antage enhver værdi i et interval på den reelle tallinje eller i en samling af intervaller. Da der er et uendeligt antal værdier i et hvilket som helst interval, er det ikke meningsfuldt at tale om sandsynligheden for, at den tilfældige variabel får en bestemt værdi; i stedet overvejes sandsynligheden for, at en kontinuerlig tilfældig variabel ligger inden for et givet interval.
I det kontinuerlige tilfælde er modstykket til sandsynlighedsmassefunktionen sandsynlighedsdensitetsfunktionen, også betegnet med f ( x ). For en kontinuerlig tilfældig variabel giver sandsynlighedsdensitetsfunktionen funktionens højde eller værdi ved en bestemt værdi på x ; det giver ikke direkte sandsynligheden for, at den tilfældige variabel får en bestemt værdi. Området under grafen for f ( x ) svarende til noget interval, opnået ved at beregne integralet af f ( x ) over dette interval, giver sandsynligheden for, at variablen får en værdi inden for dette interval. En sandsynlighedstæthedsfunktion skal opfylde to krav: (1) f ( x ) skal være ikke-negativ for hver værdi af den tilfældige variabel, og (2) integreret over alle værdier af den tilfældige variabel skal være lig med en.
Den forventede værdi eller gennemsnit af en tilfældig variabel - betegnet med ER ( x ) eller μ — er et vægtet gennemsnit af de værdier, den tilfældige variabel kan antage. I det diskrete tilfælde er vægten givet af sandsynlighedsmassefunktionen, og i det kontinuerte tilfælde er vægtene givet af sandsynlighedsdensitetsfunktionen. Formlerne til beregning af de forventede værdier for diskrete og kontinuerlige tilfældige variabler er givet af henholdsvis ligning 2 og 3.
ER ( x ) = Σ x f ( x ) (to)
ER ( x ) = ∫ x f ( x ) d x (3)
Variansen af en tilfældig variabel betegnet med Var ( x ) eller σto, er et vægtet gennemsnit af de kvadratiske afvigelser fra gennemsnittet. I det diskrete tilfælde er vægten givet af sandsynlighedsmassefunktionen, og i det kontinuerte tilfælde er vægtene givet af sandsynlighedsdensitetsfunktionen. Formlerne til beregning af afvigelser af diskrete og kontinuerlige tilfældige variabler er givet af henholdsvis ligning 4 og 5. Det standardafvigelse , betegnet σ, er den positive kvadratrod af variansen. Da standardafvigelsen måles i de samme enheder som den tilfældige variabel, og variansen måles i kvadratiske enheder, er standardafvigelsen ofte det foretrukne mål.
Hvor( x ) = σto= Σ ( x - μ)to f ( x ) (4)
Hvor( x ) = σto= ∫ ( x - μ)to f ( x ) d x (5)
To af de mest anvendte diskrete sandsynlighedsfordelinger er binomialet og Poisson. Binomial sandsynlighedsmassefunktion (ligning 6) giver sandsynligheden for, at x succeser vil forekomme i n forsøg på et binomiale eksperiment.
Et binomiale eksperiment har fire egenskaber: (1) det består af en sekvens af n identiske forsøg (2) to resultater, succes eller fiasko, er mulige på hvert forsøg; (3) sandsynligheden for succes på ethvert forsøg, betegnet s , skifter ikke fra prøve til prøve; og (4) forsøgene er uafhængige. Antag for eksempel, at det er kendt, at 10 procent af ejerne af to år gamle biler har haft problemer med deres bils elektriske system. For at beregne sandsynligheden for at finde nøjagtigt 2 ejere, der har haft problemer med det elektriske system ud af en gruppe på 10 ejere, kan binomial sandsynlighedsmassefunktion bruges ved at indstille n = 10, x = 2 og s = 0,1 i ligning 6; i dette tilfælde er sandsynligheden 0,1937.
Poisson-sandsynlighedsfordelingen bruges ofte som en model for antallet af ankomster til et anlæg inden for en given tidsperiode. For eksempel kan en tilfældig variabel defineres som antallet af telefonopkald, der kommer ind i et flyreservationssystem i en periode på 15 minutter. Hvis det gennemsnitlige antal ankomster i løbet af et 15-minutters interval er kendt, kan Poisson-sandsynlighedsmassefunktionen givet ved ligning 7 bruges til at beregne sandsynligheden for x ankomster.
Antag for eksempel, at det gennemsnitlige antal opkald, der ankommer i en 15-minutters periode, er 10. For at beregne sandsynligheden for, at der kommer 5 opkald inden for de næste 15 minutter, er μ = 10 og x = 5 er substitueret i ligning 7, hvilket giver en sandsynlighed på 0,0378.
Den mest anvendte kontinuerlige sandsynlighedsfordeling i statistikker er den normale sandsynlighedsfordeling. Grafen svarende til en normal sandsynlighedsdensitetsfunktion med et gennemsnit på μ = 50 og en standardafvigelse på σ = 5 er vist iFigur 3. Som alle normale fordelingsgrafer er det en klokkeformet kurve. Sandsynligheder for den normale sandsynlighedsfordeling kan beregnes ved hjælp af statistiske tabeller for den normale normale sandsynlighedsfordeling, som er en normal sandsynlighedsfordeling med et gennemsnit på nul og en standardafvigelse på en. En simpel matematisk formel bruges til at konvertere en hvilken som helst værdi fra en normal sandsynlighedsfordeling med middel μ og en standardafvigelse σ til en tilsvarende værdi for en standard normalfordeling. Tabellerne til den normale normalfordeling bruges derefter til at beregne de relevante sandsynligheder.
er Moskva hovedstaden i Rusland
normal sandsynlighedsfordeling Figur 3: En normal sandsynlighedsfordeling med et gennemsnit ( μ ) på 50 og en standardafvigelse ( σ ) af 5. Encyclopædia Britannica, Inc.
Der er mange andre diskrete og kontinuerlige sandsynlighedsfordelinger. Andre vidt anvendte diskrete fordelinger inkluderer den geometriske, den hypergeometriske og den negative binomiale; andre almindeligt anvendte kontinuerlige fordelinger inkluderer ensartet, eksponentiel, gamma, chi-kvadrat, beta, t og F.
Copyright © Alle Rettigheder Forbeholdes | asayamind.com