Vybrané rozdelenia pravdepodobnosti

Ciele
  1. Oboznámiť sa s binomickým rozdelením pravdepodobnosti
  2. Naštudovať základné poznatky o hypergeometrickom rozdelení pravdepodobnosti
  3. Zvládnuť Poissonovo rozdelenie pravdepodobnosti
  4. Oboznámiť sa s exponenciálnym rozdelením pravdepodobnosti
  5. Naštudovať vlastnosti normálneho (Gaussovho) rozdelenia pravdepodobnosti
Úvod
    Oboznámime sa s niektorými konkrétnymi rozdeleniami pravdepodobnosti náhodnej premennej, ktoré sa v praxi často objavujú.
    Prvé tri náhodné premenné sú diskrétne, pričom ich zadefinujeme pomocou pravdepodobnostnej tabuľky a uvedieme ich základné vlastnosti so zameraním na ich číselné charakteristiky. Oboznámime sa so základnými poznatkami o binomickom, hypergeometrickom a Poissonovom rozdelení pravdepodobnosti.
    U spojitých náhodných premenných (exponenciálne a Gaussovo rozdelenie) budeme postupovať tak isto, až na to, že ich budeme definovať pomocou ich hustoty pravdepodobnosti.
    Tým sme samozrejme nevyčerpali všetky rozdelenia pravdepodobnosti, ktoré sú pre prax dôležité.
    Po týchto úvodných častiach nasledujú riešené a neriešené úlohy. \(\def\a{&}\) \(\def\md#1{\,\mathrm{d}u}\)
Postup
  1. Binomické rozdelenie pravdepodobnosti

    Náhodná premenná \(X\) má binomické rozdelenie pravdopodobnosti s parametrami \(n\) a \(p\) práve vtedy, keď
    -- jej obor hodnôt je \({\cal H}(X)=\{0,1,2,\dots ,n \}\);
    -- pre pravdepodobnosti platí \begin{equation}\label{br} P(X=x)={n \choose x}p^x(1-p)^{n-x}\qquad \mbox{pre každé }x\in\{0,1,2,\dots ,n\}. \end{equation} Používame pritom označenie \(X\sim bino(n;p).\) Táto náhodná premenná reprezentuje počet výskytov konkrétneho javu v sérii \(n\) nezávislých pokusov.
    Ak \(X\sim bino(n;p)\), tak \begin{equation}\label{brrp} E(X)=n\cdot p, \qquad D(X)=n\cdot p\cdot q \quad \mbox{ a }\quad \sigma (X)=\sqrt{n\cdot p\cdot q}. \end{equation} Naviac: \begin{equation}\label{mobr} {\cal M}o(X)=k_0\in \langle np-q,\,np+p\rangle . \end{equation}
    Príklad: V zásielke je \(33\) výrobkov. Pravdepodobnosť toho, že sa výrobok počas prepravy poškodí, je pre každý výrobok \(0{,}1\), pričom možné poškodenie ľubovoľného výrobku nezávisí od stavu ostatných výrobkov. Určme pravdepodobnosť toho, že z týchto výrobkov sa pri preprave poškodí
    a) viac výrobkov ako by sme mohli v priemere očakávať;
    b) menej výrobkov ako by sme mohli s najväčšou pravdepodobnosťou očakávať.
    Zobraziť riešenie
  2. Hypergeometrické rozdelenie pravdepodobnosti

    Diskrétna náhodná premenná \(X\) má hypergeometrické rozdelenie pravdepodobnosti s parametrami \(N,\) \(K\) a \(n\) práve vtedy, keď
    jej obor hodnôt je \({\cal H}(X)=\{\max\{0,\,n\!-\!N\!+\!K\},\dots ,\min \{K,n\}\}\subset N_0\) a \begin{equation}\label{hyr} P(X=x)=\frac{\displaystyle{\binom{K}{x}\binom{N-K}{n-x}}}{\displaystyle{\binom{N}{n}}}, \qquad x\in {\cal H}(X). \end{equation} Používame pritom označenie \(X\sim hyge(N,K,n).\)
    Túto náhodnú premenú je vhodné interpretovať týmto pokusom: je daný súbor \(N\) objektov, z ktorých \(K\) objektov má istú vlastnosť a zvyšných \(N\!-\!K\) objektov túto vlasnosť nemá. Náhodne zo súboru vyberáme bez vrátenia \(n\) objektov, pričom na poradí nezáleží (t. j. rozhodujúce je, koľko objektov medzi vybranými má, resp. nemá danú vlastnosť). Vzťah (\ref{hyr}) určuje pravdepodobnosť toho, že medzi tými vybranými objektami bude práve \(x\) objektov mať danú vladnosť.
    Ak \(X\sim hyge(N,K,n)\), tak \begin{equation}\label{hyc} E(X)=n\cdot \frac{K}{N}, \qquad D(X)=\frac{N-n}{N-1}\cdot\Bigg( 1-\frac{K}{N}\Bigg)\cdot \frac{n\cdot K}{N}. \end{equation}
    Príklad: V urne sú \(4\) biele guľky a \(6\) čiernych guliek. Náhodne z nej vyberieme
    I. s návratom;
    II. bez návratu.
    päť guliek. Určme
    a) zákon rozdelenia pravdepodobnosti náhodnej premennej, ktorá nadobúda hodnoty počtu vytiahnutých bielych guliek;
    b) priemerný počet vytiahnutých bielych guliek;
    c) disperziu počtu vytiahnutých bielych guliek;
    d) pravdepodobnosť toho, že vytiahneme viac bielych guliek ako čiernych;
    e) najpravdepodobnejší počet vytiahnutých bielych guliek.
    Zobraziť riešenie
  3. Poissonovo rozdelenie pravdepodobnosti

    Náhodná premenná \(X\) má Poissonovo rozdelenie pravdepodobnosti s parametrom \(\lambda\) práve vtedy, keď
    1. jej obor hodnôt je \({\cal H}(X)=\{0,1,2,\dots \}=N\cup \{0\};\) \begin{equation}\label{poi} \mbox{2.}\qquad \qquad P(X=x)=\frac{\displaystyle{\lambda ^x \cdot \mathrm{e}^{-\lambda }}}{x!}\qquad \mbox{pre každé }x\in N\cup \{0\}. \end{equation} Používame pritom označenie \(X\sim poiss(\lambda).\) \quad Ak \(X\sim poiss(\lambda )\), tak \begin{equation}\label{poiu} E(X)=\lambda , \qquad D(X)=\lambda \quad \mbox{ a }\quad \sigma (X)=\sqrt{\lambda}. \end{equation}
    Príklad: Internetovú stránku navštívi za sledované obdobie v priebehu jednej hodiny v priemere \(30\) záujemcov (predpokladáme, že ich návštevy sú nezávislé a ich počet sa riadi Poissonovým rozdelením pravdepodobnosti). Určme:
    I. pravdepodobnosť toho, že v priebehu štyroch minút navštívi túto stránku: a) jeden návštevník; b) aspoň jeden návštevník; c) nie menej než traja a menej ako jedenásti návštevníci;
    II. a) pravdepodobnosť najpravdepodobnejšieho počtu návštev stránky počas štyroch minút; b) minimálny počet návštev stránky počas dvadsiatich minút, ktorý nebude väčší s pravdepodobnosťou aspoň \(0{,}99.\)
    Zobraziť riešenie
  4. Exponenciálne rozdelenie pravdepodobnosti

    Náhodná premenná \(X\) má exponenciálne rozdelenie pravdepodobnosti s parametrom \(\lambda \) (zapisujeme \(X\sim exp(\lambda )\)) práve vtedy, keď jej hustota \(f\) je určená predpisom \begin{equation}\label{ep} f(x)=\left\{\begin{array}{ll} {\displaystyle\frac{1}{\lambda}\,\mathrm{e}^{-\mbox{\(\frac{x}{\lambda}\)}}} \a \mbox{pre } x\geqq 0,\\ \a\\ 0 \a \mbox{pre } x\lt0. \end{array} \right. \end{equation} Týmto rozdelením sa v praxi často riadi doba životnosti zariadení, ktoré sa nekazia nárazovo alebo napr. aj čas medzi dvoma udalosťami, ktoré majú Poissonovo rozdelenie pravdepodobnosti.
    Distribučná funkcia tejto náhodnej premennej je daná týmto predpisom \begin{equation}\label{ed} F(x)=\left\{\begin{array}{ll} 0 \a \mbox{pre } x\lt 0,\\ 1-\mathrm{e}^{-\mbox{\(\frac{x}{\lambda}\)}} \a \mbox{pre } x\geqq 0. \end{array} \right. \end{equation} Ak \(X\sim exp(\lambda )\), tak \begin{equation}\label{ew} E(X)=\lambda , \qquad D(X)=\lambda ^2\quad \mbox{ a }\quad \sigma (X)= \lambda. \end{equation}
    Príklad: Doba životnosti výrobku má exponenciálne rozdelenie pravdepodobnosti so strednou hodnotou \(2000\) dní. Určme:
    a) pravdepodobnosť toho, že výrobok bude funkčný aspoň \(3000\) dní;
    b) pravdepodobnosť toho, že výrobok nebude funkčný dlhšie ako je jeho priemerná doba životnosti;
    c) maximálnu záručnú dobu \(z\), ktorú chce poskytnúť jeho výrobca, ak pripúšťa maximálne \(5\) percent reklamačných výrobkov.
    Zobraziť riešenie
  5. Normálne (Gaussovo) rozdelenie pravdepodobnosti

    Ak \(F\) je distribučná funkcia náhodnej premennej \(X\), ktorá má normálne (Gaussovo) rozdelenie pravdepodobnosti so strednou hodnotou \(\mu\) a smerodajnou odchýlkou \(\sigma\) (t. j. \(X\sim norm(\mu,\sigma )\) ) a ak \(\Phi\) je distribučná funkcia normovanej náhodnej premennej \(Y\), ktorá má normálne rozdelenie pravdepodobnosti (t. j. \(Y\sim norm(0;1)\)), tak pre ľubovoľné reálne číslo \(x\) platí: \begin{equation}\label{ppp} F(x)=\frac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^{\frac{x-\mu}{\sigma }}\!\mathrm{e}^{\frac{-u^2}{2}}\,\md u=\Phi\Big(\frac{x-\mu}{\sigma } \Big). \end{equation} Ak náhodná premenná \(X\) má normálne (Gaussovo) rozdelenie pravdepodobnosti so strednou hodnotou \(\mu\) a smerodajnou odchýlkou \(\sigma\) (t. j. \(X\sim norm(\mu,\sigma )\), tak pre ľubovoľné \(a\lt b\) platí \begin{equation}\label{prr} \begin{array}{l} P(a\lt X\leqq b)= P(a\leqq X \leqq b)= P(a\leqq X\lt b)= P(a\lt X\lt b)=\\[2mm] \qquad\qquad\qquad\; =\Phi\Big(\frac{b-\mu }{\sigma } \Big)-\Phi\Big(\frac{a-\mu }{\sigma } \Big), \end{array} \end{equation} kde \(\Phi\) je distribučná funkcia normovanej normálnej náhodnej premennej \(Y\) (t. j. \(Y\sim norm(0, 1 )\)). Jej funkčnú hodnotu v bode \(x\) môžeme získať z tabuliek \(norm(0, 1 )\) alebo v MATLABe príkazom \(normcdf(x)\).
    Ak \(X\sim norm(\mu,\sigma )\), tak pre ľubovoľné \(\varepsilon \gt 0\) platí \begin{equation}\label{nr1} P(|X-\mu |\lt \varepsilon )=P(\mu-\varepsilon\lt X\lt \mu +\varepsilon ) =P(-\varepsilon\lt X-\mu\lt \varepsilon )= =P\left(-\frac{\varepsilon}{\sigma}\lt\frac{X-\mu}{\sigma}\lt \frac{\varepsilon}{\sigma}\right)= 2\cdot\Phi\Big(\frac{\varepsilon }{\sigma } \Big)-1, \end{equation}
    Príklad: Hmotnosť vyrábaného závažia má normálne rozdelenie pravdepodobnosti so strednou hodnotou \(10\,g\), pričom výrobca uvádza jej smerodajnú odchýlku \(0{,}02\,g\). Určme pravdepodobnosť toho, že náhodne kúpené závažie bude mať skutočnú hmotnosť
    a) aspoň \(10{,}03\,g;\)
    b) menšiu ako \(9{,}99\,g;\)
    c) aspoň \(10\,g\) a nie viac ako \(10{,}05\,g.\)
    Zobraziť riešenie
    Príklad: Meranie ampérmetrom je zaťažené systematickou chybou \(20\,mA\) a náhodné chyby merania majú normálne rozdelenie pravdepodobnosti so smerodajnou odchýlkou \(5\,mA\). Vykonáme na ňom jedno meranie. S akou pravdepodobnosťou sa bude líšiť chyba nameranej hodnoty maximálne o \(12\,mA\) od
    a) strednej hodnoty očakávanej chyby merania;
    b) skutočnej meranej hodnoty?
    c) Aká môže byť s pravdepodobnosťou \(0{,}95\) maximálna odchýlka chyby merania od jej strednej hodnoty?
    Riešenie: Nech \(X\) je náhodná premenná, ktorá nadobúda hodnoty chyby pri jednom meraní daným ampérmetrom. Systematická chyba je vlastne priemerná chyba t. j. \(E(X) =20\). Je daná smerodajná odchýlka \(\sigma(X) =5\) a je známe, že náhodná premenná \(X\) má normálne rozdelenie -- jej parametre sú \(\mu=20\) a \(\sigma=5\) (t. j. \(X\sim norm(20,5)\)).
    a) Našou úlohou je určiť pravdepodobnosť \(P(|X-\mu|\leqq 12)\stackrel{\star}{=}P(|X-20|\lt 12)\) (v rovnosti \(\stackrel{\star}{=}\) si treba uvedomiť, že \(X\) je spojitá náhodná premenná). Z (\ref{nr1}) pre \(\varepsilon =12\) dostaneme \[P(|X-20|\lt 12)=2\cdot\Phi\Big(\frac{12}{5} \Big)-1\approx 2\cdot 0{,}9918-1= 0{,}9836, \] kde hodnotu \(\Phi(2{,}4)\approx 0{,}9918\) sme získali z tabuliek distribučnej funkcie \(\Phi\) náhodnej premennej \(norm(0;1)\) alebo v MATLABe pomocou \(normcdf(2.4)\).
    b) Teraz chceme vypočítať pravdepodobnosť javu, ktorý spočíva v tom, že \(|X|\leqq 12\), t. j. \(-12\leqq X\leqq 12\). Máme \[P(-12\leqq X\leqq 12)=F(12)-F(-12)\stackrel{\star}{\approx} 0{,}0548,\] kde \(F\) je distribučná funkcia náhodnej premennej \(norm(20;5)\) a v odhade \(\stackrel{\star}{\approx}\) sme hodnoty \(F(12)\) a \(F(-12)\) získali v MATLABe takto: \(F(12)=normcdf(12,20,5)\approx 0{,}0548\) a \(F(-12)=normcdf(-12,20,5)\approx 0\).
    Ak by sme nemali k dispozícii MATLAB, tak by sme na základe (\ref{prr}) dostali \[P(-12\leqq X\leqq 12)= \Phi\Big(\frac{12-20 }{5 } \Big)-\Phi\Big(\frac{-12-20 }{5} \Big)=\Phi(-1{,}6)-\Phi(-6{,4})\approx 0{,}0548,\] pričom hodnoty \(\Phi(-1{,}6)\approx 0{,}0548\) a \(\Phi(-6{,}4)\approx 0\) by sme dostali z tabuliek distribučnej funkcie \(\Phi\) náhodnej premennej \(norm(0;1)\).
    c) Nech \(\varepsilon \gt 0\) je hľadaná maximálna odchýlka chyby merania od jej strednej hodnoty. Žiadame, aby \(P(|X-\mu |\lt \varepsilon )=0{,}95.\) Z (\ref{nr1}) dostaneme \[P(|X-\mu |\lt \varepsilon )=P(|X-20 |\lt \varepsilon )=2\cdot\Phi\Big(\frac{\varepsilon }{5} \Big)-1\stackrel{\star}{=}0{,}95.\] Z rovnosti \(\stackrel{\star}{=}\) je \[\Phi\Big(\frac{\varepsilon }{5} \Big)=0{,}975 \quad \mbox{ čo znamená, že }\quad \varepsilon=5\cdot \Phi^{-1}(0{,}975)\approx9{,}8000\,mA,\] kde hodnotu \(\Phi^{-1}(0{,}975)\) dostaneme v MATLABe pomocou \(norminv(0.975)\approx 1{,}9600\) alebo z tabuliek distribučnej funkcie \(\Phi\) náhodnej premennej \(norm(0;1)\).
Doplňujúce úlohy
    Úloha: V priebehu jednej hodiny príde na benzínové čerpadlo priemerne \(90\) zákazníkov. Počet zákazníkov za určitý časový interval sa riadi Poissonovým rozdelením pravdepodobnosti, ktorého parameter \(\lambda \) je priamo úmerný dĺžke časového intervalu. Určte pravdepodobnosť toho, že za \(4\) minúty prídu:
    a) práve dvaja zákazníci;
    b) najviac dvaja zákazníci;
    c) aspoň dvaja zákazníci;
    d) aspoň jeden zákazník.
    e) Aký najmenší počet zákazníkov nebude počas \(4\) minút prekročený s pravdepodobnosťou aspoň \(0{,}99\)?
    Úloha: Náhodná premenná \(X\) sa má Gaussovo rozdelenie pravdepodobnosti so strednou hodnotou \(\mu=0\). Je známe, že \(P(|X|\leqq 5)=0{,}95\). Určte
    a) smerodajnú odchýlku tejto náhodnej premennej;
    b) \(P(X\gt -2)\); c) \(P(|X|\leqq 2{,}5)\).
    Úloha: Určitá súčiastka sa pokazí v záručnej dobe \(1000\) dní s pravdepodobnosťou \(0{,}1\). Je známe, že doba životnosti takejto súčiastky sa riadi exponenciálnym rozdelením pravdepodobnosti. Určte
    a) strednú dobu životnosti tejto súčiastky;
    b) pravdepodobnosť toho, že súčiastka sa nepokazí počas jedného roka (\(365\) dní);
    c) pravdepodobnosť toho, že súčiastka sa nepokazí počas prvých \(200\) dní, ale pokazí sa v priebehu ďalších \(500\) dní.
    Úloha: Pevnosť v ťahu náhodne vybraného výrobku má normálne rozdelenie pravdepodobnosti so strednou hodnotou \(2{,}4\) a disperziou \(0{,}64.\) Určte pravdepodobnosť toho, že pevnosť v ťahu náhodne vybraného výrobku
    a) bude menšia ako \(2{,}7;\)
    b) bude väčšia ako \(2;\)
    c) sa nebude líšiť od strednej hodnoty o viac ako \(1.\)
    Stanovte:
    d) hornú hranicu pevnosti v ťahu náhodne vybraného výrobku, ktorá nebude prekročená s pravdepodobnosťou \(0{,}95;\)
    e) takú hodnotu \(r,\) že pravdepodobnosť toho, že sa pevnosť v ťahu náhodne vybraného výrobku nebude líšiť od strednej hodnoty o viac ako \(r\), je \(0{,}5.\)
Doplňujúce zdroje
  1. Buša, J., Pirč, V., Schrötter, Š.: Numerické metódy, pravdepodobnosť a matematická štatistika. Elfa, Košice, 2006, 166 s., ISBN 80-8073-632-4.
  2. Gavalec, M., Kováčová, N., Ostertagová, E., Skřivánek, J.: Pravdepodobnosť a matematická štatistika v počítačovom prostredí MATLABu. Elfa, Košice, 2002, 150 s., ISBN 80-89066-05-4.
  3. Kalina, M., Bacigál,T., Schiesslová, A.: Základy pravdepodobnosti a matematickej štatistiky, STU Bratislava, 2010, 216 s., ISBN 978-80-227-3273-4
Kvíz
comments powered by Disqus