Ao obtermos uma amostra do experimento/fenômeno aleatório com observações binárias, podemos resumir os resultados usando o número ou a proporção de observações com o resultado de interesse.
Sob certas condições, a v.a. \(X\) que conta o número de vezes que um resultado específico ocorreu, dentre dois possíveis, tem uma distribuição de probabilidade chamada Binomial.
Considere um experimento aleatório com espaço amostral \(\Omega\) e o evento \(A\).
Vamos dizer que ocorreu sucesso se o evento \(A\) aconteceu. Se \(A\) não aconteceu ocorreu fracasso.
Repetimos o experimento \(n\) vezes, de forma independente.
Seja \(X\) o número de sucessos nos \(n\) experimentos.
Sabe-se que a eficiência de uma vacina é de \(80\%\).
Um grupo de 3 indivíduos é sorteado, dentre a população vacinada, e cada um é submetido a testes para averiguar se está imunizado.
Nesse caso, consideramos como sucesso a imunização.
\[ X_i = \begin{cases} 1, & \mbox{indivíduo i está imunizado} \\ 0, & \mbox{caso contrário} \end{cases}\]
Pelo enunciado, sabe-se que \(P(X_{i}=1)=p=0.8\).
Os indivíduos 1, 2 e 3 são independentes.
As v.a.’s \(X_1\), \(X_2\) e \(X_3\) são Bernoulli.
Se o interesse está em estudar \(X=\) número de indivíduos imunizados no grupo, \(X\) poderá assumir valores \(\{0,1,2,3\}\).
Note que \(X=X_{1}+X_{2}+X_{3}\).
evento | P(evento) | X |
---|---|---|
\(X_{1}=0\), \(X_{2}=0\), \(X_{3}=0\) | \((0.2)^{3}\) | 0 |
\(X_{1}=1\), \(X_{2}=0\), \(X_{3}=0\) | \(0.8\times(0.2)^{2}\) | 1 |
\(X_{1}=0\), \(X_{2}=1\), \(X_{3}=0\) | \(0.8\times(0.2)^{2}\) | 1 |
\(X_{1}=0\), \(X_{2}=0\), \(X_{3}=1\) | \(0.8\times(0.2)^{2}\) | 1 |
\(X_{1}=1\), \(X_{2}=1\), \(X_{3}=0\) | \((0.8)^{2}\times0.2\) | 2 |
\(X_{1}=1\), \(X_{2}=0\), \(X_{3}=1\) | \((0.8)^{2}\times0.2\) | 2 |
\(X_{1}=0\), \(X_{2}=1\), \(X_{3}=1\) | \((0.8)^{2}\times0.2\) | 2 |
\(X_{1}=1\), \(X_{2}=1\), \(X_{3}=1\) | \((0.8)^{3}\) | 3 |
Assim, as probabilidades de cada valor possível de \(X\) são:
\(X\) | 0 | 1 | 2 | 3 |
---|---|---|---|---|
\(P(X=x)\) | \((0.2)^{3}\) | \(3\times0.8\times(0.2)^{2}\) | \(3\times(0.8)^{2}\times0.2\) | \((0.8)^{3}\) |
O comportamento de \(X\) é completamente determinado pela função:
\[P(X=x)={3\choose x}(0.8)^{x}(0.2)^{3-x}, \qquad x=0,1,2,3.\]
Modelo Geral: Considere a repetição de \(n\) ensaios \(X_i\) Bernoulli independentes e todos com a mesma probabilidade de sucesso \(p\).
A variável aleatória \(X=X_{1}+...+X_{n}\) representa o total de sucessos e corresponde ao modelo Binomial com parâmetros \(n\) e \(p\), ou seja, \(X\sim Bin(n,p)\).
A probabilidade de se observar \(x\) é dada pela expressão geral: \[P(X=x)={n\choose x}p^{x}(1-p)^{n-x}, \qquad x=0,1,...,n\]
A esperança e variância de uma v.a. Binomial são dadas por: \[\mathbb E(X)=np \qquad \mbox{e} \qquad Var(X)=np(1-p)\]
Distribuição de probabilidade de uma \(Bin(3, p)\), com \(p=0.2, 0.5\) e \(0.8\).
\[X\sim Bin(3,0.8)\]
\[\mathbb E(X)=3\times 0.8 = 2.4 \qquad \mbox{e} \qquad Var(X)=3\times0.8\times0.2 = 0.48\]
Um inspetor de qualidade extrai uma amostra aleatória de 10 tubos armazenados num depósito onde, de acordo com os padrões de produção, se espera um total de \(20\%\) de tubos defeituosos.
Qual é a probabilidade de que não mais do que \(2\) tubos extraídos sejam defeituosos?
Se \(X\) denotar a variável “número de tubos defeituosos em 10 extrações independentes e aleatórias”, qual o seu valor esperado? Qual a variância?
Note que a variável aleatória \(X\) = número de tubos defeituosos em 10 extrações tem distribuição binomial, com parâmetros \(n=10\) e \(p=0.2\).
Então, “não mais do que dois tubos defeituosos” é o evento \(\{X\leq2\}\).
Sabemos que, para \(X \sim Bin(10, 0.2)\) \[P(X=x) = { 10\choose x } (0.2)^x (0.8)^{10-x}, \qquad x=0,1, \ldots, 10\]
e que \[\begin{aligned} P(X\leq2) &= P(X=0) + P(X=1) + P(X=2) \\ &=(0.8)^{10} + 10 (0.2)(0.8)^{9} + 45 (0.2)^2 (0.8)^8 = 0.678 \end{aligned}\]
Se \(X \sim Bin(n,p)\), então \(\mathbb E(X) = np\) e \(Var(X) = np(1-p)\)
Então:
\(\mathbb E(X) = 10 (0.2) = 2\)
\(Var(X) = 10 (0.2)(0.8) = 1.6\)
Quando se encontram quatro ou mais tubos defeituosos, o processo de produção é interrompido para revisão. Qual é a probabilidade que isto aconteça?
\[ \begin{aligned} P(X\geq 4) &= 1 - P(X < 4) \\ &= 1 - P(X \leq 3) \\ &= 1-0.879 = 0.121 \end{aligned} \]
Muitas vezes, em problemas em que seria natural usar a distribuição binomial, temos \(n\) muito grande (\(n\to \infty\)) e \(p\) muito pequeno (\(p\to 0\)).
Nesses casos, o cálculo fica difícil com calculadoras comuns.
Considerando uma v.a. \(X\sim\mbox{Bin}(n,p)\), quando temos grandes valores para \(n\) e \(p\) pequeno (mantendo-se o produto \(np=\lambda\) constante), podemos usar a seguinte aproximação para a probabilidade:
\[P(X=x)={\binom{n}{x}}p^{x}(1-p)^{n-x} \approx \frac{e^{-np}(np)^{x}}{x!}\,,\quad x=0,1,2,\ldots n\]
Geralmente considera-se o critério \(np\leq7\) para usar essa aproximação.
\(X\sim Bin(100,0.065)\), deseja-se obter \(P(X=10)\)
A probabilidade de uma lâmpada se queimar ao ser ligada é \(1/100\). Numa instalação com 100 lâmpadas, qual a probabilidade de 2 lâmpadas se queimarem ao serem ligadas?
\(P(X=2)= {\binom{100}{2}}(0.01)^{2}(0.99)^{100-2}\)=0.1849
Outro caso em que a distribuição de Poisson é utilizada.
A distribuição de Poisson expressa a probabilidade de um determinado número de eventos ocorrer em um intervalo fixo de tempo ou espaço se esses eventos ocorrerem com uma taxa média constante conhecida. Por exemplo:
carros que passam por um cruzamento por minuto, durante uma certa hora do dia;
erros tipográficos por página, em um livro;
defeitos por unidade (\(m^3\), \(m^2\), \(m\), etc…) por peça fabricada;
colônias de bactérias numa dada cultura por \(0.01 mm^2\), numa plaqueta de microscópio;
mortes por ataque de coração por ano, em um certo bairro;
etc…
Uma variável aleatória \(X\) tem distribuição de Poisson com parâmetro \(\lambda>0\), se sua função de probabilidade é dada por: \[P(X=x)=\frac{e^{-\lambda}\lambda^{x}}{x!}, \qquad x=0,1,2,...\]
\(\lambda\) é chamado de taxa de ocorrência
\(\mathbb E(X)=Var(X)=\lambda\)
Notação: \(X\sim P(\lambda)\)
Obs.: \(e\), número de Euler, é base do logaritmo natural (\(e = 2.71828...\)).
A distribuição de Poisson é adequada quando as seguintes condições são atendidas:
\(x\) representa o número de vezes que um evento ocorre em um intervalo de tempo específico, podendo assumir os valores \(0, 1, 2, ...\).
A ocorrência de um evento não influencia a probabilidade de ocorrência de um segundo evento, ou seja, os eventos são independentes.
A taxa média de ocorrência dos eventos é constante e independente de ocorrências passadas.
Dois eventos não podem acontecer exatamente ao mesmo tempo; em qualquer subintervalo suficientemente pequeno, ocorre no máximo um evento.
A probabilidade de um evento ocorrer em uma parte do período total é proporcional ao comprimento desse subintervalo.
Num livro de 800 páginas, há 800 erros de impressão. Qual a probabilidade de que uma página contenha pelo menos 3 erros?
\(X =\) número de erros por página
Taxa de ocorrência: \(\lambda=1\)
\[ \begin{aligned} P(X\geq 3) &= 1-P(X<3)\\ &= 1-[P(X=0)+P(X=1)+P(X=2)]\\ &=1-\left\{ \frac{e^{-1}1^0}{0!} + \frac{e^{-1}1^1}{1!} +\frac{e^{-1}1^2}{2!} \right\}\\ &=0.08 \end{aligned} \]
Uma firma recebe 720 mensagens em sua página do Facebook durante as 8 horas de horário comercial. Qual a probabilidade de que em 6 minutos no horário comercial a firma receba pelo menos 4 mensagens no Facebook?
\[ \begin{aligned} 720\mbox{ mensagens} & \rightarrow 480 \mbox{ min}\\ \lambda &\rightarrow 6 \mbox{ min} \end{aligned} \]
Então, usando “regra de três”, \(\lambda=9\) e
\[ \begin{aligned} P(X\geq 4)&= 1-P(X<4)=1-P(X\leq 3)\\ &= 1-\left[\frac{e^{-9}9^0}{0!}+\frac{e^{-9}9^1}{1!} +\frac{e^{-9}9^2}{2!} +\frac{e^{-9}9^3}{3!} \right]\\ &=0.979 \end{aligned} \]
Numa central de SAC (serviço de atendimento ao consumidor) chegam 300 telefonemas por hora. Qual a probabilidade de que:
num minuto não haja nenhuma chamada?
em 2 minutos haja 2 chamadas?
em \(t\) minutos não haja chamadas?
\(X=\) número de chamadas por minuto.
\[ P(X= 0)=\frac{e^{-5}5^0}{0!}=0.0067 \]
\(X=\) número de chamadas a cada 2 minutos.
\(X=\) número de chamadas a cada \(t\) minutos.
\[P(X=0)=\frac{e^{-5t}(5t)^0}{0!}=e^{-5t}\]
O número citações de uma certa conta do Twitter ocorre segundo uma distribuição de Poisson, com a média de oito citações por minuto.
Determinar qual a probabilidade de que num minuto se tenha:
dez ou mais citações;
menos que nove citações;
entre sete (inclusive) e nove (exclusive) citações.
Sabemos que se \(X \sim \mbox{Poisson}(\lambda)\), então sua função de probabilidade é \[P(X=x) = \frac{e^{-\lambda} \lambda^x }{ x!}, \qquad x=0,1,\ldots\]
Além disso, \(\mathbb{E}(X)=\lambda\).
O enunciado diz média de oito citações por minuto, então a variável aleatória \(X\) = número de citações por minuto tem distribuição \(\mbox{Poisson}(8)\).
\[ \begin{aligned} P(X\geq10) & = 1-P(X<10) = 1-P(X\leq9)\\ &= 1-\displaystyle\sum_{k=0}^9 \frac{e^{-8}8^k}{k!} = 1- e^{-8} - \ldots - \displaystyle\frac{e^{-8}8^9}{9!} = 0.2833 \end{aligned}\]
\[P(X < 9) = P(X \leq 8) = e^{-8} + \ldots + \displaystyle\frac{e^{-8}8^8}{8!} = 0.5926\]
\[ \begin{aligned} P(7\leq X < 9)&=P(7\leq X \leq 8) = P(X=7)+P(X=8)\\ &=\displaystyle\frac{e^{-8}8^7}{7!}+\displaystyle\frac{e^{-8}8^8}{8!} = 0.2792 \end{aligned} \]
Consideremos novamente um experimento aleatório com espaço de resultados \(\Omega\) e o evento \(A\).
Vamos dizer que ocorreu sucesso se o evento \(A\) aconteceu e \(p=P(\mbox{sucesso})\).
Repetimos o experimento até o primeiro sucesso.
Seja \(X\) o número de repetições até o primeiro sucesso.
Exemplo: lançar uma moeda repetidas vezes até a primeira cara e \(p=P(cara)\).
Os valores possíveis de \(X\) são \(\{1,2,3,...\}\).
\[ \begin{aligned} P(X=1) &=p && (\mbox{sucesso logo na primeira tentativa})\\ P(X=2) &= (1-p)p && (\mbox{1 fracasso seguido de 1 sucesso})\\ P(X=k) &= (1-p)^{k-1} p && (\mbox{$k-1$ fracassos sucessivos e 1 sucesso}) \end{aligned}\]
Modelo Geral: Suponha uma sequência de ensaios de Bernoulli independentes com probabilidade de sucesso \(p\).
Seja \(X\) a v.a. que representa o número de ensaios de Bernoulli até a ocorrência do primeiro sucesso. Então dizemos que \(X\) segue uma distribuição Geométrica com parâmetro \(p\), ou seja, \(X\sim G(p)\).
A probabilidade de se observar \(x\) é dada por: \[P(X=x)=(1-p)^{x-1}p, \qquad x=1,2,\ldots\]
A esperança e variância de uma v.a. Geométrica são dadas por: \[\mathbb E(X)= \frac{1}{p} \qquad \mbox{e} \qquad Var(X)=\frac{1-p}{p^2}\]
Distribuição de probabilidade de uma \(G(p)\), com \(p=0.3, 0.5\) e \(0.7\).
A função de distribuição acumulada de uma v.a. \(G(p)\) é dada por: \[F(x)=P(X\leq x)=1-(1-p)^x\]
A distribuição geométrica tem uma propriedade que serve para caracterizá-la no conjunto das distribuições discretas: a propriedade de perda de memória!
Propriedade de Perda de Memória
\[P(X > x+m \mid X > m)=P(X > x)\]
Interpretação: O fato de já termos observado \(m\) fracassos sucessivos não muda a probabilidade do número de ensaios até o primeiro sucesso ocorrer.
\[P(X > x+m \mid X > m)=P(X > x)\]
Demonstração:
Lembre-se que: \[F(x)=P(X\leq x)=1-(1-p)^x \quad \Longrightarrow \quad P(X > x)= (1-p)^{x}\]
Então, \[ \begin{aligned} P(X > x+m \mid X > m) &= \frac{P(X > x+m, X> m)}{P(X> m)} \\ & = \frac{P(X > x+m)}{P(X> m)} = \frac{(1-p)^{x+m}}{(1-p)^m} \\ &=(1-p)^{x} = P(X> x) \\ \end{aligned} \]
A probabilidade de se encontrar aberto o sinal de trânsito numa esquina é \(0.2\).
Qual a probabilidade de que seja necessário passar pelo local \(5\) vezes para encontrar o sinal aberto pela primeira vez?
\(X=\) número de vezes necessárias para encontrar o sinal aberto.
\(p=P(\mbox{sinal aberto}) = 0.2\)
\[\begin{aligned} P(X=5) &= (1-p)^{4} p \\ &= 0.8^4\times 0.2 \\ &= 0.0819 \end{aligned} \]
Um banco de sangue necessita sangue do tipo O negativo. Suponha que a probabilidade de uma pessoa ter este tipo de sangue seja \(0.10\). Doadores permanentes chegam ao hemocentro para fazer sua doação rotineira. Calcule a probabilidade de que o primeiro doador com sangue do tipo O negativo seja:
Fonte: Prof. Mario Gneri, Notas de Aula.
Seja \(X\) o número de doadores que chegam no hemocentro até a chegada do primeiro doador com sangue O negativo.
Novamente temos um experimento com distribuição geométrica. Usando a fórmula para a função de probabilidade, send \(X \sim G(0.1)\):
\[P(X=x) = 0.9^{x-1} 0.1, \qquad x=1,2,\ldots \]
Temos que
Detalhes:
Objetivo: calcular a probabilidade de que este grupo de \(n\) elementos contenha \(x\) elementos com a característica A.
Seja \(X\) a v.a. que representa o número de elementos com a característica A dentre os \(n\) selecionados.
Então dizemos que \(X\) segue uma distribuição Hipergeométrica com parâmetros \(N,n,r\), ou seja, \(X \sim Hip(N,n,r)\).
A probabilidade de se observar \(x\) é dada por: \[P(X=x)=\frac{\binom{r}{x}\binom{N-r}{n-x}}{\binom{N}{n}}, \qquad 0\leq x \leq min\{r,n\}\]
A esperança e variância são, respectivamente:
\[\mathbb E(X)=\frac{nr}{N} \qquad \mbox{e} \qquad Var(X)=\frac{nr}{N}\left(1-\frac{r}{N}\right)\frac{(N-n)}{(N-1)}\]
Uma urna contém 10 bolas: 6 brancas e 4 pretas.
Qual a probabilidade de obter 3 bolas brancas dentre 4 bolas retiradas?
Seja \(X\) o número de bolas brancas dentre as 4 bolas retiradas
Então, \(X\sim Hip(N=10, n=4, r=6)\) e
\[P(X=x)=\frac{\binom{r}{x}\binom{N-r}{n-x}}{\binom{N}{n}}, \qquad 0\leq x \leq min\{r,n\}\]
Portanto,
\[P(X=3)=\frac{\binom{6}{3}\binom{4}{1}}{\binom{10}{4}}=\frac{8}{21}\]
Qual a probabilidade de um jogador ganhar na Mega-Sena jogando 6 dezenas?
Então, a probabilidade de ganhar na Mega-Sena é:
\[P(X=6)=\frac{\binom{6}{6}\binom{54}{0}}{\binom{60}{6}}=\frac{1}{50063860}\]
Suponha um lote com \(N=100\) elementos a ser analisado.
São escolhidas \(n=5\) peças sem reposição.
Sabendo que neste lote de 100 elementos, \(r=10\) são defeituosos.
Se \(X\) é o número de peças defeituosas em 5 escolhidas, então \[X\sim Hip(N=100, n=5, r=10)\]
A probabilidade de nenhuma peça defeituosa na amostra retirada é:
\[P(X=0)= \frac{\binom{10}{0}\binom{100-10}{5-0}}{\binom{100}{5}}= \frac{\binom{90}{5}}{\binom{100}{5}}\approx0.584\]
A probabilidade de pelo menos uma peça defeituosa é:
\[P(X \geq 1) = \sum_{i=1}^{5}P(X=i)= 1-P(X=0)\approx0.416\]
A média e a variância são:
\[ \begin{aligned} \mathbb E(X) &= \frac{nr}{N}= \frac{5\times10}{100} = 0.5 \\ Var(X) &=\frac{nr}{N}\left(1-\frac{r}{N}\right)\frac{(N-n)}{(N-1)} \\ &=\frac{5\times10}{100}\left(1-\frac{10}{100}\right)\frac{(100-5)}{(100-1)}\approx0.409 \end{aligned} \]