1 Experimentos, espaço amostral, eventos

Transcrição

1 Experimentos, espaço amostral, eventos
PPG Estatı́stica e Experimentação Agronômica
LCE 5806 Estatı́stica Matemática I
Profa. Roseli Aparecida Leandro
1
Experimentos, espaço amostral, eventos
Um dos objetivos de um estatı́stico é tirar conclusões sobre uma população de objetos através
da condução de um experimento. Os experimentos podem ser classificados em:
(
Determinı́sticos
Aleatórios
Experimentos determı́nisticos:
São aqueles que repetidos, sob as mesmas condições, conduzem ao mesmo resultado.
Experimentos aleatórios:
São aqueles que ao serem repetidos, sob as mesmas condições, não produzem o mesmo
resultado.
O estatı́stico está preocupado com os experimentos aleatórios.
Exemplo 1.1.
E1 : Lançamento de uma moeda.
E2 : Lançamento de um dado.
E3 : Lançamento de duas moedas.
2
E4 : Plantar duas estacas e verificar o enraizamento
E5 : Lançamento de dois dados.
E6 : Número de ovos de determinada lagarta.
E7 : Selecionar um morador da cidade de Piracicaba e medir sua altura.
E8 : Observar o tempo de vida de indivı́duos.
E9 : Observar a produção de um talhão.
E10 : Observar o tempo de vida de lâmpadas
Definição 1.1. Associado a cada experimento, E, pode-se associar um espaço amostral, Ω,
o conjunto de todos os resultados possı́veis. Que dependendo da natureza do experimento
poderá não ser único.
Exemplo 1.2.
E1 : Lançamento de uma moeda.
Ω = {cara, coroa}
E2 : Lançamento de um dado.
Ω = {1, 2, 3, 4, 5, 6}
E3 : Lançamento de duas moedas.
Ω = {(cara, cara), (cara, coroa), (coroa, cara), (coroa, coroa)}
E4 : Plantar duas estacas e verificar o enraizamento
Ω = {(e, e), (e, ē), (ē, e), (ē, ē)},
e= enraizar ,
ē=não enraizar
3
E5 : Lançamento de dois dados.
{ (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),
(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),
Ω=
(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),
(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),
(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),
(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)
}
E6 : Número de ovos de determinada lagarta.
Ω = {0, 1, 2, 3, 4, . . .}
E7 : Selecionar um morador da cidade de Piracicaba e medir sua altura.
Ω = {x ∈ < : x ≥ 0}
E8 : Observar o tempo de vida de indivı́duos.
Ω = {t ∈ < : t ≥ 0}
E9 : Observar a produção de um talhão.
Ω = {x ∈ < : x ≥ 0}
E10 : Observar o tempo de vida de lâmpadas
Ω = {t ∈ < : t ≥ 0}
Às vezes o espaço amostral de um experimento não é tão fácil de ser definido. Por exemplo
no experimento 7, quais os resultados possı́veis deste experimento? Números reais entre 0 e
?. Supondo que não exista uma altura máxima, talvez seja razoável fazer Ω = (0, ∞). Mas
é evidente que esse conjunto contém resultados impossı́veis, tais como um milhão ou um
bilhão de metros. Outros candidatos para Ω seriam, por exemplo, os intervalos limitados
4
(0, 3) e [1/10, 3]. Os dois intervalos contêm, aparentemente, todos os resultados possı́veis do
experimento. Esta propriedade já é suficiente para nossos propósitos, e podemos escolher
qualquer desses intervalos (incluindo (0, ∞)) para o espaço amostral. O importante, então,
é que Ω contenha todo resultado possı́vel.
A importância do espaço de resultados provém, sobretudo, de ser o meio empregue para
a definição de eventos. Há, em regra, muito mais interesse nos acontecimentos e nas famı́lias
de acontecimentos de que nos elementos do espaço amostral.
Definição 1.2. Qualquer subconjunto do espaço amostral Ω será chamado evento e será
denotado por: A, B, C, . . . .
Existe um paralelismo perfeito entre álgebra de conjuntos e álgebra de eventos (e ou
acontecimentos)
Se A e B são incompatı́veis a intersecção não é possı́vel. Contorna-se essa dificuldade
introduzindo a noção de acontecimento impossı́vel como resultado da intersecção de dois
acontecimentos incompatı́veis; a noção vem em correspondência com a de conjunto vazio
na álgebra de conjuntos e por isso se representa pelo mesmo sı́mbolo, ∅. Assim, A e B,
são incompatı́veis se e só se, A ∩ B = ∅. O acontecimento, Ω, costuma designar-se por
acontecimento certo.
1.1
Eventos elementares
Suponha que um experimento seja realizado sob certas condições fixas. Seja Ω o conjunto de
todos os resultados possı́veis, onde por “resultado possı́vel” entende-se resultado elementar
e indivisı́vel do experimento.
Exemplo 1.3. Considerando-se o experimento E1 temos Ω = {cara, coroa} e os pontos
amostrais ou eventos elementares associados são: {ca} e {co}.
Exemplo 1.4. No experimento E2 , Ω = {1, 2, 3, 4, 5, 6} e os eventos elementares (ou pontos
amostrais) associados são: {1}, {2}, {3}, {4}, {5}, {6}. Note que o evento: sair resultado
par, ou seja, A = {2, 4, 6} não é um evento elementar e sim a união finita dos eventos
elementares: {2}, {4}, {6}.
5
No experimento E6 os eventos elementares são: {0}, {1}, {2}, {3}, {4}, {5}, {6}, . . . .
Nem sempre é fácil definir quais são os eventos elementares.
Quais os eventos elementares associados aos experimentos: E7 , E8 , E9 , E10 ?
Devemos observar a existência de dois tipos de espaço amostral, Ω: finito ou infinito;
enumerável ou não-enumerável. Todo conjunto finito é enumerável. Mas nem todo conjunto
infinito é não-enumerável. No caso de espaço finito ou infinito enumerável diz-se que o espaço
amostral é discreto quando o espaço amostral for infinito não-enumerável tem-se um espaço
amostral contı́nuo.
Pode-se mostrar que intervalos da forma: (a, b), [a, b), (a, b], [a, b] são não-enumeráveis
já conjuntos que possuam uma “associação” biunı́voca com os naturais são enumeráveis.
Dessa forma, os espaços amostrais caracterizados pelos experimentos descritos podem ser
classificados como:
Experimentos
Espaço amostral
1, 2, 3, 4, 5
finito
enumerável
discreto
6
infinito enumerável
discreto
7, 8, 9, 10
infinito
não-enumerável contı́nuo
Quais são os eventos elementares em um espaço amostral cujo espaço amostral é contı́nuo?
Por exemplo, considerando-se os espaços amostrais associados aos experimentos 7, 8, 9 e 10
quais conjuntos serão seus eventos elementares?
Resposta: Os eventos elementares associados a esses espaços amostrais são os intervalos
da forma:
(a, b] = {x ∈ < : a < x ≤ b}
(1.1)
pois qualquer evento A ⊂ Ω poderá ser escrito como união ou intersecção enumerável ou
diferença de conjuntos como os definidos em (1.1). Por exemplo, subconjuntos (eventos) de
<
( i) Ponto: {x} =
T
µ
¸
1
,x
n x−
n
6
( ii) Intervalo fechado: [a, b] = {a}
S
(a, b]
(iii) Intervalo aberto à esquerda: [a, b] − {b}
(viii) Quaisquer outros subconjuntos de < poderão ser expressos através de um número
enumerável de operações dos conjuntos mencionados nos itens (i) a (iii).
2
Probabilidades
2.1
Interpretação clássica de Probabilidades
A primeira definição de probabilidade conhecida, parece ser devida a DeMoivre em 1718, e foi
claramente explicitada por Laplace no princı́pio do século XIX. Laplace adotou o esquema de
resultados eqüiprováveis, isto é, dos resultados “igualmente prováveis”, comuns às aplicações
até então esboçadas para definir probabilidade de um acontecimento como: “ a relação entre
o número de casos favoráveis ao acontecimento e o número total de casos possı́veis, supondo
todos os casos igualmente possı́veis”.
Admite-se, historicamente que, a motivação para a definição do conceito de probabilidades foram baseadas em jogos de azar dessa forma não causa surpresa o fato de que o conceito
de Laplace seja baseado nas propriedades de tais jogos: possibilidade de classificar a a priori
todos os resultados possı́veis num número finito de casos mutuamente exclusivos, simétricos
e igualmente possı́veis, como, os dois lados da moeda, as seis faces do dado, as 52 cartas do
baralho etc.
Apesar das crı́ticas que lhe foram dirigidas a interpretação clássica manteve a sua força
até o começo do século XX.
Admitido-se o princı́pio dos casos igualmente possı́veis, o cálculo de probabilidades resumese na contagem do número de casos favoráveis e do número de casos possı́veis. Essa contagem,
nem sempre fácil, encontra poderoso auxiliar na análise combinatória.
Exemplo 2.1. Considerando-se A ⊂ Ω um evento qualquer associado ao espaço amostral
do experimento E2 . Podemos atribuir probabilidade ao evento A da seguinte maneira:
P (A) =
Número de resultados favoráveis a A
#A
=
6
Número de resultados possı́veis
7
Esta é definição a clássica de probabilidade quando Ω é finito, e baseia-se no conceito
de resultados eqüiprováveis, ou melhor, no princı́pio da indiferença (estamos “indiferen1
tes”diante dos resultados 1, 2, 3, 4, 5, 6; logo, definimos P (i) = ∀i ∈ Ω). Então, para esse
6
experimento todo evento terá uma probabilidade.
2.1.1
Crı́ticas a definição clássica
Várias crı́ticas são feitas ao conceito clássico de probabilidades:
( i) O que são casos eqüiprováveis?
Na falta de definição admitir que é um conceito primitivo?
( ii) Como reconhecer que os casos são eqüiprováveis?
A saı́da parece ser aceitar que algum princı́pio apriorı́stico suporta tal reconhecimento.
Nesses casos é comum admitir um dois princı́pios a seguir:
( a) princı́pio da indiferença que faz apelo às propriedades de simetria ou de homogeneidade da situação experimental. Se o dado é perfeito porque seriam uma das
faces preferidas em detrimento de outras?
( b) princı́pio da razão insuficiente: se não há razão para crer que qualquer dos casos é
mais provável do que os outros pode-se admitir que todos os casos são igualmente
prováveis.
(iii) É bem sabido que não há moedas perfeitas, dados perfeitos, gases perfeitos, água pura
etc, que perfeição além do conceito não existe. Consequentemente o conceito clássico
é muitas vezes aplicado em situações idealizadas e não consegue vencer a dificuldades
levantadas quando os casos não são igualmente possı́veis.
( iv) Finalmente como calcular probabilidades quando o número de casos possı́veis não é
finito nem sequer enumerável?
8
Apesar de todas as crı́ticas não resta dúvida que a interpretação clássica é aplicável
sempre que a simetria dos problemas a justifique, e, de fato há numerosos caso em que tal
propriedade pode ser aceita. A verdade é que se trata de um modelo probabilı́stico particular
dentro da teoria axiomática a ser desenvolvida, de grande utilidade quando ajustado a uma
realidade concreta.
2.2
Interpretação Frequentista de Probabilidades
A interpretação frequentista (Venn, von Mises, Reichenbach, Salmon etc) foi adotada de
forma quase unâmime pelos estatı́sticos durante a primeira metade do século XX e é ainda
hoje considerada correta pela maioria, apesar de, ter havido uma crescente aceitação da
interpretação Bayesiana na segunda metade do século XX.
Sustenta que a probabilidade de um acontecimento pode ser medida observando-se a
frequência relativa do mesmo acontecimento numa sucessão numerosa de provas ou experiências, idênticas e independentes. Uma das primeiras abordagens da interpretação frequentista deve-se a Venn (1866) ao formalizar a idéia de exprimir probabilidade em termos
de limite de frequências relativas em longas sequências de situações independentes capazes
de repetição em condições idênticas.
2.2.1
Crı́ticas a definição frequentista
( i) Falta de suporte empı́rico para a complexa noção de independência.
( ii) Contraste entre o caráter essencialmente finito da experiência humana e a probabilidade
definida por passagem ao limite numa sucessão indefinidamente grande.
Atribuir probabilidade a um evento nada mais é do que associar uma “medida” ao evento
considerado. Então, a pergunta, agora, passa a ser: conseguimos atribuir medida a qualquer
evento A de um espaço amostral Ω? A resposta é não. Só conseguimos atribuir probabilidade
a determinados subconjuntos de Ω esses subsconjuntos serão, então, chamados de eventos
aleatórios.
Outros autores, por exemplo, Kolmogorov (1950) e Crámer (1946) preferiram abandonar
o axioma do limite, definindo probabilidade de um acontecimento aleatório como um número
9
associado a esse acontecimento satisfazendo um conjunto de regras ou sistema de axiomas.
Na abordagem axiomática a preocupação não é com a interpretação da probabilidade
mas sim que probablidade é definida através de um conjunto de axiomas. Interpretação de
probabilidade é outro assunto. A “frequência de ocorrência”de um evento é um exemplo de
uma particular interpretação. Uma outra interpretação possı́vel é a interpretação subjetiva,
na qual ao invés de pensar probabilidade como frequência, podemos pensá-la como uma
crença na chance de um evento ocorrer. Por exemplo, “Chover amanhã”?
A esse evento
é impossı́vel dar a interpretação frequentista, pois, o evento: “Chover amanhã” não poderá
ser realizado um número grande de vezes.
A que eventos vamos atribuir probabilidades?
2.3
Axiomática de Kolmogorov
De modo geral, toda teoria matemática tem como origem a observação de fatos. Mas, na
verdade, somente quando um grupo de fenômenos apresenta regularidades e permanências
é que pode pensar-se na construção de uma teoria matemática. Tal teoria toma-se como
modelo matemático de tal grupo.
No inı́cio do século XX muitos probabilistas começaram a sentir necessidade de uma
axiomatização que permitisse ultrapassar a ambiguidade de muitas aplicações e a proliferação
de conceitos e interpretações. A axiomatização hoje generalizada deve muito a Bernstein e
à decisiva contribuição de Kolmogorov.
A partir desse momento optou-se por considerar que a teoria da probabilidade teria como
objeto de estudo certos fenômenos observáveis, os fenômenos aleatórios. Assim a teoria da
probabilidade se ocupa de métodos de análise que são comuns ao estudo dos fenômenos
aleatórios seja qual for o campo a que pertençam (da duração da vida humana à duração de
componentes eletrônicos, do número de chamadas que afluem por dia a uma central telefônica
ao número de acidentes de automóvel ocorridos por semana numa estrada, da variação das
caracterı́sticas biométricas de homem para homem às variações das caracterı́sticas quantitativas de um produto fabricado em série etc).
Justifica-se, então a introdução da teoria da probabilidade como teoria matemática dos
fenômenos aleatórios, isto é, dos fenômenos influenciados pelo acaso.
10
Quando o processo está sujeito à influência de fatores casuais ou contigentes e conduz a
resultados incertos fala-se em experiência aleatória ou experimento aleatório.
Mais precisamente, uma experimento aleatório ou casual apresenta as seguintes caracterı́sticas fundamentais:
( i) Pode-se repetir um grande número de vezes nas mesmas condições ou pelo menos em
condições muito semelhantes.
( ii) Cada vez que se repete obtém-se um resultado individual, mas nunca há conhecimento
suficiente para prever exatamente esse resultado, mesmo que se desenvolvam todos os
esforços para manter sob controle.
(iii) Enquanto os resultados individuais se mostram irregulares a ponto de iludir qualquer
tentativa de previsão exata, tem-se verificado que os resultados obtidos ao cabo de
uma longa série de repetições mostram impressionante regularidade estatı́stica quando
tomados em conjunto, isto é, estabilidade das frequências relativas.
Fazer um programa no software R para verificar essa afirmação.
Programa 2.1.
> rm(list=ls(all=TRUE))
> y<-NULL
> for(i in 1:10)y[i]<- sum(rbinom(i,1,0.50))/i
> library(ts)
> plot.ts(y)
>
> y<-NULL
> for(i in 1:20)y[i]<- sum(rbinom(i,1,0.50))/i
> plot.ts(y)
>
> y<-NULL
> for(i in 1:50)y[i]<- sum(rbinom(i,1,0.50))/i
11
> plot.ts(y)
>
> y<-NULL
> for(i in 1:100)y[i]<- sum(rbinom(i,1,0.50))/i
> plot.ts(y)
>
> y<-NULL
> for(i in 1:1000)y[i]<- sum(rbinom(i,1,0.50))/i
> plot.ts(y)
>
Vamos supor, contudo, que a classe dos eventos aleatórios possua certas propriedades
básicas e intuitivas, que serão essenciais para o desenvolvimento posterior da teoria do cálculo
de probabilidades. Indicando com A a classe de eventos aleatórios, vamos estipular as
seguintes propriedades para A.
A1. Ω ∈ A (definiremos P (Ω) = 1)
A2. Se A ∈ A, então AC ∈ A (é evidente que definiremos
P (AC ) = 1 − P (A)).
A3. Se A ∈ A, então AC ∈ A e B ∈ B, então A ∪ B ∈ A (i.e., se atribuirmos uma
probabilidade a A e outra a B, então atribuiremos uma probabilidade a “A ou B”.)
Em outras palavras, vamos supor que A, seja uma álgebra de eventos.
Definição 2.1. Seja Ω um conjunto não-vazio. Uma classe Ω de subconjuntos de Ω satisfazendo A1, A2 e A3 é chamada álgebra de subconjuntos de Ω
Proposição 2.1. Seja A uma álgebra de subconjuntos de Ω. Então valem as seguintes
propriedades:
12
A4. ∅ ∈ A e
A5. ∀n, ∀A1 , . . . , An ∈ A, temos, ∪ni=1 Ai ∈ A e ∩ni=1 Ai ∈ A.
Esta proposição diz que uma álgebra é fechada para um número finito de aplicações das
operações: ∪, ∩, e C .
Observação: A é fechada para diferenças.
Quando, Ω é finito uma álgebra é uma classe adequada para domı́nio da função P (.) Pois
uma álgebra contém o evento impossı́vel, o evento certo, o evento contrário ( de qualquer
evento que pertença a classe), a união e intersecção de eventos (que pertençam à classe), isto
é, em regra, todos os acontecimentos interessantes.
Se Ω for finito então A será a álgebra de todas as partes (ou conjunto de todos os
subconjuntos ) de Ω, i.e., A = P(Ω). No caso finito geral, se Ω tem n elementos, P(Ω) tem
2n elementos e será denotado por #P(Ω) = 2n .
Exemplo 2.2. Se Ω = {1, 2, 3} então: #P(Ω) = 2#Ω = 23 = 8 e
P(Ω) = {∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}
Quando Ω é infinito, mesmo que enumerável uma álgebra deixa de servir para a construção de uma teoria que seja mais forte. Pois quando Ω é infinito existem acontecimentos
interessantes que se exprimem pela união infinita de outros acontecimentos ou de acontecimentos elementares. Se o domı́nio da função de conjunto, P (.), deve conter tais acontecimentos então ao invés de o representar por uma álgebra deve representar-se por uma σ-álgebra.
Isto é, deve-se exigir que a classe dos eventos aleatórios também satisfaça:
0
A3 Se An ∈ A para n = 1, 2, 3, . . ., então ∪∞
i=1 Ai ∈ A
Definição 2.2. Uma classe A de subconjuntos de um conjunto não-vazio Ω satisfazendo A1,
0
A2, A3 é chamada σ-álgebra de subconjuntos de Ω
Uma σ-álgebra é fechada para um número enumerável de aplicações das operações: ∪,
∩, e C .
No caso, Ω finito tomou-se para domı́nio da probabilidade, P (.), a álgebra que se identifica
com a classe, P(Ω) = 2Ω , de todos os conjuntos ou partes de , Ω; no caso de Ω infinito
13
enumerável também não há qualquer inconveniente em tomar para esse domı́nio P(Ω) = 2Ω
que aliás, agora, é uma σ-álgebra.
Quando, Ω, é não-enumerável a situação é mais complicada. A classe, P(Ω) = 2Ω ,
embora seja uma σ-álgebra, é demasiadamente rica e pode não ser possı́vel atribuir uma
probabilidade, de forma compatı́vel com os axiomas, a todo e qualquer, A ∈ P(Ω) = 2Ω .
É por isso que comumente a teoria de probabilidade se desenvolve em relação a uma σálgebra mais restritiva, A, composta apenas por conjuntos de Ω probabilizáveis e só estes
são designados por acontecimentos (eventos aleatórios). Em particular, nos casos de maior
interesse prático em que, Ω = <k , k = 1, 2, . . . , n a análise restringe-se a uma álgebra de Borel
em <k , σ-álgebra que contém os conjuntos (acontecimentos, eventos aleatórios) contemplados
em quase todas as aplicações, a saber, em <, intervalos abertos, semi-abertos ou fechados,
finitos ou infinitos), uniões (finitas ou infinitas enumeráveis) e intersecções (finitas ou infinitas
enumeráveis) de intervalos, etc
Se Ω for contı́nuo quem será A? Por exemplo, consideremos o experimento E: Selecionar
um ponto no intervalo [0,1]. Temos que: Ω = [0, 1]. (Barry James, página 7).
Definição 2.3. Um espaço de probabilidade é um trio (Ω, A, P ) em que:
(a) Ω é um conjunto não-vazio.
(b) A é uma σ-álgebra de subconjuntos de Ω, e
(c) P é uma probabilidade em A
Definição 2.4. Dado um espaço amostral Ω e uma σ-álgebra (σ de Borel), A, a função de
probabilidade é uma função P com domı́nio A que satisfaz:
1. P (A) ≥ 0, para todo A ∈ A.
2. P (S) = 1
3. Se A1 , A2 , . . . ∈ A são disjuntos dos a dois, então
P (∪∞
i=1 ) =
∞
X
i=1
P (Ai )
14
As três propriedades apresentadas na definição 2.4 são usualmente referidas como Axiomas de Probabilidade (ou axiomas de Kolmogorov). Qualquer função que satisfaça os
axiomas de Probabilidade é chamada função de probabilidade. O axioma não menciona qual
é a função particular P, ele meramente requer que P satisfaça os axiomas. Para qualquer
espaço amostral muitas e diferentes funções P podem ser definidas.
Não vamos nos preocupar, doravante, com o problema de como definir probabilidade
para cada experimento. Simplesmente, vamos admitir que existem as probabilidades em
uma certa σ-álgebra A de eventos, chamados eventos aleatórios; vamos supor que a todo
A ∈ A seja associado um número real P (A), chamado probabilidade de A, de modo que os
axiomas a seguir sejam satisfeitos:
Axioma 1. P (A) ≥ 0.
Axioma 2. P (Ω) = 1.
Axioma 3. (Aditividade finita) Se A1 , . . . , An ∈ A são disjuntos (2 a 2), então P (∪nk=1 Ak =
Pn
k=1 P (Ak ). (Os eventos são disjuntos, ou disjuntos 2 a 2, se são mutuamente exclusivos, i.e., Ai ∩ Aj = ∅sei 6= j.)
0
Axioma 3 (σ-aditividade) Se A1 , A2 , . . . ∈ A são disjuntos (i.e., mutuamente exclusivos), então
P (∪nk=1 Ak =
n
X
P (Ak )
k=1
0
Proposição 2.2. O axioma 3 implica o Axioma 3, i.e., se P é σ-aditiva, então é finitamente
aditiva. Prove!
3
Variáveis aleatórias
Em muitos experimentos é muito mais fácil trabalhar com uma variável resumo do que
com a estrutura de probabilidade original. Por exemplo, numa pesquisa de opinião, decidimos perguntar a 50 pessoas se elas concordam ou discordam com um determinado assunto.
Quando a pessoa concorda registramos o valor 1 quando discorda 0, o espaço amostral desse
15
experimento contém 250 = 1125899906842624 elementos são todos os resultados possı́veis
que podem ocorrer quando 50 pessoas são consultadas. Seria interessante reduzir esse
espaço para um de tamanho razoável. De que forma? Contando nessas 250 seqüências de
tamanho 50 cada o número de pessoas que concordam. Dessa forma o espaço seria reduzido
à X = {0, 1, 2, . . . , 50} o qual possui 50 elementos que é muito mais fácil de trabalhar.
Quando definimos uma quantidade X, estamos definindo um aplicação (uma função)
do espaço amostral original em um novo espaço amostral, usualmente um subconjunto dos
números reais.
Definição 3.1. Uma variável aleatória é uma função do espaço amostral Ω nos números
reais.
Exemplo 3.1. Em muitos experimentos variáveis aleatórias são implicitamente utilizadas.
Experimento
Variável aleatória
Lançar dois dados
X = soma dos números
Lançar uma moeda 25 vezes
X =número de caras nos 25 lançamentos
Aplicar diferentes doses de fertilizantes à
uma determinada parcela de milho
X = produção/parcela
Quando definimos uma variável aleatória, estamos definindo um novo espaço amostral
(o campo de variável aleatória). Precisamos, agora, verificar que a função de probabilidade
definida em no espaço original Ω pode ser usada no novo espaço amostral.
Suponha que o espaço amostral
Ω = {ω1 , ω2 , . . . , ωn }
com a função de probabilidade P e definida a variável aleatória X a qual assume valores
{x1 , x2 , . . . , xm }. Podemos definir a função de probabilidade PX ( que na realidade é a
probabilidade P induzida em X) da seguinte maneira. Observamos que X = xi se e somente
se o resultado do experimento aleatório é um ωj tal que X(ωj ) = xi . Assim,
PX (X = xi ) = P ({ωj ∈ Ω : X(ωj ) = xi })
16
PX satisfaz os axiomas de Kolmogorov. Verifique!
Variáveis aleatórias serão sempre denotadas por letras maiúsculas e realizações delas serão denotadas por letras minúsculas. Assim, a variável aleatória
X assumirá o valor x.
Considere o experimento E: Lançar uma moeda 3 vezes. Defina a variável aleatória X
como sendo o número de caras obtidas nos 3 lançamentos. Temos,
ω
X(ω)
(ca, ca, ca)
3
(ca, ca, co)
2
(ca, co, ca)
2
(co, ca, ca)
2
(ca, co, co)
1
(co, ca, co)
1
(co, co, ca)
1
(co, co, co)
0
O campo de variação da variável aleatória X é X = {0, 1, 2, 3}. Assumindo que os oito
1
pontos do espaço amostral Ω tenha a mesma probabilidade de a probabilidade P induzida
8
em X será:
x
0
PX (x)
1
8
1
3
8
2
3
8
3
1
8
17
Por exemplo, PX (2) = P ({ωj ∈ Ω : X(ωj ) = 2}) = P ((ca, ca, co)∪(ca, co, ca)∪(co, ca, ca)) =
1 1 1
3
P ((ca, ca, co)) + P ((ca, co, ca)) + P ((co, ca, ca)) = + + = .
8 8 8
8
Exercı́cio 3.1.
1. Seja Ω um conjunto não-vazio.
(a) Prove: se A e B são σ-álgebras de subconjuntos de Ω, então A ∩ B também é uma
σ-álgebra.
(b) Generalize o item (a): se Ai , i ∈ I, são σ-álgebras de partes de Ω , onde I é um
conjunto não-vazio de ı́ndices, então ∩i∈I Ai também é uma σ-álgebra.
(c) Seja C uma classe de subconjuntos de Ω. Mostre que existe pelo menos uma σálgebra que contém C. (Sugestão Qual a “maior”classe de subconjuntos de Ω?)
(d) Visando a plena utilização dos itens (b) e (c), como você definiria “a menor
σ-álgebra contendo C”, onde C é uma classe de subconjuntos de Ω?
(e) Seja Ω um espaço amostral. Mostre que a coleção B = {∅, Ω} é uma σ-álgebra de
Borel.
(f ) Seja Ω um espaço amostral e B = {todos os subconjuntos de ω, incluindo o próprio Ω}.
Mostre que B é uma σ-álgebra de Borel.
(e) Prove que {∅, Ω}
(f ) Prove que {∅, A, Ā, Ω}
18
4
Bibliografia Aula 01
Algumas partes foram retiradas, outras adaptadas de
1. Bento José Ferreira Murteira: Probilidades e Estatı́stica, Volume I, 2a edição.
2. Barry R. James: Probabilidade: um curso em nı́vel intermediário.
3. George Casella & Roger L. Berger: Statistical Inference.
Seminário I: Procurar referências:
1. Maistrov, L. E. Probability Theory: A historical sketch, Academic Press,
New York, 1974.
2. Fine, T. L. Theories of Probability, Academic Press, New York, 1973.
Apresentar comentários, observações e fatos interessantes ao desenvolvimento da
Teoria da probabilidade.