TEMA 5: Probabilidade e Estatística AUTOR: Itamar Nogueira

Transcrição

TEMA 5: Probabilidade e Estatística AUTOR: Itamar Nogueira
DICAS DO ENEM
MATEMÁTICA
TEMA 5:
Probabilidade e Estatística
AUTOR:
Itamar Nogueira Hernandes
Mais próxima, para
você ir mais longe.
1. Interpretação
6. Equações e
problemas
2. Porcentagem
Matemática
ENEM.2014
5. Probabilidade e
Estatística
3. Cálculo simples
4. Geometria
TEMA 5:
Probabilidade e Estatística
Autor: Itamar Nogueira Hernandes
HERNANDES, Itamar Nogueira. Matemática: Probabilidade e Estatística. Valinhos, 2014.
TEXTO E CONTEXTO
Pag. 04
GLOSSÁRIO
Pag. 09
VOCÊ ESTÁ PRONTO? Pag. 10
REFERÊNCIAS
Pag. 14
GABARITO
Pag. 15
© 2014 Kroton Educacional. Proibida a reprodução final ou parcial por qualquer meio de impressão, em forma idêntica, resumida ou modificada em língua portuguesa ou
qualquer outro idioma.
TEXTO E CONTEXTO
Probabilidade e Estatística
Imagine se você pudesse prever o futuro. Essa é, talvez, uma das grandes buscas do ser humano em todas as esferas
de atuação. Na agricultura, saber se vamos ter uma temporada de chuvas ou de geada poder ser muito útil; na economia,
saber de antemão o movimento dos agentes econômicos pode ajudar na alocação de recursos; nos negócios, compreender
qual será a demanda pelos produtos e serviços de uma empresa pode ser útil na contratação dos diversos recursos
necessários; para a polícia, saber onde ocorrerão os crimes certamente ajudaria muito; enfim, prever o futuro seria uma
vantagem enorme para quem detivesse essa habilidade.
No entanto, isso não é possível, por mais que muitos chamem para si a posse dessa habilidade. Talvez isso ocorra nas
crendices, mas este não é o espaço para isso. Na ciência, os métodos de criação de conhecimento devem seguir um
padrão elevado de comprovação de sua utilidade.
Ao longo do tempo, durante o desenvolvimento do conhecimento humano, tentamos criar técnicas notadamente úteis
para interpretar melhor o passado, ou seja, encontrar nos fatos já ocorridos padrões, características particulares, as
regras mais explícitas e as menos explícitas de cada fenômeno. Isso, inicialmente, por meio de técnicas simples como,
por exemplo, contar as coisas, ou seja, enumerar. Com o desenvolvimento das técnicas, outros elementos foram sendo
colocados nesse processo de contagem para enriquecer e melhorar a interpretação dos eventos.
Qual a média de ocorrência de um fato específico? Sendo a média um padrão geral para todos os eventos, mas não
sendo a regra geral para cada evento específico, quanto cada evento foge, em média, dessa regra padrão? Melhorando
a pergunta: temos um evento, por exemplo, o salário de cada operário de uma fábrica. Cada um tem o seu salário,
dependendo do seu cargo e função. No entanto, podemos encontrar uma espécie de salário médio para os funcionários
dessa fábrica, digamos que seja de R$ 1.800. Mas perceba que essa é a média dos salários.
Essa média é calculada seguindo essa lógica:
4
TEXTO E CONTEXTO
Tabela 5.1: Cálculo da média de salários.
Operários
Operário 1
Salário de cada Operário
R$ 1.300,00
Operário 2
R$ 1.300,00
Operário 3
R$ 1.400,00
Operário 4
R$ 1.400,00
Operário 5
R$ 1.700,00
Operário 6
R$ 2.000,00
Operário 7
R$ 2.000,00
Operário 8
R$ 2.200,00
Operário 9
R$ 2.200,00
Operário 10
R$ 2.400,00
Soma de todos os salários
R$ 18.000,00
Número de Operários
Média de Salário em R$
10
R$ 1.800,00
Temos então, pela tabela, a soma dos salários de todos os operários, que é igual a R$ 18.000. Após isso, dividimos pelo
número de funcionários, que é igual a 10, e essa divisão resulta em R$ 1.800. O valor da média significa que os ganhos
dos funcionários daquela fábrica giram entorno de R$ 1.800, não significa que todos ou que alguém ganha R$ 1.800,
mesmo que eventualmente isso possa ocorrer.
Veja que a média é uma informação importante, na verdade é uma das principais medidas dentro da estatística, mas
ela por si só não explica muito o que ocorre dentro de uma população (no nosso exemplo, a população são os operários
de uma empresa). Uma informação relevante é saber, após tendo o conhecimento da média, o quanto os valores dos
salários estão espalhados ao redor dessa média. Por exemplo, sendo a média R$ 1.800, será que são todos próximos
de R$ 1.800, como R$ 1.850, R$ 1.750, R$ 1.825, R$ 1.795, e assim por diante, ou se eles estão mais espalhados,
como na Tabela 5.1, indo de R$ 1.300 a R$ 2.500.
Vamos pensar assim: se temos a média de um grupo (população) e o valor das amostras (salários) estão mais concentrados
em pontos próximos da média, entre R$ 1.700 e R$ 1.900, ficará mais fácil prever qual vai ser o salário de cada operário.
5
TEXTO E CONTEXTO
Mas, do contrário, se os valores das amostras (valores dos salários) estiverem mais espalhados ao redor da média, indo
de R$ 1.300 a R$ 2.500, por exemplo, ficará mais difícil fazermos algum tipo de previsão.
A essa forma como as amostras estão desviadas da média, ou como estão dispersas entorno da média, chamamos de
desvio padrão. É como se observássemos o quanto cada amostra (salário de cada operário) desvia da média calculada.
Veja que na Tabela 5.2 temos as etapas de cálculo do desvio padrão:
Tabela 5.2 – Cálculo do desvio padrão.
Operários
Operário 1
Operário 2
Operário 3
Operário 4
Operário 5
Operário 6
Operário 7
Operário 8
Operário 9
Operário 10
Soma de todos os salários
Número de Operários
Média de salários por
operário em em R$
Salário de cada operário (a)
R$ 1.300
R$ 1.300
R$ 1.400
R$ 1.400
R$ 1.700
R$ 2.000
R$ 2.000
R$ 2.200
R$ 2.200
R$ 2.500
R$ 18.000
10
R$ 1.800
Média (b)
R$ 1.800
R$ 1.800
R$ 1.800
R$ 1.800
R$ 1.800
R$ 1.800
R$ 1.800
R$ 1.800
R$ 1.800
R$ 1.800
O quanto cada amostra
desvia da média (a-b = c )
Calcula-se o quadrado
dos desvios ( c2) = (d)
-R$ 500
-R$ 500
-R$ 400
-R$ 400
-R$ 100
R$ 200
R$ 200
R$ 400
R$ 400
R$ 700
R$ 250.000
R$ 250.000
R$ 160.000
R$ 160.000
R$ 10.000
R$ 40.000
R$ 40.000
R$ 160.000
R$ 160.000
R$ 490.000
Soma dos desvios =
Número de Operários - 1 =
R$ 1.720.000
9
Variância dos desvios
Desvio padrão =
R$ 191.111
437,1625683
Vamos acompanhar a continuação da Tabela 5.1, que agora acrescenta as informações de desvio padrão da amostra.
Veja que na coluna “a” temos as informações sobre os salários e na coluna “b”, a informação da média que já havíamos
6
TEXTO E CONTEXTO
calculado na coluna 1 (Tabela 5.1). Na coluna “c” simplesmente subtraímos o salário de cada operário (a) da média
dos salários (b). Na coluna “d” elevamos ao quadrado essa diferença, isso ajuda a eliminar os números negativos. E
finalmente, somamos esses quadrados e dividimos pelo número de amostras (operários) menos 1 (10 – 1 = 9). Chegamos
ao valor de R$ 191.111 que é conhecido como variância. Se calcularmos a raiz quadrada da variância, chegamos ao
valor e R$ 437,16 que é o tão famoso desvio padrão. Esse valor mostra o quanto de variação ou de dispersão existe em
relação à média, lembrando que a média é também chamada de “valor esperado”.
Para tudo isso que acabamos de abordar existem alguns símbolos próprios muito utilizados e que vale a pena conhecer.
Os cálculos que fizemos nas Tabelas 5.1 e 5.2 possuem uma representação por meio de uma fórmula, que é assim:
Para se calcular a média:
∑
n
x=
1
n
xi=
x 1 + x2 + ... + xn
n
i=1
Onde:
x, é a média dos valores (média da população) ou valor esperado.
xi,
é cada observação da nossa amostra (cada informação de salário) de operários.
n, é o número de observações, no nosso caso, o número de operários.
∑,
letra grega sigma, significa somatório, no nosso caso, o somatório de todos os termos presentes na amostra ou
população.
Em resumo, a média é o somatório (∑) de todos os termos (xi) dividido pelo números de termos/observações (n).
Para calcular o desvio padrão:
7
TEXTO E CONTEXTO
∑
n
s=
1
n-1
(xi - x)2
i=1
Em relação à nomenclatura dos termos, veja que apenas o s aparece como fator novo quando comparamos com a
fórmula de cálculo da média. O s significa desvio padrão.
Em resumo, essa fórmula quer dizer:
a) Para cada valor xi calcular a diferença entre este valor e a média x .
b) Eleva-se essas diferenças ao quadrado.
c) Somamos então todas essas diferenças que foram elevadas ao quadrado.
d) Divide-se essa soma pela quantidade de termos menos um, ou seja, divide-se por n-1.
e) Então, calculamos a raiz quadrada desse resultado.
Aqui vale uma observação: os passos seguidos até o passo indicado na letra d fazem com que cheguemos a um resultado
que representa uma outra medida estatística chamada variância. Variância é também uma medida de dispersão que
nos indica o quão espalhados estão os valores de uma população em comparação com o valor esperado (média). A
diferença básica em relação ao desvio padrão é que este nos é dado na mesma unidade de medida dos elementos que
estão sendo mensurados, tornando mais fácil sua visualização e interpretação. Sua fórmula está descrita a seguir:
∑
n
s2 =
1
n-1
(xi - x)2,
i=1
Repare que a variância é uma etapa do cálculo do desvio padrão.
Nesse momento, vamos voltar ao nosso exemplo da fábrica que fez um levantamento dos salários dos funcionários.
8
TEXTO E CONTEXTO
Repare que saber estimar a média de salários de uma fábrica é importante por diversos motivos. Se vamos abrir uma
outra fábrica, esse conhecimento seria importante para o planejamento dessa nova fábrica. O governo poderia estimar
esses salários para fins de projetar alguma política de emprego ou de estímulo à economia, ou mesmo como forma
de planejamento tributário, enfim, são diversas as vantagens de saber dominar as técnicas estatísticas e entender a
probabilidade de que certos eventos possam ocorrer.
Na estatística, sua principal ideia e maior virtude não é poder adivinhar ou prever o futuro, isso não está ao seu alcance,
mas sim aumentar a probabilidade de se conhecer o resultado de algum evento no futuro a partir do conhecimento de
eventos semelhantes do passado.
Se estatisticamente um evento tem pouca chance de ocorrer, por que apostar nele para o futuro? A ideia é melhorar a
previsibilidade e o poder de planejamento da ação humana e seus recursos.
Se conhecermos melhor o passado, poderemos projetar melhor as probabilidades de acontecimento futuro de diversos
eventos relevantes para a vida do homem.
GLOSSÁRIO
Estatística: A estatística é a ciência que coleta e analisa dados em grandes quantidades, numéricos ou que possam
ser classificados para fins de sistematização de análise, especialmente para o propósito de inferir conclusões sobre um
todo a partir de suas partes.
Probabilidade: A extensão na qual algum evento tem a chance de acontecer. Normalmente, tenta-se estabelecer algum
tipo de razão, proporção ou porcentagem de chance para expressar essa possibilidade.
Média: É o valor que busca localizar o ponto em que há a maior concentração de observação. É o ponto em que se
observa o equilíbrio dentro de uma distribuição.
Desvio padrão: É uma das medidas mais comuns de dispersão e busca mostrar qual a variação que existe da amostra
9
GLOSSÁRIO
ou da população em relação à média da mesma amostra ou população. Um baixo desvio padrão significa que os
valores das amostras se encontram concentrados próximo da média enquanto um alto desvio padrão significa que estão
dispersos ao redor da média.
Variância: Variância é também uma medida de dispersão que nos indica o quão espalhados estão os valores de uma
população em comparação com o valor esperado (média). A diferença básica em relação ao desvio padrão é que
este nos é dado na mesma unidade de medida dos elementos que estão sendo mensurados, tornando mais fácil sua
visualização e interpretação.
VOCÊ ESTÁ PRONTO?
Instruções
Agora, chegou a sua vez de exercitar seu aprendizado. A seguir, você encontrará algumas questões de múltipla
escolha e dissertativas. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido.
Questão 1 - As chances de se ganhar na Mega-Sena
Um jogo bem popular da loteria nacional é a Mega-Sena. É o jogo que costuma pagar os maiores prêmios por aqui.
Este jogo consiste em escolher 6 dezenas dentre 60 para uma aposta mínima. Mas apostadores podem fazer jogos
mais audaciosos ao escolher mais de seis dezenas, porém, quanto mais números se joga, muito mais cara vai ficando
a aposta. Para se ter uma ideia, a aposta mínima com 6 dezenas tem o custo para o apostador de R$ 2,50, já se você
fizer um jogo com 15 números, o valor da aposta pula para R$ 12.512,50. Nada barato!
Na verdade esse aumento substancial no valor da aposta reflete o aumento substancial das chances de se acertar uma
maior quantidade de números. A probabilidade de se acertar a sena em uma aposta simples de 6 números é 1:50.063.860
e a probabilidade de se acertar a sena em uma aposta de 15 números é 1:10.003, ou seja, muito mais “fácil”.
Sobre as características desse jogo, assinale a alternativa correta:
a) 1:50.063.860 significa que a cada real gasto na aposta simples temos a chance de ganhar R$ 50.063.860. E que a cada real
10
VOCÊ ESTÁ PRONTO?
gasto na aposta com 15 números podemos ganhar R$ 10.003.
b)O aumento no valor em reais de uma aposta simples para uma aposta de 15 números é exatamente proporcional ao aumento
das chances de ganhar.
c) O aumento das chances de ganhar na sena de uma aposta simples para uma aposta com 15 números jogados é de quase
100%, logo, a chance de se ganhar com uma aposta 15 números é de quase 100%.
d)A chance de se ganhar com uma aposta de 15 números é de 0,010% aproximadamente.
e) A chance de se ganhar com uma aposta de 15 números é de 10% aproximadamente.
Questão 2
Sempre que chegamos em época de eleições, os noticiários ficam repletos de divulgação de resultados de pesquisas de
opinião. Recentemente, um jornal de grande circulação noticiou os resultados da última pesquisa para o primeiro turno
das eleições para Presidente da República e o resultado foi o que segue:
Se a eleição fosse hoje, segundo a pesquisa, o resultado seria:
Candidato A teria 51% dos votos.
Candidato B teria 31% dos votos.
Candidato C teria 10% dos votos.
Candidato D teria 8% dos votos.
A margem de erro é de 3 pontos percentuais, para cima ou para baixo.
Sobre essa pesquisa, podemos dizer:
a) Pelas técnicas modernas hoje disponíveis, as pesquisas representam fielmente o que vai ser o resultado das eleições caso
elas aconteçam logo após o término da pesquisa.
b)As pesquisas de opinião são uma tentativa de antecipar os resultados futuros das eleições. Baseiam-se em uma amostragem
da população apta a votar, de qual, com técnicas estatísticas apropriadas, buscam delinear o futuro resultado. Contudo, tais
11
VOCÊ ESTÁ PRONTO?
pesquisas são passíveis de erro.
c) Sendo esta uma eleição que contempla um segundo turno, certamente, pelos resultados dessa pesquisa, não haverá segundo
turno, já que temos um candidato que possui mais de 50% dos votos e a soma de todos os outros candidatos não alcança o
percentual de votos do candidato A.
d)Pela margem de erro declarada na metodologia da pesquisa (3%), podemos dizer que o provável resultado do candidato A
pode variar entre 50% a 52%.
e) Se após a apuração real dessa eleição ficar constatado que o candidato A recebeu 50% dos votos, ou seja, 1% abaixo do
que foi declarado na pesquisa de opinião, e mesmo assim dentro margem de erro, os demais candidatos terão comportamento
semelhante quanto à margem de erro e o resultado provável dos demais candidatos será: Candidato B terá recebido 30% dos
votos; candidato C terá recebido 9% dos votos; e candidato D terá recebido 7% dos votos.
Questão 3 - Recordes da Copa do Mundo de Futebol
O Portal da Copa, site do Governo Federal Brasileiro sobre a Copa do Mundo da FIFA 2014TM, destaca o seguinte texto:
“A 20ª Copa do Mundo chegou ao fim, mas ficará na história do torneio por vários motivos. Além da festa registrada
fora das arenas, dentro de campo alguns recordes foram batidos. A começar pelo que o torcedor mais gosta: gols.
Ao todo, o Mundial no Brasil teve 171 bolas nas redes, número que iguala ao torneio de 1998 na França, que
registrava sozinho a maior marca de tentos até então. A média ficou em 2,67 gols por partida, a décima segunda
de todas as edições da competição.”
Portal da Copa – 14/07/2014: Disponível em <http://www.copa2014.gov.br/pt-br/noticia/copa-do-mundo-no-brasil-tem-171-gols-e-iguala-maiormarca-da-historia-do-torneio>. Acesso em: 3 ago. 2014.
Considerando esse texto sobre a Copa do Mundo, podemos afirmar:
a) O texto contém erro grave quanto à média de gols do campeonato, pois como foi fartamente divulgado, houve resultados de
partidas com muito mais gols, por exemplo, o jogo do Brasil contra a Alemanha em que o Brasil foi derrotado por 7 a 1.
b)O texto está claramente tendencioso e cai em contradição. Uma dessas contradições é dizer que houve recorde de gols
marcados, porém, possui somente a décima segunda melhor média de gols da história de todas as copas.
c) Pelo texto, podemos chegar à conclusão de que essa copa teve 64 jogos.
12
VOCÊ ESTÁ PRONTO?
d)A média de 2,67 gols por jogo informada no texto é outro sinal de impropriedade dessa informação, já que pelas regras do
futebol não se pode marcar um gol valendo 0,67 gol.
e) Por apresentar uma média tão alta de gols, podemos chegar à conclusão de que não houve jogos que terminaram em zero
a zero.
Questão 4 - Série histórica sobre divórcio no Brasil
Leia o texto a seguir:
“Divulgada pelo Instituto Brasileiro de Geografia e Estatística (IBGE) nesta segunda-feira, dia 7, as Estatísticas do
Registro Civil apontam taxa de divórcios recordes no País. De acordo com os registros, 351.153 divórcios foram
realizados em 2011, um crescimento de 45,6% em relação a 2010, quando foram registrados 243.224 divórcios.
É a maior taxa desde 1984, quando a série de estatísticas foi criada.
O número representa 2,6 divórcios para cada mil habitantes acima de 15 anos de idade. Um dos fatores apontados
pelo IBGE como responsável pelo aumento na taxa é a mudança na Constituição Federal realizada em 2010,
que encurtou os prazos para a realização do divórcio. Agora os casamentos civis podem ser dissolvidos de forma
efetiva, sem que haja etapa prévia de separação.”
Revista Brasileiros – 17/12/2012
Disponível em: <http://www.revistabrasileiros.com.br/2012/12/17/ibge-brasil-registra-taxa-de-divorcios-recorde/#.U97n3_ldWjB>. Acesso em: 3
ago. 2014.
Agora, escolha a alternativa correta sobre a interpretação dessa matéria.
a) O número de 351.153 é a maior taxa de divórcio de todos os tempos.
b)A taxa de 351.153 divórcios representa uma taxa de 2,6% de divórcios entre habitantes acima de 15 anos de idade.
c) 2,6 pessoas se separam a cada mil habitantes.
d) A taxa de 351.153 divórcios representa uma taxa de 2,6‰ de divórcios entre habitantes acima de 15 anos de idade.
e) O IBGE, no momento da divulgação dessa pesquisa, possuía uma série histórica deste tipo evento de mais de 30 anos.
13
VOCÊ ESTÁ PRONTO?
Questão 5
Assinale a alternativa que melhor descreva as características e utilidades da informação de desvio padrão em estatística:
a) Quanto maior o desvio padrão, maior a chance dos dados estarem próximos da média.
b)Quanto menor o desvio padrão, menor a chance dos dados estarem próximos da média.
c) O conceito de desvio padrão é igual ao conceito de variância, inclusive na forma de calcular, sendo, assim, sinônimos.
d)Desvio padrão é o mesmo que média aritmética.
e) Sua grande utilidade é mostrar quanto de variação ou de dispersão existe em relação à média de uma amostra ou população.
REFERÊNCIAS
BUSSAB, Wilton de Oliveira; MORETTIN, Pedro Alberto. Estatística Básica. 8 ed. São Paulo: Saraiva, 2013.
FIALHO, Gabriel. Copa no Brasil tem 171 gols e iguala maior marca do torneio. Público total é o segundo da história.
Portal da Copa. Disponível em: <http://www.copa2014.gov.br/pt-br/noticia/copa-do-mundo-no-brasil-tem-171-gols-eiguala-maior-marca-da-historia-do-torneio>. Acesso em: 3ago. 2014.
IBGE: Brasil registra taxa de divórcios recorde. Revista Brasileiros. Disponível em: <http://www.revistabrasileiros.com.
br/2012/12/17/ibge-brasil-registra-taxa-de-divorcios-recorde/#.U97n3_ldWjB>. Acesso em: 3 ago. 2014.
14
GABARITO
Questão 1
Resposta: Alternativa “d”. Pelo texto pegamos a informação de 1:10.003 , que é a chance de acerto para uma aposta de
15 números, e processamos a informação para representar o resultado em porcentagem.
1/10.003 = 0,01% de acertar, ou ainda, 99,99% de errar a aposta.
Questão 2
Resposta: Alternativa “b”. As pesquisas de opinião sobre as eleições representam a aplicação de técnicas estatísticas
para tentar coletar uma grande quantidade de dados sobre a opinião de votos dos eleitores, contudo, está sujeita a erros
e imprecisões inerentes ao processo de estimar dados futuros.
Questão 3
Resposta: Alternativa “c”. Apenas calcule o número de partidas pelo cálculo da média de gols por partida e substitua na
expressão a seguir as informações disponíveis no texto:
Número de Gols / Número de Partidas = Média de gols por partida
171 / X = 2,67
X = 64
Questão 4
Resposta: Alternativa “d”. O próprio texto informa essa taxa, sendo apenas necessário entender o sinal de “‰” para
melhor interpretar a questão.
Questão 5
Resposta: Alternativa “e”. Veja no texto da aula as definições para o conceito de desvio padrão, média e variância.
15
Mais próxima, para
você ir mais longe.
unopar.br