Caderno de Orientação de Aulas - 1ª Unidade

Transcrição

Caderno de Orientação de Aulas - 1ª Unidade
Autarquia Educacional do Vale do São Francisco - AEVSF
Faculdade de Ciências da Aplicadas e Sociais de Petrolina – FACAPE
Curso: Economia
Disciplina: Introdução a Estatística
Período : 2º
Professor : Reginaldo Santos
Caderno de Orientação de Aulas - 1ª Unidade
[Baseado no conteúdo programático e bibliografia indicada]
Caderno para acompanhamento
do conteúdo da disciplina de Probabilidade e
Estatística para o Curso de Ciências da Computação.
Faz-se necessário o devido acompanhamento
das aulas e da Bibliografia Indicada.
Petrolina – 2004
Aulas 01 e 02 – CONTEÚDO PROGRAMÁTICO
PONTOS RELEVANTES PARA UMA BOA QUALIDADE DO CURSO
I – 1ª AVALIAÇÃO : 27/09
Período:
02/08 A 23/09
1. Arredondamento de Números/Cálculo com Somatórios
2. População e Amostra
3. Técnicas de Amostragem
4. Tabelas Estatísticas
5. Séries Estatísticas - Gráficos
6. Distribuição de Freqüências
7. Medidas de Tendência Central
II – 2ª AVALIAÇÃO : 22/11
Período:
04/10 A 18/11
1. Medidas de Posição
2. Medidas de Dispersão
3. Medidas de Assimetria
4. Medidas de Curtose
5. Cálculo das Probabilidades - Introdução
III – 3ª AVALIAÇÃO: 25/11 - FINAL : 29/11 Todo o Conteúdo
IV - ESCLARECIMENTOS
Não cumprir carga hor. implica em alguma compensação;
Horário: Evitar Atrasos. Esteja na sala sempre no horário;
Presença: 75% --- Limite de Faltas 25% = 8 h/a
Faltas (Aluno) - $ Processo Adm. ♀ Prof. não tem Autonomia
(Professor) ☼ Casos extremos, e☺ Aviso com antecedência
Parceria Responsável Relação Cliente / fornecedor
Material: Caderno de Orientação, aulas, trabalhos e provas
Int WWW.facape.br/reginaldo [email protected]
V – BIBLIOGRAFIA
Básica: Martins, Gilberto de Andrade. Estatística Geral e Aplicada. SP:
Atlas2001
Spiegel, Murray R. Estatística. SP: Mc gras-Hill. 3ª edição 1993
1. CONCEITO – O QUE É ESTATÍSTICA
CORRIQUEIRA
– Ramo da matemática que se encarrega de coleta,
organização, apresentação e análise de dados bem como na obtenção de
conclusões válidas e na tomada de decisões baseada em tais análises.
CLÁSSICA – Conjunto de métodos e processos quantitativos que serve para
estudar e medir os fenômenos coletivos. (Dugé de Bernonville)
OBJETIVO – Estudo dos fenômenos coletivos e das relações que existem entre
eles.
EM RESUMO
Coletar
Organizar
Analisar
Interpretar
2. POPULAÇÃO E AMOSTRA
2.1 POPULAÇÃO OU UNIVERSO - Conjunto de elementos ou indivíduos
que têm em comum pelo menos, uma determinada característica.
2.2 POPULAÇÃO
Finita - Número de unidades de observação pode ser contado e é
limitado
Infinita – Quantidade de unidades de observação é ilimitada ou a sua
composição é tal que as unidades não podem ser
identificadas
2.3 AMOSTRA – Todo subconjunto não vazio e com um número de elementos
menor do que a população.
EXEMPLO 1. População: 50 sabores de sorvete ofertados por uma confeitaria.
Amostra : seis sabores testados para avaliação do sabor.
2. População: produção de parafusos num certo dia em uma fábrica
Amostra: Seleção de 10% para testar a capabilidade do processo
Quando coletamos informações de todos os elementos de uma
população, estamos fazendo um Recenseamento. Daí,
2.4 CENSO – Conjunto de dados que foram obtidos através de um
recenseamento
2.5 AMOSTRAGEM - Informações de apenas parte da população
LEMBRE-SE
2. Como é dispendioso , difícil e por vezes impraticável ter acesso a toda
uma população, costuma-se escolher uma amostra aleatória e estudá-la.
1. Para evitar predições imprecisas é essencial que a amostra represente
efetivamente a população da qual foi extraída.
2. Conheça os conceitos
1. O que é Estatística
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------2. Qual é o objetivo da Estatística? -----------------------------------------------------------------------------------------------------------------------------------------------3. Por que os pesquisadores estudam amostras e não populações?
-------------------------------------------------------------------------------------------4. Como podemos dizer se uma determinada amostra representa adequadamente uma população?
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------5. Qual a diferença entre população e amostra?
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------6. Responda pela descrição de cada sentença:
a) Descreve e analisa determinada população, sem no entanto fazer conclusões
de caráter mais genérico ---------------------------b) Coleta informações de todos os indivíduos de uma população-------------------c) Processo pelo qual se seleciona amostras para estudo ----------------------------d) Existe apenas no campo teórico e possui um número infinito de elementos----------------------------------e) Qualquer subconjunto não vazio e menor que a população -----------------------
f) Conjunto de dados obtidos através de um recenseamento ------------------------g) Seu número de elementos é ilimitado -----------------------------------------------h) Ao se descrever uma população, deve-se diferencias unidades de observação
das características dessa população. Suponha então:
Numa população de municípios, qual é?
- unidade de observação ------------------------------------- características -----------------------, -------------------------, -----------------------População de alunos da rede municipal de ensino
- unidades de estudo ou observação --------------------------------------------------- características -----------------------, ------------------------- , ----------------------População dos 60 tipos de pizzas de um restaurante
- unidade de observação ----------------------------- características ------------------------ , ------------------------, -----------------------Suponha que você seja um pesquisador e está fazendo um experimento em que
deve dividir os elementos em dois grupos: um grupo experimental e um grupo
de controle. Então responda:
a) Por que, devem os grupos ser tão semelhantes quanto possível?
b) As pessoas devem saber em que grupos estão? Porque?
c) Qual a melhor maneira de repartir os indivíduos pelos dois grupos?
3. TÉCNICAS DE AMOSTRAGEM
3.1 AMOSTRAGEM – Método ou procedimento adotado para selecionar uma
amostra que seja representativa da população em
estudo.
3.1.1 AMOSTRAGEM CASUAL SIMPLES
A amostra se diz Casual Simples ou Aleatória quando ela é composta
por elementos retirados ao acaso da população, tendo como principal
característica, a chance de cada elemento ser incluído na amostra, ou seja, a
mesma chance ou probabilidade de ser selecionado.
Para populações pequenas, o método de sorteio através de uma urna, um
“chapéu”, etc. resolve o problema. Para populações maiores utiliza-se a
chamada tabela de números aleatórios.
Tabela 1.1 - Tabela de dígitos pseudo-aleatórios
87404
85585
42231
25702
70634
36277
43498
33842
36567
92211
76732
11139
40104
32956
04947
29005
12631
52870
39713
57097
34275
82952
19651
32471
18659
07260
01465
41218
10199
05310
63460
12601
93837
01535
21540
25712
17322
28199
57743
28583
77510
44325
79643
74599
96184
29743
38743
36732
36390
62538
09274
24265
86934
50825
61694
24451
19681
60103
34379
40849
72783
74590
95406
87676
96346
21042
72197
44554
60673
55088
39619
74074
26941
10047
72209
01877
80412
08273
58632
59227
18607
04108
65693
72533
92226
10758
40705
60307
04895
98491
71907
81404
29551
10259
67845
76125
5 2571
80452
99001
94063
23978
48185
04416
16373
20374
88546
10843
90526
20325
52223
64384
77571
92250
19330
74626
11923
94817
65394
71291
73613
09842
85451
48194
69057
95549
50602
43162
91527
16095
65401
60597
41489
33982
97417
12732
01544
84328
55705
38532
38923
23697
42729
83748
38697
41435
68834
43519
99465
33485
29185
67430
91573
38725
43229
27106
77809
37797
56648
46287
96611
96209
03241
22226
85988
31965
30982
46443
45957
20392
43647
42674
53593
29066
46696
60542
50541
70210
83693
31995
87059
54203
80440
31098
22403
55601
01611
46272
37708
91640
19910
65074
61400
13263
97695
71464
07059
08634
81127
55564
23835
53328
82735
55003
33213
71345
94362
47578
16855
79698
12168
68358
29590
53001
95159
09500
78111
01856
00534
28660
55781
54887
51289
69676
41480
60704
66279
45790
60936
52354
52790
85344
10526
74272
61635
39979
43635
71739
04721
55348
19465
95922
40717
83617
94890
94976
27927
32484
16181
77541
26249
76482
46446
00659
32508
16086
70698
90755
11408
17804
76402
82634
92809
52058
56996
13678
81474
43577
27900
30445
79360
34293
55033
07837
20362
58732
95839
80724
17585
31892
52781
62584
42185
92284
57576
85854
94353
99120
88362
29737
86730
43815
65971
08206
07361
94085
20130
67427
53147
32053
85704
40818
38032
40592
92153
66658
63722
52150
15473
68147
52879
60069
92672
95983
44831
92427
98699
33445
53773
48356
85912
87010
67149
06738
03079
16730
29023
26310
92748
66984
62123
75038
33219
57191
66765
42362
81017
72700
79216
36985
39747
99556
47087
27860
91744
71764
17215
97738
42198
31055
36060
09146
75810
99163
62593
82955
25922
62562
93694
89330
56169
17264
87306
20075
85741
97115
67265
39948
72603
30704
20475
06647
95748
75795
52623
74101
48487
04855
74049
50990
95394
00772
73570
77699
77358
15036
54808
65764
79195
88466
35023
99834
59694
34397
06439
02109
44212
84398
60072
59318
79759
Para usar uma tabela de números pseudo-aleatórios, seguir os seguintes passos:
1.Listar os elementos da população;
2.Enumerar consecutivamente as unidades, a começar pelo número 1;
3.Proceder a leitura dos números na tabela de dígitos pseudo-aleatórios de tal
forma que o total de algarismos em cada um deles coincida com o total de
algarismos do último número da listagem
4.Identificar as unidades a serem incluídas na amostra.
Aplicação
O quadro abaixo fornece a relação das 30 maiores empresas privadas do
Brasil, em vendas , em julho de 1988. Usando a tabela de dígitos aleatórios ,
selecione uma amostra de 8 empresas para serem entrevistadas em detalhes
quanto suas estratégias de crescimento.
Tabela 1 – Maiores empresas sediadas no Brasil, em vendas – jul/98
Empresa
Volkswagen
GM
Fiat Automóveis
Shell
Souz Cruz
Carrefoul
Ipiranga
Ford
Brahma
Nestlé-S.P.
Gessy Lever
Texaco
Esso
Pão de Açúcar
Varig
3.1.2
Empresa
Vale do Rio Doce
Cotia
Mercedes-Benz
CSN
IBM
Light
Casas Bahia
Usiminas
Lojas Americanas
Multibrás
Ceval
Copersucar
Cargill
Credicard
CPFL
Amostra
Amostragem por Estratificação
A amostra estratificada é composta por elementos provenientes de
todos os estratos de uma população. Para separar os estratos devemos usar,
sempre, uma variável critério.
Aplicação
Dada uma população de 50.000 trabalhadores da indústria automobilística,
selecionar uma amostra de 5% desses trabalhadores para estimar o salário
médio.
Cargos
Chefes de Seção
Operários especializados
Operários não especializados
Total
População
5.000
15.000
30.000
Amostra
A amostragem por estratificação possui as seguintes características:
Dentro de cada estrato, há uma grande homogeneidade, ou então uma
pequena variabilidade;
Entre os estratos, há uma grande heterogeneidade, ou então uma grande
variabilidade.
3.1.3 Amostragem por Conglomerados
Consideramos conglomerados os grupos de elementos ou indivíduos com as
seguintes características:
Dentro de cada conglomerado, há uma grande heterogeneidade, ou então
uma grande variabilidade;
Entre os conglomerados, há uma grande homogeneidade, ou então uma
pequena variabilidade.
Aplicação
Se estivermos interessados, por exemplo em estudar o salário médio dos
operários da indústria automobilística, podemos selecionar uma montadora e,
dentro dela, fazer as devidas estimativas.
Observe que agora há uma mudança fundamental na unidade de sorteio, pois
passamos de elemento para grupo
3.1.4 Amostragem Sistemática
Este tipo de amostragem é bastante semelhante à amostragem aleatória
simples. Se considerarmos uma população de tamanho ”N” e dela retirarmos
uma amostra de tamanho “n”
Definimos :
S= N
n
fator de sistematização ou passo
Técnica
Sorteamos um número entre 1 e S. Seja “m” esse número;
O 1º elemento da amostra é o m;
O 2º elemento = S + m
O 3º elemento = S + 2m
E assim sucessivamente até que se complete o tamanho da amostra
OBS - O importante para esse tipo de amostragem é que a população esteja
ordenada, por exemplo, em nomes de uma lista telefônica ou em números de
logradouros de uma rua, etc.
Aplicação
De uma população composta de 1.000 elementos ordenados, retirar uma amostra
sistemática de tamanho 10.
Solução
1. Faz-se S = N n = 1.000 100 = 10 S = 10; este será o passo;
3. Sorteia-se 1 m 10 . Suponha que seja 5. Daí, teremos:
1º elememto ........................... 5º
2º elemento ............................ 15º
3º elemento ............................ 25º
......................................................
100º elemento ........................ 995º
Questões para avaliação da aprendizagem
1. O que vem a ser Amostragem? ----------------------------------------------------2. Existe uma inconsistência na expressão “tabela de números aleatórios”. Qual
é? -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------3. Os prontuários de um hospital estão organizados em um arquivo, por ordem
alfabética. Qual é a maneira mais rápida de se amostrar 1/3 desses prontuários?
-----------------------------------------------------------------------------------------------4. Um pesquisador possui dez gaiolas com seis ratos cada uma. Que técnica de
amostragem ele deverá usar para selecionar uma amostra que contenha 10
ratos? ---------------------------------------------------------------------------------------5. dada uma população de 4 pessoas, Antônio, Luiz, Pedro e Carlos, quantas
amostras casuais simples de 2 pessoas podem ser obtidas? Quais são essas
amostras?
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------6.dada uma população de 40 alunos, descreva duas formas de se obter uma
amostra casual simples de 6 alunos.
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------7. Dada uma população de 8 elementos, A, B C, D, E, F G e H, descreva duas
formas diferentes de obter uma amostra sistemática de 4 elementos.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------8. Para levantar dados sobre o número de filhos por casal, em uma comunidade,
uma pesquisadora organizou um questionário que enviou pelo correio, a todas
as residências. A resposta ao questionário era facultativa, pois a pesquisadora
não tinha condições de exigir a resposta. Nesse questionário perguntava-se o
número de filhos por casal morador na residência. Você acha que os dados
assim obtidos têm algum tipo de tendenciosidade? Explique.
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------9. Considere uma população N = 300. Obter uma amostra de tamanho 15,
usando a amostragem sistemática.
------------------------------------------------- ---------------------------------------------------------------------------------------------- ---------------------------------------------------------------------------------------------- ---------------------------------------------------------------------------------------------- ---------------------------------------------10. O quadro abaixo é uma lista de um grupo de seminário de alunos cursando a disciplina
Introdução à Estatística. Com o auxílio da tabela de dígitos pseudo-aleatórios a seguir, você é
solicitado a selecionar uma amostra de 4 pessoas que receberão uma medalha pelo excelente
desempenho na referida disciplina., utilizando:
a. Amostragem aleatória simples
b. Amostragem aleatória estratificada
c. Amostragem aleatória sistemática
Nome
Adeflávia
Allan
Alex
Anne
Antony
Audilan
Chirley
Demiglei
Nome
Elaine
Joséph
Kellen
Manoel
Marcus
Natály
Simony
Thais
4.
SÉRIES ESTATISTICAS
São assim chamadas as tabelas estatísticas nas quais existe um critério
distinto que as especifica e diferencia. Segundo esse critério podemos classificar
as séries estatísticas em:
4.1. Séries Cronológicas ou Temporais
O tempo é variável, enquanto o local e o fato permanecem fixos.
4.2 Séries Geográficas ou de Localização
O local é variável, enquanto o tempo e o fato permanecem constantes.
4.3 Séries Específicas ou de qualidade
Apresentam o local e o tempo constantes, enquanto o fato é que varia.
4.4 Séries Conjugadas ou Mistas
Pode existir uma combinação das séries cronológicas, geográficas e
específicas.
4.5 APRESENTAÇÃO TABULAR DE SÉRIES ESTATÍSTICAS
A apresentação segue as normas, segundo a Fundação IBGE.
4.5.1
Componentes das Tabelas
Título
Corpo
Cabeçalho
Rodapé
Explica o que a tabela contém
Formado pelas linhas e colunas de dados.
Especifica o conteúdo das colunas e a coluna Indicadora
especifica o conteúdo das linhas
Especifica notas, chamadas e fontes, se for o caso.
A tabela 4.1 mostra um exemplo
Tabela 4.1
Casos registrado de intoxicação humana, segundo a causa
determinante, Brasil,1993
Causa
Acidente
Abuso
Suicídio
Outras
Ignorada
Freqüência
29.601
2.604
7.965
1.959
1.103
Fonte: MS/FIOCRUZ/SINITOX
Observe que o título deve responder as seguintes questões:
O que? (referente ao fato)
= casos de intoxicação humana
Onde?
( relativo ao lugar)
= Brasil
Quando? ( correspondente ao tempo) = 1993
O Cabeçalho é constituído pelas palavras:
Causa
Freqüência
O Corpo é formado pela Coluna Indicadora e pelos números:
Acidente
Abuso
Suicídio
Profissional
Outras
Ignorada
29.601
2.604
7.965
3.735
1.959
1.103
Toda e qualquer tabela:
Limitada por traços verticais para separar as colunas;
Não devem ser feitos traços verticais para delimitação;
Apresentar, além das freq. absolutas, as freq. relativas e o total;
Rodapé colocar fonte, notas e chamadas, se for o caso.
Fonte dá indicação da entidade, ou do pesquisador(es) que publicou
(aram) ou forneceram os dados
Tabela 4.2
Nascidos vivos registrados segundo o ano de registro
Ano do registro
1984
1985
1986
Freqüência
2 559 038
2 619 604
2 779 253
Fonte: IBGE (1988)
Nota: Nascimentos ocorridos no ano de registro
As Chamadas dão algum esclarecimento sobre os dados. Devem ser feitas
através de algarismos arábicos escritos entre parênteses, e colocadas à direita da
coluna. .
4.5.2 Tabelas de Contingência
As tabelas de contingência, ou de Dupla Entrada, são tabelas em que os
elementos da amostra ou da população foram classificados de acordo com dois
fatores. Vela a tabela 4.3:
Tabela 4.3
Nascidos vivos segundo o ano de registro e o sexo
Ano
de registro
Sexo
Masculino %
Total
Feminino
1984
1985
1986
1 307 758
1 339 059
1 418 050
4 064 867
1 251 280
1 280 545
1 361 203
3 893 028
%
%
2 559 038
2 619 504
2 779 253
7 957 795
Fonte: IBGE (1988)
Nota: Nascimentos ocorridos no ano de registro
5. TABELAS DE DISTRIBUIÇÃO DE FREQÜÊNCIAS
Os dados encontram-se dispostos em classes ou categorias com suas
freqüências correspondentes. Existem dois tipos:
5.1 Tipo A – Variável Discreta
Neste caso a variável assume valores em pontos da reta real, podendo-se
enumerar todos os possíveis valores. Geralmente esta variável assume valores
inteiros e são provenientes da contagem do número de itens.
Exemplos:
Número de aprovações em Estatística no 2º período de Economia;
Internações em estabelecimentos de saúde;
Produção horária de circuitos integrados, num dia em uma empresa;
Número de manutenções preventivas em redes de computadores.
Considere X o número de erros em declarações de imposto de renda numa
determinada região no ano de 2003
Nº de erros (Xi)
0
1
2
3
4
5
Nº de prontuários (fi) :
35
20
13
6
4
2
Onde
Xi
fi
N
n
=
=
=
=
Indica os elementos
freqüência absoluta
Tamanho da população
Tamanho da amostra
80
5.2 Tipo B –Variável Contínua
A Variável Contínua assume valores em intervalos da reta real, não é
possível enumerar todos os seus valores. Geralmente esta variável provém de
medições.
Exemplos:
Peso dos alunos de uma classe;
Pressão arterial, em milímetros de mercúrio, de pacientes, durante um plantão;
Altura dos alunos de Introdução à Estatística.
Exemplo:
Consideremos uma amostra do QI de 50 alunos de Economia:
110
115
107
109
119
120
94
105
110
111
129
101
103
131
124
141
141
133
111
106
101
93
121
114
118
107
103
91
132
102
121
118
127
119
101
119
122
135
113
101
115
128
123
116
118
Para montar a tabela de distribuição de freqüências, vamos necessitar de alguns
conceitos e definições.
1 – Dados Brutos: São aqueles que ainda não foram numericamente
organizados, como é o caso dos 50 resultados do QI.
2 – Rol: É o arranjo dos dados brutos em ordem crescente ou decrescente. Esta
tabulação pode ser feita de várias formas, porém usaremos o processo
desenvolvido por Tukey, chamado de Steam-and-leaf, ou seja, Ramo e folhas.
9
10
11
12
13
14
1, 3, 4
1, 1, 1, 1, 2, 3, 3, 4, 5, 6, 7, 7, 7, 9
0, 0, 1, 1, 3, 4, 5, 5, 6, 8, 8, 8, 9, 9, 9, 9,
0,1, 1, 1, 2, 3, 4, 6, 7, 8, 9
1, 2, 3, 5
1, 1
3 – Amplitude Total (A): diferença entre o maior e o menor valor.
A = X máx – X min
A = 141 – 91 = 50
Devemos agora agrupar os dados em classes e associar a cada classe i, i =
1,2, 3, ....., k, às freqüências absolutas fi dos valores observados das respectivas
classes.
4 – Número de Classes (K): È o número de classes necessário para representar o
fato. Existem vários critérios que podem ser utilizados, porém tais critérios
servirão apenas como indicação e nunca como regra fixa,
Muitos estatísticos, sugerem a fórmula de Struges como a mais apropriada .
k = 1 + 3,22 . log n
Neste caso, temos k = 1 + 3,22 .log 50 = 1 + 3,22 . 1,69897 = 6,47068
Podemos optar por 6 ou 7 classes. Optaremos por 7 classes.
5 – Amplitude de Classe (h): É a diferença entre os limites superior e inferior
da classe. Daí,
h = A:k
e, no nosso exemplo, h = 50 / 7 = 7,1428
h =7
Obs. 1 - Optar por intervalos de classes iguais.
2- As distrib. poderão apresentar intervalos de classes da seguinte forma:
91
98
Classes
91
98
98
105
105
112
112
119
119
126
126
133
133
140
140
147
91
98
Tabulação
///
////////
//////////
////////
///////////
//////
//
//
91
98
91
98
fi
3
8
10
8
11
6
2
2
O próximo passo será formar a tabela de dados agrupados em classes de
freqüências.
Para tanto será necessário definir:
Xi = Ponto médio da classe i;
f i = freqüência absoluta da classe i;
Fi = Freqüência Absoluta Acumulada da classe i;
f r = freqüência relativa da classe i;
Fr = Freqüência Relativa Acumulada da classe i;
Tabela dos Dados Agrupados em Classes de Freqüências.
Classes
91
98
105
112
119
126
133
140
98
105
112
119
126
133
140
147
Xi
94,5
101,5
108,5
115,5
122,5
129,5
136,5
143,3
--
fi
Fi
fr
Fr
3
8
10
8
11
6
2
2
50
3
11
21
29
40
46
48
50
--
0,06
0,16
0,20
0,16
0,22
0,12
0,04
0,04
1,00
0,06
0,22
0,42
0,58
0,80
0,92
0,96
1,00
Questões para avaliação
1- O que é uma série estatística?
2- Como se classificam as séries estatísticas?
3- Faça uma pesquisa e dê um exemplo de cada um tipo de série que você
respondeu no item anterior.
4- Quantos e quais são os elementos que não podem deixar de estar presentes
numa série estatística?
5- Quais são os critérios que especificam e diferenciam uma série estatística?
6- Cite três exemplos de variáveis discretas e contínuas.
7- Construa uma tabela de distribuição de freqüências para apresentar os dados
da tabela abaixo.
Sugestão: Use a fórmula de Struges e log de 49 = 1,6902
Pressão arterial, em milímetros de mercúrio, de cães adultos
anestesiados e após laparotomia
130,0
107,5
135,0
100,0
134,5
121,5
1 05,0
125,0
130,0
145,0
158,5
135,0
120,0
100,0
135,0
125,0
110,0
102,0
111,5
107,5
127,5
104,5
102,5
119,5
99,0
120,0
90,5
101,5
90,5
115,5
116,0
143,0
104,5
132,5
107,5
125,5
82,5
115,0
136,5
101,5
124,0
117,5
107,5
140,0
121,5
107,5
113,0
93,0
103,5
08- Considere o grau em estatística de 32 estudantes , descritos abaixo:
6,0
8,0
2,0
4,0
0,0
7,0
5,0
4,5
2,0
8,5
5,5
4,0
6,5
6,0
5,0
1,0
5,0
4,5
7,0
5,5
3,3
0,0
1,5
3,5
4,0
6,5
5,0
2,5
7,0
6,0
5,0
4,5
determinar:
a) O rol
b) A amplitude total
c) A distrib. de freq. (Sugestão: iniciar por “0” e intervalo de classe de “1,5”)
d) Qual a porcentagem de alunos que tiraram nota menor do que 4?
e) Qual a porcentagem de alunos que tiraram nota entre 5 e 7 inclusive?
f) Qual o limite inferior da 4ª classe?
g) Qual o ponto médio da 3ª classe?
h) A freqüência absoluta acumulada
6.
APRESENTAÇÃO GRÁFICA DE SÉRIES ESTATÍSTICA
Servem para permitir uma visão rápida e global do fato estudado. Os
gráficos devem ser construídos de uma maneira clara e simples, de tal sorte que
o observador entenda facilmente aquilo que o gráfico busca evidenciar. Todo
gráfico deve apresentar:
Título - Pode ser colocado tanto acima como abaixo do gráfico.
Escalas - Devem crescer da esquerda para a direita e de baixo para cima.
Legendas - Devem ser colocadas, de preferência, à direita do gráfico.
6.1 – Gráfico de Barras
Figura 6.1
Internações em estabelecimentos de saúde, por clínica
especializada. IBGE 1992
Outras
Pediatria
Cirurgia
Ginecologia e Obstetrícia
Clínica Médica
0
5
10
15
20
25
Freqüência relativa
30
35
6.2 Gráfico de Setores
São representados por meio de setores em um círculo
Figura 6.2 Internações em estabelecimentos de saúde, por clínica
especializada. IBGE 1992
Clinica médica
Ginecologia e obstetrícia
17,69
32,51
Cirurgia
14,82
Pediatria
15,26
Outras
19,73
6.3 Histograma
È a representação gráfica através de retângulos adjacentes, cuja base
corresponde aos intervalos das classes, e a altura é proporcional à freqüência
absoluta das classes.
Considerando a distribuição de freqüências da tabela 6.1 vamos construir
seu histograma que está representado na figura 6.3:
Tabela 6.1
Cães adultos anestesiados e após laparotomia, segundo a pressão arterial, em milímetros de
mercúrio
Classe
80
90
100
110
120
130
140
150
90
100
110
120
130
140
150
160
Xi
fi
Fi
85
95
105
115
125
135
145
155
1
4
16
8
9
7
3
1
1
5
21
29
38
45
48
49
-------
49
-------
Figura 6.3 Cães adultos anestesiados e após laparotomia, segundo a pressão
arterial em milímetros de mercúrio.
fi
16
14
12
10
8
6
4
2
0
80
90
100
110
120
130
140
150
160
h
O histograma pode ser usado para as seguintes finalidades:
Tomar medidas corretivas;
Comparar materiais, máquinas e operadores
Medir os efeitos de ações corretivas;
Comparar métodos de trabalho e avaliar a capabilidade de máquinas
Comparar as influências ambientais, físicas ou psicológicas, sobre os
operadores
6.4 Polígono de Freqüências
É a representação gráfica de uma distribuição de freqüências por meio de
um polígono, onde os pontos são obtidos por perpendiculares traçadas a partir
dos pontos médios das classes e de alturas proporcional à freqüência de cada
uma das classes. No caso de freqüências acumuladas, os segmentos
perpendiculares são traçados a partir dos limites superiores da classe. Em ambos
os casos, o primeiro e o último ponto são colocados de modo a manter a
proporcionalidade do gráfico Ver figura 6.3em azul
6.5 Gráfico Linear ou de Curva
São gráficos em duas dimensões, baseados na representação cartesiana dos
pontos no plano. Servem para representar séries cronológicas, onde o tempo é
colocado no eixo das abcissas e os valores observados no eixo das ordenadas.
Ver figura 6.4 e dados da tabela 6.2.
Tabela 6.2
Casos registrados de dengue no Estado de Pernambuco, 1995 – 2002
Ano
1995
1996
1997
1998
1999
2000
2001
Casos
Registrados
Confirmados
9.982
22.722
40.277
83.508
34.414
27.314
15.075
6.789
12.205
20.916
38.014
25.733
21.756
10.935
Fonte: Funasa-Secretaria de Saúde do Estad
Figura 6.4 Casos de dengue registrados no Estado de Pernambuco,
Período : 1995 – 2001
Nº Casos
(milhares)
90
casos registrados
80
casos confirmados
70
60
50
40
30
20
10
0
95
96
97
98
99
00
01
02
Anos
OBS – Existem ainda, os gráficos polares que servem para representar séries
cronológicas , os gráficos pictóricos e os cartogramas que são gráficos
baseados em mapas, utilizados para representar séries geográficas.
Teste seus conhecimentos
1. Traçar dois eixos coordenados e representar os pontos:
A (0 , 2)
E (- 1,5 ; 3)
B (4 , 3)
F (0 , 0)
C (-3 ; 2,5)
G (-5 , 0)
2. Traçar um triângulo cujos vértices são:
X (1 , 2)
B(!,3)
C ( -2 ; -1 )
4. Com a distribuição de freqüências abaixo, construir:
a) Histograma de freqüência simples;
b) Histograma de freqüência acumulada crescente;
c) Polígono de freqüência simples;
d) Polígono de freqüência acumulada crescente;
e) Curva de freqüência simples;
f) Curva de freqüência acumulada crescente.
Remuneração dos operários da empresa “X” – julho 2004
Salário-hora (R$)
6
9
10
13
15
17
19
21
a
a
a
a
a
a
a
a
8
10
12
14
16
18
20
22
Freqüência fi
(nº de operários)
8
16
42
30
21
12
8
3
D (-2,- 4)
H ( -2,5 ; -1)
7
MEDIDAS DE TENDÊNCIA CENTRAL
As medidas de tendência central, dão o valor do ponto em torno
do qual se distribuem os dados. Em outras palavras, representam os
fenômenos através dos seus valores médios, em torno dos quais
tendem a concentrar-se os dados.
.
7.1 Média Aritmética – Dados não-agrupados
Sejam X 1, X 2, X 3, . . . . ,X n, um conjunto com “n”
elementos, retirados de uma população “X”.
Definimos a média aritmética de “X”, como sendo:
X=
Xi /n
Exemplo
Calcular a média aritmética dos dados da tabela 7.1
Tabela 7.1
Peso, em gramas, de ratos machos da raça Wistar com 30 dias de idade
50
62
70
86
60
64
66
77
58
55
82
74
A média aritmética será dada por:
X
(50 + 86 + ..... + 74 )/12 = 804/12 = 67
x = 67
7.1.2 Média Aritmética – Dados agrupados
Quando os dados estiverem agrupados numa distribuição de
freqüências, usaremos a média aritmética dos valores X1, X2, X3, . . .
, Xn ponderados pelas respectivas freqüências absolutas; f1, f2, f3, . . .
,fn .
X =(
Xi fi)/n
onde
n=
fi
Exemplo
Tabela 7.2
Nascidos vivos segundo o peso ao nascer, em quilogramas
Classe
i
Ponto médioFreqüência
Xi
fi
Xi . fi
1,5
2,0
2,0
2,5
1,75
2,25
3
16
5,25
36,00
2,5
3,0
2,75
31
85,25
3,0
3,5
3,25
34
110,50
3,5
4,0
3,75
11
41,25
4,0
4,5
4,25
4
18,00
4,5
5,0
4,75
1
4,75
--------
100
300,00
(Somatório)
Daí, X = 300,00/100 = 3
7.2
X = 3,00 kg
A Mediana
A mediana é o valor que ocupa a posição central de uma distribuição de
dados ordenados em ordem crescente.
Se a amostra for de tamanho ímpar, como por exemplo: 1, 4, 6, 9 e 11, a
mediana é o 6.
Sendo a amostra de tamanho par, como por exemplo: 1, 5, 7, 10, e 11, a
mediana será a semimédia dos termos centrais. Nesse caso temos:
Md =
(7 + 8)/2 = 7,5
M d = 7,5
A mediana dá o valor da abscissa do ponto que delimita a metade dos
dados. Considere, então os dados apresentados na tabela 7.1, já ordenados em
ordem crescente:
50, 55, 58, 60, 62, 64, 66, 70, 74, 77, 82, e 86
Como nessa amostra o número de elementos é par (n = 12), a mediana é a
média aritmética dos dois valores centrais, ou seja, a mediana é:
Md = (64 + 66) / 2 = 65
Para o caso de uma distribuição de freqüências de dados agrupados em
classes, usaremos a seguinte expressão:
n
2
Md = l md +
fi
.h
f md
l md = Lim. Inf. da classe que contém a Md
n = Tamanho da amostra
f = Somatório das freq. anteriores à Md
h = Amplitude da classe Md
fmd = Freqüência da classe Md
Para a utilização desta fórmula, vamos utilizar os dados da tabela 7.3 e
calcular a mediana:
Tabela 7.3
Classes
fi
Fi
35
45
5
5
45
55
12
17
55
65
18
35
65
75
14
49
75
85
6
55
85
95
3
58
58
------
Classe que contém a Md (3ª classe)
1º Passo : Calcula-se n / 2. Como n = 58, temos 58 / 2 = 29º
n / 2 = 29º
2º Passo: Identifica-se a classe mediana pela freqüência acumulada Fi. Neste
caso, a classe mediana é a 3ª.
3º Passo : Aplica-se a fórmula. Nesse caso, temos:
l m d = 55;
n = 58;
fi = 17;
h = 10;
f m d = 18.
Daí,
M d = 55 +
7.3
(58/2) 17
18
. 10 = 61,87 ou
Md
62
A Moda
A moda é o valor que ocorre com mais freqüência em uma distribuição.
Aplicação
Tabela 5.4
Indivíduos, segundo o tipo de sangue
Tipo de sangue
Freqüência
O
A
B
AB
547
441
123
25
Fonte : GARCIA (1977)
Para tabelas de distribuição de freqüências, usaremos a fórmula de Czuber.
1º Passo : Identifica-se a classe modal. A classe modal é aquela que possui
maior freqüência.
2º Passo : Aplica-se a fórmula:
M o = l i+
1/
(
1 + 2)
.h
Onde:
l i = Limite inferior da classe modal;
1 = Diferença entre a freq. da classe modal e a imediatamente anterior a ela;
2 = Diferença entre a classe modal e a imediatamente posterior a ela;
h = Amplitude da classe.
Como aplicação, considere os dados da tabela 7.3.
Neste caso, a classe de maior freqüência é a 3ª classe, então:
l = 55;
Portanto :
1
= 18
12 = 6;
2
= 18
14 = 4;
e
h = 10.
6
Mo = 55 +
. 10
Mo = 61
6 + 4
Questões para avaliação
1. Dados os salários anuais de três jornalistas autônomos,calcule a média, a mediana e a
moda. Que medida de tendência central fornece a medida resumo mais adequada?
R$ 17.000
R$ 18.000
R$ 20.000
R$ 23.000
R$ 65.000
2. Considere a seguinte série: 4, 5, 6, 6, 6. 7, 8,
a) Calcule a média, a moda e a mediana
b) Substitua o valor 8 pelo valor 18 e faça novamente os cálculos. O que aconteceu com a
média.
c) Que conclusão você pode tirar a respeito desse fato?
2. Calcule o peso médio dos ratos em cada idade, baseado nos dados fornecidos pela tabela a
seguir:
Peso, em gramas, de ratos machos da raça
Wistar segundo a idade, em dias
Nº do
rato
1
2
3
4
5
6
30
76,2
81,5
50,0
47,5
63,5
65,1
34
95,5
90,0
60,0
50,0
79,2
75,7
Idade
38
42
99,2 122,7
101,2 125,9
62,3 72,2
57,5 72,3
82,1 94,7
79,3
88,5
46
134,6
136,2
85,3
84,0
110,0
98,7
Fonte: GUIMARÃES et aili ( 1979)
Com base nos resultados obtidos responda:
a) A média de peso é maior nos ratos com quantos dias?
b) A média de idade é menor nos ratos com quantos dias?
c) Pode-se afirmar, que o peso médio dos ratos aumenta com a idade?
3. Determine a mediana dos dados apresentados na tabela a seguir e interprete o resultado
obtido:
Percentual de água em cérebros de cobaias machos com 90 dias de idade
80,06 68,97 79,85 79,87
Fonte : HOSSNE et alii (1990)
79,86
68,86
79,90
79,91
79,55
79,25
4. Calcule a média aritmética, a mediana e a moda dos dados apresentados na tabela 4.5.
Tabela 5.5
Taxa de glicose, em miligramas por 100 ml de sangue,
em ratos machos da raça Wistar, com 20 dias de idade
97,5
100,0
85,0
85,0
97,0
80,0
100,0
80,0
Fonte: GUIMARÂES et alii (1979)
5. Suponha que você não se encontrando em sua profissão, resolveu entrar no ramo de
Delivery de alimentos e após 40 semanas de vendas, resolveu fazer um levantamento geral
das atividades. O quadro abaixo mostra os valores das vendas em milhares de R$:
16
34
21
17
29
20
27
24
16
19
24
19
19
22
20
21
24
11
17
17
17
14
18
22
18
13
23
23
20
19
18
26
19
20
20
22
22
26
24
20
Com base nas suas vendas,
Determinar:
a) o rol; (sugestão: Faça o rol usando o processo de ramo e folha)
b) a amplitude máxima;
c) Amplitude de classes de freqüências;
d) distribuição em classes de freqüências;
Elaborar:
e) histograma;
f) histograma de freqüência acumulada;
g) polígono de freqüência simples;
h) polígono de freqüência acumulada;
Calcular:
a) a média;
b) a mediana;
c) a moda