Caderno de Orientação de Aulas - 1ª Unidade
Transcrição
Caderno de Orientação de Aulas - 1ª Unidade
Autarquia Educacional do Vale do São Francisco - AEVSF Faculdade de Ciências da Aplicadas e Sociais de Petrolina – FACAPE Curso: Economia Disciplina: Introdução a Estatística Período : 2º Professor : Reginaldo Santos Caderno de Orientação de Aulas - 1ª Unidade [Baseado no conteúdo programático e bibliografia indicada] Caderno para acompanhamento do conteúdo da disciplina de Probabilidade e Estatística para o Curso de Ciências da Computação. Faz-se necessário o devido acompanhamento das aulas e da Bibliografia Indicada. Petrolina – 2004 Aulas 01 e 02 – CONTEÚDO PROGRAMÁTICO PONTOS RELEVANTES PARA UMA BOA QUALIDADE DO CURSO I – 1ª AVALIAÇÃO : 27/09 Período: 02/08 A 23/09 1. Arredondamento de Números/Cálculo com Somatórios 2. População e Amostra 3. Técnicas de Amostragem 4. Tabelas Estatísticas 5. Séries Estatísticas - Gráficos 6. Distribuição de Freqüências 7. Medidas de Tendência Central II – 2ª AVALIAÇÃO : 22/11 Período: 04/10 A 18/11 1. Medidas de Posição 2. Medidas de Dispersão 3. Medidas de Assimetria 4. Medidas de Curtose 5. Cálculo das Probabilidades - Introdução III – 3ª AVALIAÇÃO: 25/11 - FINAL : 29/11 Todo o Conteúdo IV - ESCLARECIMENTOS Não cumprir carga hor. implica em alguma compensação; Horário: Evitar Atrasos. Esteja na sala sempre no horário; Presença: 75% --- Limite de Faltas 25% = 8 h/a Faltas (Aluno) - $ Processo Adm. ♀ Prof. não tem Autonomia (Professor) ☼ Casos extremos, e☺ Aviso com antecedência Parceria Responsável Relação Cliente / fornecedor Material: Caderno de Orientação, aulas, trabalhos e provas Int WWW.facape.br/reginaldo [email protected] V – BIBLIOGRAFIA Básica: Martins, Gilberto de Andrade. Estatística Geral e Aplicada. SP: Atlas2001 Spiegel, Murray R. Estatística. SP: Mc gras-Hill. 3ª edição 1993 1. CONCEITO – O QUE É ESTATÍSTICA CORRIQUEIRA – Ramo da matemática que se encarrega de coleta, organização, apresentação e análise de dados bem como na obtenção de conclusões válidas e na tomada de decisões baseada em tais análises. CLÁSSICA – Conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos. (Dugé de Bernonville) OBJETIVO – Estudo dos fenômenos coletivos e das relações que existem entre eles. EM RESUMO Coletar Organizar Analisar Interpretar 2. POPULAÇÃO E AMOSTRA 2.1 POPULAÇÃO OU UNIVERSO - Conjunto de elementos ou indivíduos que têm em comum pelo menos, uma determinada característica. 2.2 POPULAÇÃO Finita - Número de unidades de observação pode ser contado e é limitado Infinita – Quantidade de unidades de observação é ilimitada ou a sua composição é tal que as unidades não podem ser identificadas 2.3 AMOSTRA – Todo subconjunto não vazio e com um número de elementos menor do que a população. EXEMPLO 1. População: 50 sabores de sorvete ofertados por uma confeitaria. Amostra : seis sabores testados para avaliação do sabor. 2. População: produção de parafusos num certo dia em uma fábrica Amostra: Seleção de 10% para testar a capabilidade do processo Quando coletamos informações de todos os elementos de uma população, estamos fazendo um Recenseamento. Daí, 2.4 CENSO – Conjunto de dados que foram obtidos através de um recenseamento 2.5 AMOSTRAGEM - Informações de apenas parte da população LEMBRE-SE 2. Como é dispendioso , difícil e por vezes impraticável ter acesso a toda uma população, costuma-se escolher uma amostra aleatória e estudá-la. 1. Para evitar predições imprecisas é essencial que a amostra represente efetivamente a população da qual foi extraída. 2. Conheça os conceitos 1. O que é Estatística --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------2. Qual é o objetivo da Estatística? -----------------------------------------------------------------------------------------------------------------------------------------------3. Por que os pesquisadores estudam amostras e não populações? -------------------------------------------------------------------------------------------4. Como podemos dizer se uma determinada amostra representa adequadamente uma população? ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------5. Qual a diferença entre população e amostra? ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------6. Responda pela descrição de cada sentença: a) Descreve e analisa determinada população, sem no entanto fazer conclusões de caráter mais genérico ---------------------------b) Coleta informações de todos os indivíduos de uma população-------------------c) Processo pelo qual se seleciona amostras para estudo ----------------------------d) Existe apenas no campo teórico e possui um número infinito de elementos----------------------------------e) Qualquer subconjunto não vazio e menor que a população ----------------------- f) Conjunto de dados obtidos através de um recenseamento ------------------------g) Seu número de elementos é ilimitado -----------------------------------------------h) Ao se descrever uma população, deve-se diferencias unidades de observação das características dessa população. Suponha então: Numa população de municípios, qual é? - unidade de observação ------------------------------------- características -----------------------, -------------------------, -----------------------População de alunos da rede municipal de ensino - unidades de estudo ou observação --------------------------------------------------- características -----------------------, ------------------------- , ----------------------População dos 60 tipos de pizzas de um restaurante - unidade de observação ----------------------------- características ------------------------ , ------------------------, -----------------------Suponha que você seja um pesquisador e está fazendo um experimento em que deve dividir os elementos em dois grupos: um grupo experimental e um grupo de controle. Então responda: a) Por que, devem os grupos ser tão semelhantes quanto possível? b) As pessoas devem saber em que grupos estão? Porque? c) Qual a melhor maneira de repartir os indivíduos pelos dois grupos? 3. TÉCNICAS DE AMOSTRAGEM 3.1 AMOSTRAGEM – Método ou procedimento adotado para selecionar uma amostra que seja representativa da população em estudo. 3.1.1 AMOSTRAGEM CASUAL SIMPLES A amostra se diz Casual Simples ou Aleatória quando ela é composta por elementos retirados ao acaso da população, tendo como principal característica, a chance de cada elemento ser incluído na amostra, ou seja, a mesma chance ou probabilidade de ser selecionado. Para populações pequenas, o método de sorteio através de uma urna, um “chapéu”, etc. resolve o problema. Para populações maiores utiliza-se a chamada tabela de números aleatórios. Tabela 1.1 - Tabela de dígitos pseudo-aleatórios 87404 85585 42231 25702 70634 36277 43498 33842 36567 92211 76732 11139 40104 32956 04947 29005 12631 52870 39713 57097 34275 82952 19651 32471 18659 07260 01465 41218 10199 05310 63460 12601 93837 01535 21540 25712 17322 28199 57743 28583 77510 44325 79643 74599 96184 29743 38743 36732 36390 62538 09274 24265 86934 50825 61694 24451 19681 60103 34379 40849 72783 74590 95406 87676 96346 21042 72197 44554 60673 55088 39619 74074 26941 10047 72209 01877 80412 08273 58632 59227 18607 04108 65693 72533 92226 10758 40705 60307 04895 98491 71907 81404 29551 10259 67845 76125 5 2571 80452 99001 94063 23978 48185 04416 16373 20374 88546 10843 90526 20325 52223 64384 77571 92250 19330 74626 11923 94817 65394 71291 73613 09842 85451 48194 69057 95549 50602 43162 91527 16095 65401 60597 41489 33982 97417 12732 01544 84328 55705 38532 38923 23697 42729 83748 38697 41435 68834 43519 99465 33485 29185 67430 91573 38725 43229 27106 77809 37797 56648 46287 96611 96209 03241 22226 85988 31965 30982 46443 45957 20392 43647 42674 53593 29066 46696 60542 50541 70210 83693 31995 87059 54203 80440 31098 22403 55601 01611 46272 37708 91640 19910 65074 61400 13263 97695 71464 07059 08634 81127 55564 23835 53328 82735 55003 33213 71345 94362 47578 16855 79698 12168 68358 29590 53001 95159 09500 78111 01856 00534 28660 55781 54887 51289 69676 41480 60704 66279 45790 60936 52354 52790 85344 10526 74272 61635 39979 43635 71739 04721 55348 19465 95922 40717 83617 94890 94976 27927 32484 16181 77541 26249 76482 46446 00659 32508 16086 70698 90755 11408 17804 76402 82634 92809 52058 56996 13678 81474 43577 27900 30445 79360 34293 55033 07837 20362 58732 95839 80724 17585 31892 52781 62584 42185 92284 57576 85854 94353 99120 88362 29737 86730 43815 65971 08206 07361 94085 20130 67427 53147 32053 85704 40818 38032 40592 92153 66658 63722 52150 15473 68147 52879 60069 92672 95983 44831 92427 98699 33445 53773 48356 85912 87010 67149 06738 03079 16730 29023 26310 92748 66984 62123 75038 33219 57191 66765 42362 81017 72700 79216 36985 39747 99556 47087 27860 91744 71764 17215 97738 42198 31055 36060 09146 75810 99163 62593 82955 25922 62562 93694 89330 56169 17264 87306 20075 85741 97115 67265 39948 72603 30704 20475 06647 95748 75795 52623 74101 48487 04855 74049 50990 95394 00772 73570 77699 77358 15036 54808 65764 79195 88466 35023 99834 59694 34397 06439 02109 44212 84398 60072 59318 79759 Para usar uma tabela de números pseudo-aleatórios, seguir os seguintes passos: 1.Listar os elementos da população; 2.Enumerar consecutivamente as unidades, a começar pelo número 1; 3.Proceder a leitura dos números na tabela de dígitos pseudo-aleatórios de tal forma que o total de algarismos em cada um deles coincida com o total de algarismos do último número da listagem 4.Identificar as unidades a serem incluídas na amostra. Aplicação O quadro abaixo fornece a relação das 30 maiores empresas privadas do Brasil, em vendas , em julho de 1988. Usando a tabela de dígitos aleatórios , selecione uma amostra de 8 empresas para serem entrevistadas em detalhes quanto suas estratégias de crescimento. Tabela 1 – Maiores empresas sediadas no Brasil, em vendas – jul/98 Empresa Volkswagen GM Fiat Automóveis Shell Souz Cruz Carrefoul Ipiranga Ford Brahma Nestlé-S.P. Gessy Lever Texaco Esso Pão de Açúcar Varig 3.1.2 Empresa Vale do Rio Doce Cotia Mercedes-Benz CSN IBM Light Casas Bahia Usiminas Lojas Americanas Multibrás Ceval Copersucar Cargill Credicard CPFL Amostra Amostragem por Estratificação A amostra estratificada é composta por elementos provenientes de todos os estratos de uma população. Para separar os estratos devemos usar, sempre, uma variável critério. Aplicação Dada uma população de 50.000 trabalhadores da indústria automobilística, selecionar uma amostra de 5% desses trabalhadores para estimar o salário médio. Cargos Chefes de Seção Operários especializados Operários não especializados Total População 5.000 15.000 30.000 Amostra A amostragem por estratificação possui as seguintes características: Dentro de cada estrato, há uma grande homogeneidade, ou então uma pequena variabilidade; Entre os estratos, há uma grande heterogeneidade, ou então uma grande variabilidade. 3.1.3 Amostragem por Conglomerados Consideramos conglomerados os grupos de elementos ou indivíduos com as seguintes características: Dentro de cada conglomerado, há uma grande heterogeneidade, ou então uma grande variabilidade; Entre os conglomerados, há uma grande homogeneidade, ou então uma pequena variabilidade. Aplicação Se estivermos interessados, por exemplo em estudar o salário médio dos operários da indústria automobilística, podemos selecionar uma montadora e, dentro dela, fazer as devidas estimativas. Observe que agora há uma mudança fundamental na unidade de sorteio, pois passamos de elemento para grupo 3.1.4 Amostragem Sistemática Este tipo de amostragem é bastante semelhante à amostragem aleatória simples. Se considerarmos uma população de tamanho ”N” e dela retirarmos uma amostra de tamanho “n” Definimos : S= N n fator de sistematização ou passo Técnica Sorteamos um número entre 1 e S. Seja “m” esse número; O 1º elemento da amostra é o m; O 2º elemento = S + m O 3º elemento = S + 2m E assim sucessivamente até que se complete o tamanho da amostra OBS - O importante para esse tipo de amostragem é que a população esteja ordenada, por exemplo, em nomes de uma lista telefônica ou em números de logradouros de uma rua, etc. Aplicação De uma população composta de 1.000 elementos ordenados, retirar uma amostra sistemática de tamanho 10. Solução 1. Faz-se S = N n = 1.000 100 = 10 S = 10; este será o passo; 3. Sorteia-se 1 m 10 . Suponha que seja 5. Daí, teremos: 1º elememto ........................... 5º 2º elemento ............................ 15º 3º elemento ............................ 25º ...................................................... 100º elemento ........................ 995º Questões para avaliação da aprendizagem 1. O que vem a ser Amostragem? ----------------------------------------------------2. Existe uma inconsistência na expressão “tabela de números aleatórios”. Qual é? -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------3. Os prontuários de um hospital estão organizados em um arquivo, por ordem alfabética. Qual é a maneira mais rápida de se amostrar 1/3 desses prontuários? -----------------------------------------------------------------------------------------------4. Um pesquisador possui dez gaiolas com seis ratos cada uma. Que técnica de amostragem ele deverá usar para selecionar uma amostra que contenha 10 ratos? ---------------------------------------------------------------------------------------5. dada uma população de 4 pessoas, Antônio, Luiz, Pedro e Carlos, quantas amostras casuais simples de 2 pessoas podem ser obtidas? Quais são essas amostras? ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------6.dada uma população de 40 alunos, descreva duas formas de se obter uma amostra casual simples de 6 alunos. ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------7. Dada uma população de 8 elementos, A, B C, D, E, F G e H, descreva duas formas diferentes de obter uma amostra sistemática de 4 elementos. --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------8. Para levantar dados sobre o número de filhos por casal, em uma comunidade, uma pesquisadora organizou um questionário que enviou pelo correio, a todas as residências. A resposta ao questionário era facultativa, pois a pesquisadora não tinha condições de exigir a resposta. Nesse questionário perguntava-se o número de filhos por casal morador na residência. Você acha que os dados assim obtidos têm algum tipo de tendenciosidade? Explique. ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------9. Considere uma população N = 300. Obter uma amostra de tamanho 15, usando a amostragem sistemática. ------------------------------------------------- ---------------------------------------------------------------------------------------------- ---------------------------------------------------------------------------------------------- ---------------------------------------------------------------------------------------------- ---------------------------------------------10. O quadro abaixo é uma lista de um grupo de seminário de alunos cursando a disciplina Introdução à Estatística. Com o auxílio da tabela de dígitos pseudo-aleatórios a seguir, você é solicitado a selecionar uma amostra de 4 pessoas que receberão uma medalha pelo excelente desempenho na referida disciplina., utilizando: a. Amostragem aleatória simples b. Amostragem aleatória estratificada c. Amostragem aleatória sistemática Nome Adeflávia Allan Alex Anne Antony Audilan Chirley Demiglei Nome Elaine Joséph Kellen Manoel Marcus Natály Simony Thais 4. SÉRIES ESTATISTICAS São assim chamadas as tabelas estatísticas nas quais existe um critério distinto que as especifica e diferencia. Segundo esse critério podemos classificar as séries estatísticas em: 4.1. Séries Cronológicas ou Temporais O tempo é variável, enquanto o local e o fato permanecem fixos. 4.2 Séries Geográficas ou de Localização O local é variável, enquanto o tempo e o fato permanecem constantes. 4.3 Séries Específicas ou de qualidade Apresentam o local e o tempo constantes, enquanto o fato é que varia. 4.4 Séries Conjugadas ou Mistas Pode existir uma combinação das séries cronológicas, geográficas e específicas. 4.5 APRESENTAÇÃO TABULAR DE SÉRIES ESTATÍSTICAS A apresentação segue as normas, segundo a Fundação IBGE. 4.5.1 Componentes das Tabelas Título Corpo Cabeçalho Rodapé Explica o que a tabela contém Formado pelas linhas e colunas de dados. Especifica o conteúdo das colunas e a coluna Indicadora especifica o conteúdo das linhas Especifica notas, chamadas e fontes, se for o caso. A tabela 4.1 mostra um exemplo Tabela 4.1 Casos registrado de intoxicação humana, segundo a causa determinante, Brasil,1993 Causa Acidente Abuso Suicídio Outras Ignorada Freqüência 29.601 2.604 7.965 1.959 1.103 Fonte: MS/FIOCRUZ/SINITOX Observe que o título deve responder as seguintes questões: O que? (referente ao fato) = casos de intoxicação humana Onde? ( relativo ao lugar) = Brasil Quando? ( correspondente ao tempo) = 1993 O Cabeçalho é constituído pelas palavras: Causa Freqüência O Corpo é formado pela Coluna Indicadora e pelos números: Acidente Abuso Suicídio Profissional Outras Ignorada 29.601 2.604 7.965 3.735 1.959 1.103 Toda e qualquer tabela: Limitada por traços verticais para separar as colunas; Não devem ser feitos traços verticais para delimitação; Apresentar, além das freq. absolutas, as freq. relativas e o total; Rodapé colocar fonte, notas e chamadas, se for o caso. Fonte dá indicação da entidade, ou do pesquisador(es) que publicou (aram) ou forneceram os dados Tabela 4.2 Nascidos vivos registrados segundo o ano de registro Ano do registro 1984 1985 1986 Freqüência 2 559 038 2 619 604 2 779 253 Fonte: IBGE (1988) Nota: Nascimentos ocorridos no ano de registro As Chamadas dão algum esclarecimento sobre os dados. Devem ser feitas através de algarismos arábicos escritos entre parênteses, e colocadas à direita da coluna. . 4.5.2 Tabelas de Contingência As tabelas de contingência, ou de Dupla Entrada, são tabelas em que os elementos da amostra ou da população foram classificados de acordo com dois fatores. Vela a tabela 4.3: Tabela 4.3 Nascidos vivos segundo o ano de registro e o sexo Ano de registro Sexo Masculino % Total Feminino 1984 1985 1986 1 307 758 1 339 059 1 418 050 4 064 867 1 251 280 1 280 545 1 361 203 3 893 028 % % 2 559 038 2 619 504 2 779 253 7 957 795 Fonte: IBGE (1988) Nota: Nascimentos ocorridos no ano de registro 5. TABELAS DE DISTRIBUIÇÃO DE FREQÜÊNCIAS Os dados encontram-se dispostos em classes ou categorias com suas freqüências correspondentes. Existem dois tipos: 5.1 Tipo A – Variável Discreta Neste caso a variável assume valores em pontos da reta real, podendo-se enumerar todos os possíveis valores. Geralmente esta variável assume valores inteiros e são provenientes da contagem do número de itens. Exemplos: Número de aprovações em Estatística no 2º período de Economia; Internações em estabelecimentos de saúde; Produção horária de circuitos integrados, num dia em uma empresa; Número de manutenções preventivas em redes de computadores. Considere X o número de erros em declarações de imposto de renda numa determinada região no ano de 2003 Nº de erros (Xi) 0 1 2 3 4 5 Nº de prontuários (fi) : 35 20 13 6 4 2 Onde Xi fi N n = = = = Indica os elementos freqüência absoluta Tamanho da população Tamanho da amostra 80 5.2 Tipo B –Variável Contínua A Variável Contínua assume valores em intervalos da reta real, não é possível enumerar todos os seus valores. Geralmente esta variável provém de medições. Exemplos: Peso dos alunos de uma classe; Pressão arterial, em milímetros de mercúrio, de pacientes, durante um plantão; Altura dos alunos de Introdução à Estatística. Exemplo: Consideremos uma amostra do QI de 50 alunos de Economia: 110 115 107 109 119 120 94 105 110 111 129 101 103 131 124 141 141 133 111 106 101 93 121 114 118 107 103 91 132 102 121 118 127 119 101 119 122 135 113 101 115 128 123 116 118 Para montar a tabela de distribuição de freqüências, vamos necessitar de alguns conceitos e definições. 1 – Dados Brutos: São aqueles que ainda não foram numericamente organizados, como é o caso dos 50 resultados do QI. 2 – Rol: É o arranjo dos dados brutos em ordem crescente ou decrescente. Esta tabulação pode ser feita de várias formas, porém usaremos o processo desenvolvido por Tukey, chamado de Steam-and-leaf, ou seja, Ramo e folhas. 9 10 11 12 13 14 1, 3, 4 1, 1, 1, 1, 2, 3, 3, 4, 5, 6, 7, 7, 7, 9 0, 0, 1, 1, 3, 4, 5, 5, 6, 8, 8, 8, 9, 9, 9, 9, 0,1, 1, 1, 2, 3, 4, 6, 7, 8, 9 1, 2, 3, 5 1, 1 3 – Amplitude Total (A): diferença entre o maior e o menor valor. A = X máx – X min A = 141 – 91 = 50 Devemos agora agrupar os dados em classes e associar a cada classe i, i = 1,2, 3, ....., k, às freqüências absolutas fi dos valores observados das respectivas classes. 4 – Número de Classes (K): È o número de classes necessário para representar o fato. Existem vários critérios que podem ser utilizados, porém tais critérios servirão apenas como indicação e nunca como regra fixa, Muitos estatísticos, sugerem a fórmula de Struges como a mais apropriada . k = 1 + 3,22 . log n Neste caso, temos k = 1 + 3,22 .log 50 = 1 + 3,22 . 1,69897 = 6,47068 Podemos optar por 6 ou 7 classes. Optaremos por 7 classes. 5 – Amplitude de Classe (h): É a diferença entre os limites superior e inferior da classe. Daí, h = A:k e, no nosso exemplo, h = 50 / 7 = 7,1428 h =7 Obs. 1 - Optar por intervalos de classes iguais. 2- As distrib. poderão apresentar intervalos de classes da seguinte forma: 91 98 Classes 91 98 98 105 105 112 112 119 119 126 126 133 133 140 140 147 91 98 Tabulação /// //////// ////////// //////// /////////// ////// // // 91 98 91 98 fi 3 8 10 8 11 6 2 2 O próximo passo será formar a tabela de dados agrupados em classes de freqüências. Para tanto será necessário definir: Xi = Ponto médio da classe i; f i = freqüência absoluta da classe i; Fi = Freqüência Absoluta Acumulada da classe i; f r = freqüência relativa da classe i; Fr = Freqüência Relativa Acumulada da classe i; Tabela dos Dados Agrupados em Classes de Freqüências. Classes 91 98 105 112 119 126 133 140 98 105 112 119 126 133 140 147 Xi 94,5 101,5 108,5 115,5 122,5 129,5 136,5 143,3 -- fi Fi fr Fr 3 8 10 8 11 6 2 2 50 3 11 21 29 40 46 48 50 -- 0,06 0,16 0,20 0,16 0,22 0,12 0,04 0,04 1,00 0,06 0,22 0,42 0,58 0,80 0,92 0,96 1,00 Questões para avaliação 1- O que é uma série estatística? 2- Como se classificam as séries estatísticas? 3- Faça uma pesquisa e dê um exemplo de cada um tipo de série que você respondeu no item anterior. 4- Quantos e quais são os elementos que não podem deixar de estar presentes numa série estatística? 5- Quais são os critérios que especificam e diferenciam uma série estatística? 6- Cite três exemplos de variáveis discretas e contínuas. 7- Construa uma tabela de distribuição de freqüências para apresentar os dados da tabela abaixo. Sugestão: Use a fórmula de Struges e log de 49 = 1,6902 Pressão arterial, em milímetros de mercúrio, de cães adultos anestesiados e após laparotomia 130,0 107,5 135,0 100,0 134,5 121,5 1 05,0 125,0 130,0 145,0 158,5 135,0 120,0 100,0 135,0 125,0 110,0 102,0 111,5 107,5 127,5 104,5 102,5 119,5 99,0 120,0 90,5 101,5 90,5 115,5 116,0 143,0 104,5 132,5 107,5 125,5 82,5 115,0 136,5 101,5 124,0 117,5 107,5 140,0 121,5 107,5 113,0 93,0 103,5 08- Considere o grau em estatística de 32 estudantes , descritos abaixo: 6,0 8,0 2,0 4,0 0,0 7,0 5,0 4,5 2,0 8,5 5,5 4,0 6,5 6,0 5,0 1,0 5,0 4,5 7,0 5,5 3,3 0,0 1,5 3,5 4,0 6,5 5,0 2,5 7,0 6,0 5,0 4,5 determinar: a) O rol b) A amplitude total c) A distrib. de freq. (Sugestão: iniciar por “0” e intervalo de classe de “1,5”) d) Qual a porcentagem de alunos que tiraram nota menor do que 4? e) Qual a porcentagem de alunos que tiraram nota entre 5 e 7 inclusive? f) Qual o limite inferior da 4ª classe? g) Qual o ponto médio da 3ª classe? h) A freqüência absoluta acumulada 6. APRESENTAÇÃO GRÁFICA DE SÉRIES ESTATÍSTICA Servem para permitir uma visão rápida e global do fato estudado. Os gráficos devem ser construídos de uma maneira clara e simples, de tal sorte que o observador entenda facilmente aquilo que o gráfico busca evidenciar. Todo gráfico deve apresentar: Título - Pode ser colocado tanto acima como abaixo do gráfico. Escalas - Devem crescer da esquerda para a direita e de baixo para cima. Legendas - Devem ser colocadas, de preferência, à direita do gráfico. 6.1 – Gráfico de Barras Figura 6.1 Internações em estabelecimentos de saúde, por clínica especializada. IBGE 1992 Outras Pediatria Cirurgia Ginecologia e Obstetrícia Clínica Médica 0 5 10 15 20 25 Freqüência relativa 30 35 6.2 Gráfico de Setores São representados por meio de setores em um círculo Figura 6.2 Internações em estabelecimentos de saúde, por clínica especializada. IBGE 1992 Clinica médica Ginecologia e obstetrícia 17,69 32,51 Cirurgia 14,82 Pediatria 15,26 Outras 19,73 6.3 Histograma È a representação gráfica através de retângulos adjacentes, cuja base corresponde aos intervalos das classes, e a altura é proporcional à freqüência absoluta das classes. Considerando a distribuição de freqüências da tabela 6.1 vamos construir seu histograma que está representado na figura 6.3: Tabela 6.1 Cães adultos anestesiados e após laparotomia, segundo a pressão arterial, em milímetros de mercúrio Classe 80 90 100 110 120 130 140 150 90 100 110 120 130 140 150 160 Xi fi Fi 85 95 105 115 125 135 145 155 1 4 16 8 9 7 3 1 1 5 21 29 38 45 48 49 ------- 49 ------- Figura 6.3 Cães adultos anestesiados e após laparotomia, segundo a pressão arterial em milímetros de mercúrio. fi 16 14 12 10 8 6 4 2 0 80 90 100 110 120 130 140 150 160 h O histograma pode ser usado para as seguintes finalidades: Tomar medidas corretivas; Comparar materiais, máquinas e operadores Medir os efeitos de ações corretivas; Comparar métodos de trabalho e avaliar a capabilidade de máquinas Comparar as influências ambientais, físicas ou psicológicas, sobre os operadores 6.4 Polígono de Freqüências É a representação gráfica de uma distribuição de freqüências por meio de um polígono, onde os pontos são obtidos por perpendiculares traçadas a partir dos pontos médios das classes e de alturas proporcional à freqüência de cada uma das classes. No caso de freqüências acumuladas, os segmentos perpendiculares são traçados a partir dos limites superiores da classe. Em ambos os casos, o primeiro e o último ponto são colocados de modo a manter a proporcionalidade do gráfico Ver figura 6.3em azul 6.5 Gráfico Linear ou de Curva São gráficos em duas dimensões, baseados na representação cartesiana dos pontos no plano. Servem para representar séries cronológicas, onde o tempo é colocado no eixo das abcissas e os valores observados no eixo das ordenadas. Ver figura 6.4 e dados da tabela 6.2. Tabela 6.2 Casos registrados de dengue no Estado de Pernambuco, 1995 – 2002 Ano 1995 1996 1997 1998 1999 2000 2001 Casos Registrados Confirmados 9.982 22.722 40.277 83.508 34.414 27.314 15.075 6.789 12.205 20.916 38.014 25.733 21.756 10.935 Fonte: Funasa-Secretaria de Saúde do Estad Figura 6.4 Casos de dengue registrados no Estado de Pernambuco, Período : 1995 – 2001 Nº Casos (milhares) 90 casos registrados 80 casos confirmados 70 60 50 40 30 20 10 0 95 96 97 98 99 00 01 02 Anos OBS – Existem ainda, os gráficos polares que servem para representar séries cronológicas , os gráficos pictóricos e os cartogramas que são gráficos baseados em mapas, utilizados para representar séries geográficas. Teste seus conhecimentos 1. Traçar dois eixos coordenados e representar os pontos: A (0 , 2) E (- 1,5 ; 3) B (4 , 3) F (0 , 0) C (-3 ; 2,5) G (-5 , 0) 2. Traçar um triângulo cujos vértices são: X (1 , 2) B(!,3) C ( -2 ; -1 ) 4. Com a distribuição de freqüências abaixo, construir: a) Histograma de freqüência simples; b) Histograma de freqüência acumulada crescente; c) Polígono de freqüência simples; d) Polígono de freqüência acumulada crescente; e) Curva de freqüência simples; f) Curva de freqüência acumulada crescente. Remuneração dos operários da empresa “X” – julho 2004 Salário-hora (R$) 6 9 10 13 15 17 19 21 a a a a a a a a 8 10 12 14 16 18 20 22 Freqüência fi (nº de operários) 8 16 42 30 21 12 8 3 D (-2,- 4) H ( -2,5 ; -1) 7 MEDIDAS DE TENDÊNCIA CENTRAL As medidas de tendência central, dão o valor do ponto em torno do qual se distribuem os dados. Em outras palavras, representam os fenômenos através dos seus valores médios, em torno dos quais tendem a concentrar-se os dados. . 7.1 Média Aritmética – Dados não-agrupados Sejam X 1, X 2, X 3, . . . . ,X n, um conjunto com “n” elementos, retirados de uma população “X”. Definimos a média aritmética de “X”, como sendo: X= Xi /n Exemplo Calcular a média aritmética dos dados da tabela 7.1 Tabela 7.1 Peso, em gramas, de ratos machos da raça Wistar com 30 dias de idade 50 62 70 86 60 64 66 77 58 55 82 74 A média aritmética será dada por: X (50 + 86 + ..... + 74 )/12 = 804/12 = 67 x = 67 7.1.2 Média Aritmética – Dados agrupados Quando os dados estiverem agrupados numa distribuição de freqüências, usaremos a média aritmética dos valores X1, X2, X3, . . . , Xn ponderados pelas respectivas freqüências absolutas; f1, f2, f3, . . . ,fn . X =( Xi fi)/n onde n= fi Exemplo Tabela 7.2 Nascidos vivos segundo o peso ao nascer, em quilogramas Classe i Ponto médioFreqüência Xi fi Xi . fi 1,5 2,0 2,0 2,5 1,75 2,25 3 16 5,25 36,00 2,5 3,0 2,75 31 85,25 3,0 3,5 3,25 34 110,50 3,5 4,0 3,75 11 41,25 4,0 4,5 4,25 4 18,00 4,5 5,0 4,75 1 4,75 -------- 100 300,00 (Somatório) Daí, X = 300,00/100 = 3 7.2 X = 3,00 kg A Mediana A mediana é o valor que ocupa a posição central de uma distribuição de dados ordenados em ordem crescente. Se a amostra for de tamanho ímpar, como por exemplo: 1, 4, 6, 9 e 11, a mediana é o 6. Sendo a amostra de tamanho par, como por exemplo: 1, 5, 7, 10, e 11, a mediana será a semimédia dos termos centrais. Nesse caso temos: Md = (7 + 8)/2 = 7,5 M d = 7,5 A mediana dá o valor da abscissa do ponto que delimita a metade dos dados. Considere, então os dados apresentados na tabela 7.1, já ordenados em ordem crescente: 50, 55, 58, 60, 62, 64, 66, 70, 74, 77, 82, e 86 Como nessa amostra o número de elementos é par (n = 12), a mediana é a média aritmética dos dois valores centrais, ou seja, a mediana é: Md = (64 + 66) / 2 = 65 Para o caso de uma distribuição de freqüências de dados agrupados em classes, usaremos a seguinte expressão: n 2 Md = l md + fi .h f md l md = Lim. Inf. da classe que contém a Md n = Tamanho da amostra f = Somatório das freq. anteriores à Md h = Amplitude da classe Md fmd = Freqüência da classe Md Para a utilização desta fórmula, vamos utilizar os dados da tabela 7.3 e calcular a mediana: Tabela 7.3 Classes fi Fi 35 45 5 5 45 55 12 17 55 65 18 35 65 75 14 49 75 85 6 55 85 95 3 58 58 ------ Classe que contém a Md (3ª classe) 1º Passo : Calcula-se n / 2. Como n = 58, temos 58 / 2 = 29º n / 2 = 29º 2º Passo: Identifica-se a classe mediana pela freqüência acumulada Fi. Neste caso, a classe mediana é a 3ª. 3º Passo : Aplica-se a fórmula. Nesse caso, temos: l m d = 55; n = 58; fi = 17; h = 10; f m d = 18. Daí, M d = 55 + 7.3 (58/2) 17 18 . 10 = 61,87 ou Md 62 A Moda A moda é o valor que ocorre com mais freqüência em uma distribuição. Aplicação Tabela 5.4 Indivíduos, segundo o tipo de sangue Tipo de sangue Freqüência O A B AB 547 441 123 25 Fonte : GARCIA (1977) Para tabelas de distribuição de freqüências, usaremos a fórmula de Czuber. 1º Passo : Identifica-se a classe modal. A classe modal é aquela que possui maior freqüência. 2º Passo : Aplica-se a fórmula: M o = l i+ 1/ ( 1 + 2) .h Onde: l i = Limite inferior da classe modal; 1 = Diferença entre a freq. da classe modal e a imediatamente anterior a ela; 2 = Diferença entre a classe modal e a imediatamente posterior a ela; h = Amplitude da classe. Como aplicação, considere os dados da tabela 7.3. Neste caso, a classe de maior freqüência é a 3ª classe, então: l = 55; Portanto : 1 = 18 12 = 6; 2 = 18 14 = 4; e h = 10. 6 Mo = 55 + . 10 Mo = 61 6 + 4 Questões para avaliação 1. Dados os salários anuais de três jornalistas autônomos,calcule a média, a mediana e a moda. Que medida de tendência central fornece a medida resumo mais adequada? R$ 17.000 R$ 18.000 R$ 20.000 R$ 23.000 R$ 65.000 2. Considere a seguinte série: 4, 5, 6, 6, 6. 7, 8, a) Calcule a média, a moda e a mediana b) Substitua o valor 8 pelo valor 18 e faça novamente os cálculos. O que aconteceu com a média. c) Que conclusão você pode tirar a respeito desse fato? 2. Calcule o peso médio dos ratos em cada idade, baseado nos dados fornecidos pela tabela a seguir: Peso, em gramas, de ratos machos da raça Wistar segundo a idade, em dias Nº do rato 1 2 3 4 5 6 30 76,2 81,5 50,0 47,5 63,5 65,1 34 95,5 90,0 60,0 50,0 79,2 75,7 Idade 38 42 99,2 122,7 101,2 125,9 62,3 72,2 57,5 72,3 82,1 94,7 79,3 88,5 46 134,6 136,2 85,3 84,0 110,0 98,7 Fonte: GUIMARÃES et aili ( 1979) Com base nos resultados obtidos responda: a) A média de peso é maior nos ratos com quantos dias? b) A média de idade é menor nos ratos com quantos dias? c) Pode-se afirmar, que o peso médio dos ratos aumenta com a idade? 3. Determine a mediana dos dados apresentados na tabela a seguir e interprete o resultado obtido: Percentual de água em cérebros de cobaias machos com 90 dias de idade 80,06 68,97 79,85 79,87 Fonte : HOSSNE et alii (1990) 79,86 68,86 79,90 79,91 79,55 79,25 4. Calcule a média aritmética, a mediana e a moda dos dados apresentados na tabela 4.5. Tabela 5.5 Taxa de glicose, em miligramas por 100 ml de sangue, em ratos machos da raça Wistar, com 20 dias de idade 97,5 100,0 85,0 85,0 97,0 80,0 100,0 80,0 Fonte: GUIMARÂES et alii (1979) 5. Suponha que você não se encontrando em sua profissão, resolveu entrar no ramo de Delivery de alimentos e após 40 semanas de vendas, resolveu fazer um levantamento geral das atividades. O quadro abaixo mostra os valores das vendas em milhares de R$: 16 34 21 17 29 20 27 24 16 19 24 19 19 22 20 21 24 11 17 17 17 14 18 22 18 13 23 23 20 19 18 26 19 20 20 22 22 26 24 20 Com base nas suas vendas, Determinar: a) o rol; (sugestão: Faça o rol usando o processo de ramo e folha) b) a amplitude máxima; c) Amplitude de classes de freqüências; d) distribuição em classes de freqüências; Elaborar: e) histograma; f) histograma de freqüência acumulada; g) polígono de freqüência simples; h) polígono de freqüência acumulada; Calcular: a) a média; b) a mediana; c) a moda