Como_pesquisar_na_Internet
Transcrição
Como_pesquisar_na_Internet
Como pesquisar na Internet Professor: Paulo César F. de Oliveira, BSc, PhD 24/5/2009 © P C F de Oliveira 2007 1 Agenda Objetivos Introdução “Googleando” globalmente Como o Google funciona Explorando as opções de pesquisa “fuzzy” Tornando suas pesquisas mais precisas Ferramentas e atalhos práticos O melhor da família de BD do Google Google Books e Google Scholar Base de Dados Médicas na Web BD Médicas com MetaSearch Mecanismos de Busca Médicos 24/5/2009 © P C F de Oliveira 2007 2 1 Objetivos Explicar como a Internet pode ajudar a encontrar informações relevantes, de alta qualidade e específicas para suas necessidades Prover os conhecimentos necessários para fazer buscas eficazes através do mecanismo de busca Google Discutir, demonstrar e explicar como utilizar os principais tipos de base de dados médicas 24/5/2009 © P C F de Oliveira 2007 3 Introdução O que é a Internet? (Slater, W.F., 2002) Uma rede composta por várias outras redes, que une vários computadores pessoais de universidades, de empresas públicas e privadas e fornece uma infra-estrutura para uso de e-mail, repositório de arquivos, documentos hipertexto, base de dados e outros recursos computacionais Uma vasta coleção de redes de computadores que forma e age como uma simples e enorme rede a fim de transportar dados e mensagens através de distâncias que variam de um mesmo escritório até a qualquer lugar do mundo Copyright 2002, William F. Slater, III, Chicago, IL, USA 24/5/2009 © P C F de Oliveira 2007 4 2 Introdução Breve histó história da Internet 1968 - DARPA (Defense Advanced Research Projects Agency) fecha contrato com a empresa BBN (Bolt, Beranek & Newman) para criar a ARPAnet 1970 – Primeiros 5 nodos: UCLA (University of California at Los Angeles) Stanford Research Institute UC Santa Barbara (University of California at Santa Barbara) U of Utah (University of Utah) BBN 1974 – especificação do TCP (Transmission Control Protocol) por Vinton Cerf 1984 – em janeiro a Internet com seus 1000 hosts converte-se em massa para usar o protocolo TCP/IP (Internet Protocol) 1989 – invenção da World Wide Web (WWW) por Tim Berners-Lee no CERN (Conseil Européen pour la Recherche Nucléaire) 24/5/2009 © P C F de Oliveira 2007 5 Introdução WWW – World Wide Web (Grande Teia Global) HTML foi desenvolvida por Tim Berners-Lee no CERN, como forma de distribuição de dados entre físicos Ela preencheu imediatamente a necessidade de uma ampla disseminação da informação Atualmente, a padronização da www é administrada pelo W3C (world wide web consortium) Características da www Os documentos têm endereços (URL – uniform resource locator) Os documentos podem conter hiperlinks para outros documentos (hipertexto) Os documentos podem conter informação multimídia, e.g. texto, imagens, som, vídeo, arquivos, etc. HTML é um linguagem de apresentação de documentos (HyperText Markup Language) A WWW é uma rede de documentos hipertexto interconectados e distribuídos fisicamente 24/5/2009 © P C F de Oliveira 2007 6 3 Introdução Classificaç Classificação da Web Web 1.0 (1990 – 2002) Período bolha “ponto.com” Empresas produziam conteúdo para os usuários acessarem (“web panfleto”) Considerado uma “aula” Web 2.0 (2003 – atualmente) Termo criado por Dale Dougherty (O´Reilly Media) Web usada como plataforma colaborativa Comunidades Redes sociais Blogs Wikis Usuário é envolvido Organizar Compartilhar Mesclar Criticar Atualizar Considerada uma “conversa” 24/5/2009 © P C F de Oliveira 2007 7 Introdução Classificaç Classificação da Web Web 3.0 ??? (Web Semântica) “Estamos a uma grande distância da completa concretização do potencial dos sistemas inteligentes, e sem dúvida nenhuma haverá um ponto em que os sistemas se tornarão inteligentes o suficiente para podermos dizer: “isso é qualitativamente diferente; vamos chamá-lo de web 3.0”” Tim Berners-Lee apud Shannon, Victoria. A ‘more revolutionary web’. Disponível em: http://www.iht.com/articles/2006/05/23/business/web.php. Acesso em: 04 fev 2009. “O Santo Graal para os desenvolvedores da Web Semântica é a criação de um que possa dar uma resposta razoável e completa a uma simples questão como: “estou procurando um lugar confortável para passar as férias e tenho um orçamento de 3.000 dólares. Ah, e tenho um filho de 11 anos...”. Na Web 3.0, a mesma busca chamaria, de maneira ideal, um pacote completo de férias, planejado tão meticulosamente como se tivesse sido feito por um agente de turismo humano” Markoff, John. Entrepreneurs see a Web guided by common sense. Disponível em: http://www.nytimes.com/2006/11/12/business/12web.html. Acesso em: 04 fev 2009. 24/5/2009 © P C F de Oliveira 2007 8 4 Introdução Criação da Internet Resolveu os seguintes desafios: Invenção da rede digital como conhecemos Criação e manutenção de uma infra-estrutura para enviar/receber mensagens eletrônicas em alta velocidade Confiabilidade da troca de correspondência e mensagens por computador 24/5/2009 © P C F de Oliveira 2007 9 Introdução Crescimento do uso da Internet 24/5/2009 © P C F de Oliveira 2007 10 5 Introdução Crescimento da Internet 1977: 111 hosts 1981: 213 hosts 1983: 562 hosts 1984: 1.000 hosts 1986: 5.000 hosts 1987: 10.000 hosts 1989: 100.000 hosts 1992: 1.000.000 hosts 2001: 150 – 175 milhões de hosts 2002: acima de 200 milhões de hosts Até 2010, cerca de 80% do planeta estará ligado à Internet 24/5/2009 © P C F de Oliveira 2007 11 Introdução Dados estatísticos do relatório “A Economia Digital Emergente” (Dailey, 1998) Para ter um mercado de 50 milhões de pessoas: Rádio levou 38 anos TV levou 13 anos Assim que tornou-se pública, Internet conseguiu esta marca de 50 milhões em apenas 4 anos!!! anos 24/5/2009 © P C F de Oliveira 2007 12 6 “Googleando” globalmente Porquê o Google? Maior mecanismo de busca da web e base de dados > 25 bilhões de páginas Resultados geralmente incluem o que você quer Características, atalhos, BD especiais e serviços 24/5/2009 © P C F de Oliveira 2007 13 “Googleando” globalmente Fonte: Revista Veja (Dez/2008) 24/5/2009 © P C F de Oliveira 2007 14 7 “Googleando” globalmente Fonte: Revista Veja (Dez/2008) 24/5/2009 © P C F de Oliveira 2007 15 “Googleando” globalmente Fonte: Revista Veja (Dez/2008) 24/5/2009 © P C F de Oliveira 2007 16 8 “Googleando” globalmente História http://web.archive.org/web/19981202230410/www.google.com/ 24/5/2009 © P C F de Oliveira 2007 17 “Googleando” globalmente Como o Google funciona Explorando as opções de pesquisa “fuzzy” Tornando suas pesquisas mais precisas Ferramentas e atalhos práticos O melhor da família de BD do Google Google Books e Google Scholar 24/5/2009 © P C F de Oliveira 2007 18 9 Como o Google funciona Programa chamado “spider” encontra páginas na web e constrói uma enorme BD de web pages (páginas da web) Programa de pesquisa dá a você formas de pesquisar este BD PageRank™ arranja os resultados Proximidade e colocação da palavra Popularidade – um link para uma página é contado como um voto para ela Importância – tráfego, popularidade de páginas ligando uma página 24/5/2009 © P C F de Oliveira 2007 19 Olhando a página de resultados Copyright 2005, Joe Barker, Infopeople.org • Resumo da página com termos • Termos encontrados em negrito • Qual BD do Google foi usado • Approx. # of acertos (hits) • Termos realmente pesquisados, como links de Dicionários • 2ª página do mesmo site • Todas as páginas do mesmo site • URL, tamanho, data • Link para cópia Cached • Páginas como esta Não acredite no número de resultados É aproximado, sempre muda e não compreensível 10 Opções de pesquisa fuzzy AND automaticamente empregado entre os termos Usa um enfoque fuzzy (difuso) Somente algumas das palavras se uma página é “importante” Palavras podem ocorrer somente em páginas que ligam (link) a uma página Palavras ocorrem em algum lugar do site que a página pertence Opção Cached (Em cache) mostra como Google achou a página Pode ser diferente da página corrente Cached existe se uma página está indexada totalmente Cerca de 1 bilhão de páginas não são Cached Não totalmente pesquisável Não haverá Cached se o proprietário de uma página pede para não colocar a opção 24/5/2009 © P C F de Oliveira 2007 21 Opções de pesquisa fuzzy Como se pode saber porque Google achou uma página? Clique no link Cached Área superior frequentemente explica o que foi encontrado 24/5/2009 © P C F de Oliveira 2007 22 11 Opções de pesquisa fuzzy Derivação de termos (stemming) Procura todas as variações Procure por dança popular Resultados: dançar, dançando, etc. Procure por kite flying Resultados: kite, kites, kiting, flying, fly, flies Desliga com + ou “” +kite +flying ou “kite flying” Só procura por palavras compostas 24/5/2009 © P C F de Oliveira 2007 23 Opções de pesquisa fuzzy Ignora palavras comuns (stop words) Ex. o, é, e, a, de, para, and, the, which, that, where, is, are, etc Coloque + ou “” para desligar Exercício Compare os primeiros resultados das seguintes pesquisas: Maioria sobre um tipo de cobra. grass snake Faz derivação: snakes e grasses Muitas sobre um tipo de grama, não snake grass presente na 1ª busca Maioria das páginas contêm esta snake in the grass expressão. Também encontra páginas com grass snake e snake grass snake +in +the grass Elimina as páginas que não possuem in e the “snake in the grass” 24/5/2009 Mais precisa e específica. © P C F de Oliveira 2007 24 12 Opções de pesquisa fuzzy Pesquisa com OR requer a palavra em maiúscula Pode ser usado em palavras individuais ou entre aspas Exemplos california OR oregon OR “pacific coast” “global warming” OR “greenhouse effect” parana OR pernambuco OR “santa catarina” 24/5/2009 © P C F de Oliveira 2007 25 Opções de pesquisa fuzzy Acentuação/Pontuação que não é ignorada Apóstrofe ( ‘ ): peoples, people’s e peoples’ são pesquisados como palavras diferentes Hífen ( – ): same-sex busca same-sex, same sex e samesex. Sempre colocá-lo para pesquisar uma palavra que pode ser hifenada Acentos: pesquisando na língua onde os acentos são comuns, não há necessidade de informá-los Asterisco ( * ): não se lembra o ditado correto? Ex. escreveu não leu o pau comeu Pesquise assim: escreveu * * * * comeu 24/5/2009 © P C F de Oliveira 2007 26 13 Opções de pesquisa fuzzy Pesquisa de sinônimos Coloque o til (~) antes da palavra ~food recipes, nutrition, cooking ~facts information, statistics ~help guide, tutorial, FAQ, manual ~auto carro, caminhão, automóvel 24/5/2009 © P C F de Oliveira 2007 27 Opções de pesquisa fuzzy Faixas de números Pesquisa termos com número inicial e final separados por dois pontos sem espaços (..) redes neurais 1980..2000 3..6 megapixels digital camera DVD player $250.. 24/5/2009 © P C F de Oliveira 2007 28 14 Opções de pesquisa fuzzy Usando ‘*’ (whole-word wildcard) Não consegue lembrar as palavras de uma frase? Ex. “the unbearable lightness of being” Tente “the * * of being” Pesquisa por proximidade O número de asteriscos representa qualquer palavra que faz parte da expressão “bush * iraq” “lula * * gas” 24/5/2009 © P C F de Oliveira 2007 29 Opções de pesquisa fuzzy Páginas semelhantes (Similar Pages) e relacionadas (Related) 2 comandos para a mesma função Clique no link Similar Pages (Páginas Semelhantes) Pesquise related:www.infopeople.org 24/5/2009 © P C F de Oliveira 2007 30 15 Opções de pesquisa fuzzy Excluindo para controlar a “FUZZIness” Você quer pesquisar: medical info about a pancreatitis diet Começe com: pancreatitis diet Elimine palavras desnecessárias pancreatitis diet –cat –dog pancreatitis –cat –dog –”support group” dieta pancreatite –”alta proteína” Cuidado!!!! Selecione as exclusões cuidadosamente 24/5/2009 © P C F de Oliveira 2007 31 Exercício Faça o exercício 1 Obtendo o máximo da forma de pensar fuzzy do Google 24/5/2009 © P C F de Oliveira 2007 32 16 Pesquisas mais precisas Limitando palavras no título da página intitle: Encontra páginas que possuam o termo no campo <title> Ex. hybrid cars intitle:mileage Ex. hybrid cars mileage Com aspas Ex. “hybrid cars” intitle:mileage Com OR Ex. intitle:”global warming” OR intitle:”greenhouse effect” 24/5/2009 © P C F de Oliveira 2007 33 Pesquisas mais precisas Limitando a pesquisa a um domínio ou site Primeira parte da URL, antes da primeira / Ex. site:edu OR site:gov OR site:ca Lista código de países: http://en.wikipedia.org/wiki/List_of_Internet_TLDs Pesquisando dentro de um site site: Ex. site:memory.loc.gov lincoln “sheet music” Funciona somente na 1a.parte da URL omite http:// e a / final inurl: inurl: termo menos específico pode estar em qualquer parte da URL Ex. inurl:lincoln “sheet music” Encontra “lincoln” em qualquer lugar de qualquer URL e “sheet music” em qualquer parte das páginas 24/5/2009 © P C F de Oliveira 2007 34 17 Pesquisas mais precisas Limitando a um tipo de documento ou extensão Ex. doc, xls, ppt, pdf, etc… filetype: filetype: OR para achar mais de um Ex. form 1040 filetype:pdf - acha formulários -filetype: filetype: exclui certos tipos de arquivos Ex. form 1040 -filetype:pdf Link View as HTML (Ver em HTML) pode ser útil Evita contaminação de vírus caso o documento o possua quando aberto Permite a visualização sem o software ou reader específico 24/5/2009 © P C F de Oliveira 2007 35 Exercício Faça o exercício 2 Técnicas para limitação mais precisa da sua pesquisa 24/5/2009 © P C F de Oliveira 2007 36 18 Ferramentas e atalhos práticos Encontrar definições sobre uma palavra define:[palavra] Ex. define:internet Traduções Clique no link Translate the page (Traduzir esta página) Cole (CTRL+V) a URL ou o texto em: http://www.google.com/language_tools http://www.google.com.br/language_tools?hl=pt-BR 24/5/2009 © P C F de Oliveira 2007 37 Ferramentas e atalhos práticos Calculadora e conversões Aceita parênteses para clarificar as expressões Funções matemáticas (+,-,*,/,% of, nth root of, sqrt(nn), ^ para potenciação) Funções matemáticas avançadas (sin, cos, tan, sec, csc, cot, etc.) Constantes matemáticas (pi, e) 24/5/2009 © P C F de Oliveira 2007 38 19 Ferramentas e atalhos práticos Calculadora e conversões Unidades de medida Massa: kg, g, pounds ou lbs, carats, stones, etc. Comprimento: m, miles, feet, inches, etc. Volume: gallons, liters ou l, pints, etc. Area: square miles, square kilometers, acres, etc. Tempo: day, seconds ou s, years, centuries, etc. Sistemas de numeração: decimal, hexadecimal ou hex, binary, etc. 24/5/2009 © P C F de Oliveira 2007 39 Ferramentas e atalhos práticos Atalhos Zip codes (E.U.A) – digite o CEP (americano) Aeroportos – digite código + airport Rastreio de vôos – digite airline + número do vôo Mapas – digite um endereço Ações (mercado financeiro) – digite código + NYSE, ou AMEX ou NASDAQ Filmes – digite movies:cidade 24/5/2009 © P C F de Oliveira 2007 40 20 Exercícios Faça o exercício 3 Ferramentas e atalhos práticos 24/5/2009 © P C F de Oliveira 2007 41 O melhor da família de BD do Google Imagens Mais 1,3 bilhões Filtro SafeSearch funciona somente em Inglês Notícias 4.500 fontes de notícias Últimos 30 dias Compras (Shopping – Froogle) Sites de compra do Google (parte) Catálogos de compra 24/5/2009 © P C F de Oliveira 2007 42 21 O melhor da família de BD do Google Informações Locais e Mapas local.google.com serviços e negócios da BD Google Páginas amarelas Proximidade geográfica com mapas maps.google.com Imagens de satélite Páginas amarelas locais Indicativos de direção Vídeos Alguns programas de TV 24/5/2009 © P C F de Oliveira 2007 43 O melhor da família de BD do Google Google Earth Precisa ser baixado e instalado (200 MB) Ferramenta útil ou brinquedo exótico? Grupos Grupos de usenet newsgroups desde 1981 Google Labs Serviços novos estudados para serem implementados Novas tecnologias 24/5/2009 © P C F de Oliveira 2007 44 22 Google Books e Google Scholar Google Scholar (scholar.google.com) Artigos científicos da web Mostra resumos (abstracts) se o conteúdo não disponível Integrados com algumas universidades (EUA) Google Books (book.google.com) Texto completo de alguns livros com links para onde comprar Promete digitalizar milhares de publicações das bibliotecas 24/5/2009 © P C F de Oliveira 2007 45 BD Médicas na Web EBM (evidence-based medicine) MEDLINE Outras 24/5/2009 © P C F de Oliveira 2007 46 23 BD Médicas na Web EBM (evidence-based medicine – medicina baseada em evidência) “O uso consciencioso, explícito e prudente das melhores e atuais evidências na tomada de decisões sobre o tratamento de pacientes individuais. A prática da medicina baseada em evidências significa integrar os conhecimentos clínicos com a melhor evidência clínica externa disponível a partir de uma investigação sistemática” (Sackett, 1996) 24/5/2009 © P C F de Oliveira 2007 47 BD Médicas na Web EBM (evidence-based medicine – medicina baseada em evidência) Cochrane Database http://www.mrw.interscience.wiley.com/cochrane/coch rane_clsysrev_articles_fs.html Coletânea de de artigos que tentam responder sobre perguntas clínicas específicas 24/5/2009 © P C F de Oliveira 2007 48 24 BD Médicas na Web Cochrane Database 24/5/2009 © P C F de Oliveira 2007 49 BD Médicas na Web Cochrane Database 24/5/2009 © P C F de Oliveira 2007 50 25 BD Médicas na Web Outros EBMs PEDro http://www.pedro.fhs.usyd.edu.au/ Evidence Based Medicine (EBM Online) http://ebm.bmj.com/ ACP Journal Club http://www.acpjc.org/?hp Clinical Evidence http://clinicalevidence.bmj.com/ceweb/index.jsp 24/5/2009 © P C F de Oliveira 2007 51 BD Médicas na Web Base de Dados EBM Cochrane Identificar revisões sistemáticas de alta qualidade Compreender como as conclusões foram alcançadas PEDro Identificar estudos baseados em evidência que pertençam à área de fisioterapia e correlatas Evidence Based Medicine (EBM Online) Identificar os últimos estudos que são relevantes do ponto de vista metodológico e clínico ACP Journal Club Idem acima Clinical Evidence Identificar respostas baseadas em evidência para perguntas clínicas específicas 24/5/2009 © P C F de Oliveira 2007 52 26 BD Médicas na Web MEDLINE – PUBMED Produzido pela Biblioteca Nacional de Medicina (EUA) – US National Library of Medicine + 11 milhões de referências bibliográficas e resumos (abstracts) http://www.pubmed.gov 24/5/2009 © P C F de Oliveira 2007 53 BD Médicas na Web MEDLINE 24/5/2009 © P C F de Oliveira 2007 54 27 BD Médicas na Web MEDLINE 24/5/2009 © P C F de Oliveira 2007 55 BD Médicas na Web MEDLINE Limitações BD bibliográfica que contém alguns detalhes de artigos publicados Não fornece o artigo completo (full-text) Repositórios com artigos completos (full-text) http://www.pubmedcentral.nih.gov http://www.lib.uiowa.edu/hardin/md/ej.html 24/5/2009 © P C F de Oliveira 2007 56 28 BD Médicas na Web Outras BD BioethicsLine (free) http://www.nlm.nih.gov/databases/databases_bioethic s.html Questões éticas, legais e públicas sobre pesquisa em saúde e biomédica (1973 até hoje) CancerLit (free) http://www.cancer.gov/search/cancer_literature/ Referências sobre câncer (1960 até hoje) 24/5/2009 © P C F de Oliveira 2007 57 BD Médicas na Web Outras BD CINAHL (não grátis) http://www.cinahl.com/ Informações sobre enfermagem e outras profissões médicas (1982 até hoje) Embase (não grátis) http://www.embase.com/ Informações farmacológicas e biomédicas (1974 até hoje) 24/5/2009 © P C F de Oliveira 2007 58 29 BD Médicas na Web Outras BD PsyncINFO (não grátis) http://psycinfo.apa.org/psycinfo/ Pesquisas referentes à psicologia e psiquiatria (1887 até hoje) Science Citation Index http://scientific.thomson.com/products/solutions/phar mbio/ Informações sobre autor, resumos (abstracts) e referências em mais de 5500 journals (1974 até hoje) 24/5/2009 © P C F de Oliveira 2007 59 BD Médicas com MetaSearch MetaSearch (MetaBusca) Ferramenta que permite que se faça uma simples busca em várias BD médicas ao mesmo tempo Resultados são colocados e mostrados em uma única interface 24/5/2009 © P C F de Oliveira 2007 60 30 BD Médicas com MetaSearch SUMSEARCH http://sumsearch.uthscsa.edu/ Desenvolvida pelo Centro de Ciência da Saúde da Universidade do Texas Configurada para pesquisar em MEDLINE, DARE, Merck Manual TRIP http://www.tripdatabase.com/index.html Pesquisa informações em Cochrane, DARE, JAMA, New England Journal of Medicine, BMJ HONselect http://www.hon.ch/HONselect/ Desenvolvido pela Fundação Health on the Net “Mecanismo de busca inteligente e multilingual que integra recursos da web diferentes” 24/5/2009 © P C F de Oliveira 2007 61 Mecanismos de Busca Médicos Scirus http://www.scirus.com/ Pesquisas são divididas em 2 seções Resultados da web (free) Artigos de periódicos (journals) 24/5/2009 © P C F de Oliveira 2007 62 31 Mecanismos de Busca Médicos Scirus 24/5/2009 © P C F de Oliveira 2007 63 Mecanismos de Busca Médicos Scirus 24/5/2009 © P C F de Oliveira 2007 64 32 Mecanismos de Busca Médicos Medical World Search http://www.mwsearch.com Precisa registrar-se MedHunt http://www.hon.ch/MedHunt/ Indexa somente páginas da web que tratam de questões médicas e de saúde 24/5/2009 © P C F de Oliveira 2007 65 Mecanismos de Busca Médicos Qual e quando usar? Scirus Procurando por uma mistura de páginas da web e artigos de periódicos Medical World Search Fazer uma busca que adicione automaticamente sinônimos e conceitos relacionados ao tópico MedHunt Fazer uma busca em que se necessite de recursos da web em outra língua (Francês, Espanhol e Chinês) 24/5/2009 © P C F de Oliveira 2007 66 33 Mecanismos de Busca Exatas http://citeseer.ist.psu.edu/cis http://ieeexplore.ieee.org/Xplore/guesthome.jsp 24/5/2009 © P C F de Oliveira 2007 67 Mecanismos de Busca Exatas http://www.sciencedirect.com/ http://www.athensams.net/ http://portal.acm.org/portal.cfm 24/5/2009 © P C F de Oliveira 2007 68 34