Tá3cas de Pesquisa Eficiente em Banco de Dados
Transcrição
Tá3cas de Pesquisa Eficiente em Banco de Dados
Tá#cas de Pesquisa Eficiente em Banco de Dados RootsTech 2014 Tá#cas de Pesquisa Eficiente em Banco de Dados Obter o máximo dos bancos de dados genealógicos Kory L. Meyerink, AG, FUGA Tipos de bancos de dados • Bancos de dados diferentes, diferentes pesquisas – Ninguém usa todos • Organizados em campos – Todas as informações estão em campos definidos – Entrada de dados por seres humanos em um programa de soPware • Texto – Texto eletrônico – Muitas vezes converTdo a parTr de texto impresso ▫ via OCR ▫ Seres humanos digitando um texto 3 Métodos/sintaxe de pesquisa • Palavra-‐Chave • FonéTco – (Soundex, Metaphone) • Caracteres curinga • Truncamento • Expressão • Booleana 4 • Pesquisa por campo • Limitar • Proximidade • Pesquisa por sequência de palavras • Vocabulário controlado – (Cabeçalhos de assunto) • Agrupamento Palavra-‐Chave • Qualquer palavra que melhor descreva as informações solicitadas – Nomes, lugares, profissões, etc. • Bancos de dados de texto • A palavra precisa estar no texto • Tente sinônimos, se não encontrar • CerTfique-‐se de que a grafia esteja correta • Control + F no Windows ou Command + F no Mac 5 Foné#co • Localiza palavras (esp. nomes) com sonoridade parecida • Dados organizados em campos • Soundex (codificação de nome simples) • Metaphone (algoritmo de computador complexo) – Descrito em “Pesquisar em Ancestors.com” • Ainda não é perfeito – Thompson = T512 – Thomson = T525 6 ou ou 0MPSN 0MSN Opção metaphone na RootsWeb 7 Caracteres curinga • Uso de um símbolo para representar uma ou mais letras • Organizados em campos e algumas bases de dados de texto • Geralmente símbolos diferentes para um ou muitos • ? (geralmente 1 letra) ou ! ou * (pode ser repeTdo) • Thom*s*n 8 Truncamento • Busca a raiz de uma palavra • Letras iniciais de uma palavra – O número mínimo de letras varia • Geralmente usa um símbolo, às vezes não • Geralmente só em dados organizados em campos • Cas* >> casar-‐se, casa-‐se, casado, etc. 9 Truncamento em um catálogo da biblioteca 10 Expressão • Encontra as correspondências de várias palavras em sequência • Como uma expressão ou o nome completo • Usada nos bancos de dados de texto, como o Google • Geralmente entre “aspas” – “Arthur Percy Chamberlain” • Pode ser muito restriTva para bons resultados 11 12 Booleana • Permite uma combinação de termos de pesquisa • Bancos de dados textuais, como mecanismos de busca • Os “operadores” são os comandos de combinação • AND + (símbolo) – O resultado tem que incluir todos os termos • OR | (símbolo) – O resultado tem que incluir um ou mais termos • NOT -‐ (símbolo) – O resultado tem que excluir alguns termos 13 Operadores booleanos 14 Exemplos booleanos • Snow AND Family • Berrien OR Cass – Dois condados vizinhos • Chamberlain NOT Neville • Arthur AND Chamberlain NOT Neville 15 Pesquisa por campo • Encontra as correspondências das informações conTdas em um ou mais campos • Dados organizados em campos • Alguns campos tem opções previamente definidas – Nome do estado, porto, parentesco, datas, etc. • Pesquisa um ou mais campos por vez • Quanto mais campos forem usados, mais restriTvos serão os resultados • A maioria dos bancos de dados do Ancestry • Catálogos da biblioteca 16 17 Limitar • Restringir os resultados a certos parâmetros • Geralmente com dados organizados em campos • Um aspecto da busca por campo • Muitos bancos de dados do Ancestry • Comum nos catálogos de biblioteca; restrita por: – Data da publicação – Autor – Idioma da publicação, etc. 18 19 Proximidade • Os termos da pesquisa devem estar próximos uns dos outros – Medido pelo número de palavras (ou caracteres) • Poderoso, mas raro – alguns bancos de dados de texto • WITHIN ou NEAR (os termos podem estar em qualquer ordem) – William w4 Plaskex • BEFORE ou PRE (um termo tem que estar antes do outro – Stevensville pre/5 Montana 20 21 22 Sequência de caracteres • Encontra a correspondência exata de caracteres consecuTvos – Letras, números, símbolos, etc. • Geralmente texto, às vezes dados organizados em campos • ÚTl para encontrar palavras do meio ou do fim da sequência – Clinesmith – Klinesmith • No Ancestry, exige um caractere curinga – Mínimo de três letras – Inclusive a primeira ou a úlTma letra (âncora) 23 24 Vocabulário controlado • Termos previamente excluídos da pesquisa • Dados organizados em campos • Cabeçalhos de assunto em catálogos da biblioteca • É preciso aprender a palavra certa para esse banco de dados – Registros de impostos, em vez de tributáveis ou tributação – Inventário, em vez de testamento – Registros vitais, e não cerTdões de nascimento • Também: Mapeamento de várias palavras relacionadas a uma determinada palavra – Bavária, Hesse, Prússia, etc. são todas mapeadas para Alemanha – Local de nascimento de recenseamento de antepassados dos EUA – Ao pesquisar “Alemanha” temos como resultado todos os estados alemães 25 26 Agrupamento • Avançada técnica de busca booleana • Requer determinadas combinações antes de outras • Geralmente nos bancos de dados de texto – Google e outros sistemas de pesquisa • Paris AND (Ohio OR Texas) • Snow AND (família OR genealogia) 27 Técnicas de busca • Menos é mais • Escolha o(s) campo(s) correto(s) • Procure “Dicas de busca” ou “Ajuda da Busca” • Opções avançadas de busca • Termos alternaTvos • Experiência • Aprender o que é permiTdo para o banco de dados 28 29 Catálogos da biblioteca • Dados organizados em campos • Vocabulário controlado • Pesquisa padrão • Pesquisa avançada 30 Mecanismos de pesquisa • Texto completo • Palavra-‐chave • Booleana • Expressão • Truncamento (limitada) – Pesquisa pela raiz de palavras • Sinônimo (Google) • Palavra “curinga” (Google) 31 Versões alterna#vas do banco de dados • Social Security Death Index – Pelo menos 8 sites diferentes online • Índices Gerais de Recenseamento – Muitos estão em quatro ou mais sites • Listas de cemitérios – Sites coletores – Sites locais 32 Dois Exemplos: Mound Valley/Perry Ward 33 Pesquisar o banco de dados… Você não sabe o que pode prejudicar sua lista de resultados! 34
Documentos relacionados
Táticas de Pesquisa Eficiente em Banco de Dados
Tipos de bancos de dados Organizados em campos Texto Métodos/sintaxe de pesquisa Palavra-Chave Fonética (Soundex, Metaphone) Caracteres curinga Truncamento Expressão Booleana Pesquisa por campo Lim...
Leia mais