Tá3cas de Pesquisa Eficiente em Banco de Dados

Transcrição

Tá3cas de Pesquisa Eficiente em Banco de Dados
Tá#cas de Pesquisa Eficiente em Banco de Dados RootsTech 2014 Tá#cas de Pesquisa Eficiente em Banco de Dados Obter o máximo dos bancos de dados genealógicos Kory L. Meyerink, AG, FUGA Tipos de bancos de dados •  Bancos de dados diferentes, diferentes pesquisas –  Ninguém usa todos •  Organizados em campos –  Todas as informações estão em campos definidos –  Entrada de dados por seres humanos em um programa de soPware •  Texto –  Texto eletrônico –  Muitas vezes converTdo a parTr de texto impresso ▫  via OCR ▫  Seres humanos digitando um texto 3
Métodos/sintaxe de pesquisa •  Palavra-­‐Chave •  FonéTco –  (Soundex, Metaphone) •  Caracteres curinga •  Truncamento •  Expressão •  Booleana 4
•  Pesquisa por campo •  Limitar •  Proximidade •  Pesquisa por sequência de palavras •  Vocabulário controlado –  (Cabeçalhos de assunto) •  Agrupamento Palavra-­‐Chave •  Qualquer palavra que melhor descreva as informações solicitadas –  Nomes, lugares, profissões, etc. •  Bancos de dados de texto •  A palavra precisa estar no texto •  Tente sinônimos, se não encontrar •  CerTfique-­‐se de que a grafia esteja correta •  Control + F no Windows ou Command + F no Mac 5
Foné#co •  Localiza palavras (esp. nomes) com sonoridade parecida •  Dados organizados em campos •  Soundex (codificação de nome simples) •  Metaphone (algoritmo de computador complexo) –  Descrito em “Pesquisar em Ancestors.com” •  Ainda não é perfeito –  Thompson = T512
–  Thomson = T525
6
ou ou 0MPSN 0MSN Opção metaphone na RootsWeb 7
Caracteres curinga •  Uso de um símbolo para representar uma ou mais letras •  Organizados em campos e algumas bases de dados de texto •  Geralmente símbolos diferentes para um ou muitos •  ? (geralmente 1 letra) ou ! ou * (pode ser repeTdo) •  Thom*s*n 8
Truncamento •  Busca a raiz de uma palavra •  Letras iniciais de uma palavra –  O número mínimo de letras varia •  Geralmente usa um símbolo, às vezes não •  Geralmente só em dados organizados em campos •  Cas* >> casar-­‐se, casa-­‐se, casado, etc. 9
Truncamento em um catálogo da biblioteca 10
Expressão •  Encontra as correspondências de várias palavras em sequência •  Como uma expressão ou o nome completo •  Usada nos bancos de dados de texto, como o Google •  Geralmente entre “aspas” –  “Arthur Percy Chamberlain” •  Pode ser muito restriTva para bons resultados 11
12
Booleana •  Permite uma combinação de termos de pesquisa •  Bancos de dados textuais, como mecanismos de busca •  Os “operadores” são os comandos de combinação •  AND
+ (símbolo) –  O resultado tem que incluir todos os termos •  OR | (símbolo) –  O resultado tem que incluir um ou mais termos •  NOT
-­‐ (símbolo) –  O resultado tem que excluir alguns termos 13
Operadores booleanos 14
Exemplos booleanos •  Snow AND Family •  Berrien OR Cass –  Dois condados vizinhos •  Chamberlain NOT Neville •  Arthur AND Chamberlain NOT Neville 15
Pesquisa por campo •  Encontra as correspondências das informações conTdas em um ou mais campos •  Dados organizados em campos •  Alguns campos tem opções previamente definidas –  Nome do estado, porto, parentesco, datas, etc. •  Pesquisa um ou mais campos por vez •  Quanto mais campos forem usados, mais restriTvos serão os resultados •  A maioria dos bancos de dados do Ancestry •  Catálogos da biblioteca 16
17
Limitar •  Restringir os resultados a certos parâmetros •  Geralmente com dados organizados em campos •  Um aspecto da busca por campo •  Muitos bancos de dados do Ancestry •  Comum nos catálogos de biblioteca; restrita por: –  Data da publicação –  Autor –  Idioma da publicação, etc. 18
19
Proximidade •  Os termos da pesquisa devem estar próximos uns dos outros –  Medido pelo número de palavras (ou caracteres) •  Poderoso, mas raro –  alguns bancos de dados de texto •  WITHIN ou NEAR (os termos podem estar em qualquer ordem) –  William w4 Plaskex •  BEFORE ou PRE (um termo tem que estar antes do outro –  Stevensville pre/5 Montana 20
21
22
Sequência de caracteres •  Encontra a correspondência exata de caracteres consecuTvos –  Letras, números, símbolos, etc. •  Geralmente texto, às vezes dados organizados em campos •  ÚTl para encontrar palavras do meio ou do fim da sequência –  Clinesmith –  Klinesmith •  No Ancestry, exige um caractere curinga –  Mínimo de três letras –  Inclusive a primeira ou a úlTma letra (âncora) 23
24
Vocabulário controlado •  Termos previamente excluídos da pesquisa •  Dados organizados em campos •  Cabeçalhos de assunto em catálogos da biblioteca •  É preciso aprender a palavra certa para esse banco de dados –  Registros de impostos, em vez de tributáveis ou tributação –  Inventário, em vez de testamento –  Registros vitais, e não cerTdões de nascimento •  Também: Mapeamento de várias palavras relacionadas a uma determinada palavra –  Bavária, Hesse, Prússia, etc. são todas mapeadas para Alemanha –  Local de nascimento de recenseamento de antepassados dos EUA –  Ao pesquisar “Alemanha” temos como resultado todos os estados alemães 25
26
Agrupamento •  Avançada técnica de busca booleana •  Requer determinadas combinações antes de outras •  Geralmente nos bancos de dados de texto –  Google e outros sistemas de pesquisa •  Paris AND (Ohio OR Texas) •  Snow AND (família OR genealogia) 27
Técnicas de busca •  Menos é mais •  Escolha o(s) campo(s) correto(s) •  Procure “Dicas de busca” ou “Ajuda da Busca” •  Opções avançadas de busca •  Termos alternaTvos •  Experiência •  Aprender o que é permiTdo para o banco de dados 28
29
Catálogos da biblioteca •  Dados organizados em campos •  Vocabulário controlado •  Pesquisa padrão •  Pesquisa avançada 30
Mecanismos de pesquisa •  Texto completo •  Palavra-­‐chave •  Booleana •  Expressão •  Truncamento (limitada) –  Pesquisa pela raiz de palavras •  Sinônimo (Google) •  Palavra “curinga” (Google) 31
Versões alterna#vas do banco de dados •  Social Security Death Index –  Pelo menos 8 sites diferentes online •  Índices Gerais de Recenseamento –  Muitos estão em quatro ou mais sites •  Listas de cemitérios –  Sites coletores –  Sites locais 32
Dois Exemplos: Mound Valley/Perry Ward 33
Pesquisar o banco de dados… Você não sabe o que pode prejudicar sua lista de resultados! 34

Documentos relacionados

Táticas de Pesquisa Eficiente em Banco de Dados

Táticas de Pesquisa Eficiente em Banco de Dados Tipos de bancos de dados Organizados em campos Texto Métodos/sintaxe de pesquisa Palavra-Chave Fonética (Soundex, Metaphone) Caracteres curinga Truncamento Expressão Booleana Pesquisa por campo Lim...

Leia mais