Táticas de Pesquisa Eficiente em Banco de Dados
Transcrição
Táticas de Pesquisa Eficiente em Banco de Dados
Táticas de Pesquisa Eficiente em Banco de Dados Kory L. Meyerink, MLS, AG, FUGA Salt Lake City, Utah E-mail: [email protected] Online ou off-line, a pesquisa genealógica moderna exige uma busca eficiente em bancos de dados. Com milhões de nomes em centenas de bancos de dados diferentes, é fácil um antepassado se perder. O sucesso de sua pesquisa depende de saber a melhor maneira de pesquisar cada coleção diferente. Booleana, truncamento, palavra-chave, dados em campos, proximidade, expressão, caracteres e palavras curingas não são termos estrangeiros, mas, em vez disso, são suas chaves para o sucesso genealógico! ESBOÇO DE DISCUSSÃO Tipos de bancos de dados Organizados em campos Texto Métodos/sintaxe de pesquisa Palavra-Chave Fonética (Soundex, Metaphone) Caracteres curinga Truncamento Expressão Booleana Pesquisa por campo Limitar Proximidade Pesquisa de sequência de caracteres Vocabulário controlado/Cabeçalhos de assunto Agrupamento Técnicas de busca Menos é mais Escolha o(s) campo(s) correto(s) Opções avançadas de busca Termos alternativos Experiência Catálogos da biblioteca Dados organizados em campos Vocabulário controlado Versões alternativas do banco de dados Exemplos de pesquisa booleana e correlatos Tipos de pesquisa contenham Pesquisa de exemplo Palavra (palavra-chave) keokuk AND (geralmente automático) família Snow OR (pode ser |) nascimento OR casamento NOT (-) chamberlain -neville “neville” Pesquisa por expressão “cidade de Nova York” York” Sinônimos (palavras semelhantes) ~genealogia família” “sobrenome” Pesquisa pela raiz de palavras (variantes de palavra) plasket Interromper busca forçada por palavras +is +to Truncamento cas “casamento” Curingas: caractere Sm?th Curingas: múltiplos town* Proximidade (near/adj) ellis york@5 espaçamento de até 5 palavras Soundex (fonético) chamberlain Encontrar os resultados que “keokuk” tanto “snow” quanto“família” “nascimento” ou“casamento” “chamberlain”, mas não a expressão: "cidade de Nova “árvore familiar” “história da plasket e plaskett “is” “to” “casar”, “casado”, Smith, Smyth towns, township, townland “ellis” e “york” com chamberlin, chambers, etc. Onde encontrar versões alternativas de alguns bancos de dados Sites importantes de bancos de dados de genealogia Sites governamentais (principalmente para registros vitais) Sites de condados da GenWeb Sites de registros específicos (como listas de cemitérios ou de passageiros) Algumas coleções “acadêmicas” Referências bibliográficas sobre buscas Calishain, Tara. Web Search Garage. Upper Saddle River, NJ: Prentice Hall, 2005. Crume, Rick. “Top 10 Public Libraries” (10 melhores bibliotecas públicas) FamilyTreeMagazine.com 10/8/2010. Hill, Brad. Google for Dummies. New York: Wiley Pub., 2003. 360 pgs. Lynch, Daniel M. Google Your Family Tree. Provo: FamilyLink.com, 2008. 340 pgs. Mann, Thomas. The Oxford Guide to Library Research, 3a ed. New York: Oxford, 2005. ProQuest Database Guide: Heritage Quest Online (Online: ProQuest, 2010), <http://www.proquest.com/assets/downloads/products/hqo_db_guide.pdf> accessed Nov. 2013. Research Buzz periódico online diário de Tara Calishain <http://www.researchbuzz.com> [email protected] Comparação de recursos de busca em bancos de dados selecionados Observação: Alguns bancos de dados têm parâmetros de pesquisa diferentes. [# indica qualquer número] Fornecedor/ba Fonético nco de dados Booleana Caracte TrunProxire Expressão camento midade Curinga Pesquisa por campo Ancestry Não * after 3 Soundex * Não Não Sim Textos do Fuzzy ~ Internet Archive AND , OR, * NOT * “aspas” Não Pesquisa Avançada Heritage Quest: Não PERSI and, or, not * Não “aspas” Não Sim Google Não AND, OR, NOT Raiz palavra na “aspas” expressã o Não Não GNIS Não auto and * * “aspas” Não Sim Bowker / Books Desconhecid and, or, in Print o andnot * Não Não Não Pesquisa Avançada Chadwyck Healey Desconhecid and, or, not o * ? default near. # Usa caixas de entrada do campo. RootsWeb Soundex Metaphone Não * * “aspas” Não Sim Fold3 Não AND, OR, NOT * * “aspas” Não Pesquisa Avançada World Bio. Info. Não Systems AND, OR, NOT * * “aspas” Não Pesquisa biográfica Arquivo de jornal Sim, por campo Não Não Sim, campo Não Sim Genealogy Bank Não and, or, not * ? “aspas” near# Name & date The Genealogist Sim Não * Não Não Não Sim Encyclopedia Britannica Não Não * Não Pesquisa Avançada não disponível Origins Network NameX Não * *, ? Não Não Classificar colunas WorldCat Não and, or, not +, |, - * or ? after 3 #, ? “aspas” n# Pesquisa Avançada GaleNet Não and, or, not * ? “aspas” n# Pesquisa personalizada JSTOR Não and, or, andnot + for -s or es Não Sim near Usar menus suspensos Oxford Eng. Não and, or, * ? default near, Usar menus Não Dictionary and not before, after suspensos Definições Booleana – Método de busca que usa dois ou mais termos, combinados ou excludentes, e “conectores” específicos (chamados de 'operadores') que definem a relação entre as duas palavras. Os conectores geralmente são: AND, OR, NOT. A busca tem esse nome por causa de George Boole. Vocabulário controlado – Palavras com significados semelhantes ou relacionados são mapeadas a uma palavra específica. As pesquisas que utilizarem essa palavra terão como resultado todas as palavras do mapa. Exemplo: Bavária, Prússia e Hessen são todas mapeadas a Alemanha nas pesquisas do recenseamento dos EUA, no Ancestry.com. Pesquisa por campo – As solicitações de pesquisa são feitas em campos especificamente identificados e encontram como resultado somente os dados correspondentes que estão naquele campo. Dados organizados em campos – Todas as informações de um banco de dados são inseridas em campos específicos, tais como “Nome”, “Local de nascimento”, “Data de falecimento”, etc. Palavra-chave – Tem a capacidade de pesquisar uma palavra específica, geralmente em vários campos de dados. Além disso, é a busca por palavras “importantes” em meio a palavras irrelevantes, de “parada”, que não são procuradas na pesquisa. Limitada – Exige que os resultados de busca estejam dentro de um intervalo específico, como o campo de data em um catálogo de biblioteca. Agrupamento – A pesquisa booleana exige que certas combinações (busca agrupada) sejam feitas antes de outras. Fonéticos – Pesquisa por palavras (especialmente sobrenomes) com sonoridade semelhante, mas que podem ser escritas de modo diferente. Existem vários sistemas diferentes de indexação. Dois dos mais comuns são Soundex e Metaphone. Expressão – Pesquisa duas ou mais palavras em uma sequência específica. As palavras geralmente são digitadas entre “aspas duplas” Proximidade – Os termos de pesquisa podem ser encontrados próximos uns dos outros no conjunto de dados. Geralmente, a distância pode ser definida como um número específico de caracteres ou palavras. Pesquisa por sequência – Pesquisa qualquer número de caracteres consecutivos Cabeçalhos de assunto – Nos catálogos de biblioteca, palavras especificamente selecionadas são usadas para categorizar vários tópicos relacionados. Por exemplo, o termo “Impostos” pode ser usado para taxas, impostos territoriais, tributos, tributáveis, etc. Texto – Um conjunto de dados que é composto basicamente de texto eletrônico. As informações não estão separadas em campos específicos. Também chamado de “texto livre”. Truncamento – Pesquisa que utiliza apenas as primeiras letras (geralmente três a cinco, ou mais) de uma palavra para obter uma lista de todas as palavras que começam com essas letras. Caracteres Curinga – Uso de um símbolo para representar uma ou mais letras em uma pesquisa. Símbolos típicos incluem ‘?’ que substitui qualquer letra e ‘*’ que representa duas ou mais letras.