Táticas de Pesquisa Eficiente em Banco de Dados

Transcrição

Táticas de Pesquisa Eficiente em Banco de Dados
Táticas de Pesquisa Eficiente em Banco de Dados
Kory L. Meyerink, MLS, AG, FUGA
Salt Lake City, Utah
E-mail: [email protected]
Online ou off-line, a pesquisa genealógica moderna exige uma busca eficiente em bancos de
dados. Com milhões de nomes em centenas de bancos de dados diferentes, é fácil um
antepassado se perder. O sucesso de sua pesquisa depende de saber a melhor maneira de
pesquisar cada coleção diferente. Booleana, truncamento, palavra-chave, dados em campos,
proximidade, expressão, caracteres e palavras curingas não são termos estrangeiros, mas, em vez
disso, são suas chaves para o sucesso genealógico!
ESBOÇO DE DISCUSSÃO
Tipos de bancos de dados
Organizados em campos
Texto
Métodos/sintaxe de pesquisa
Palavra-Chave
Fonética (Soundex, Metaphone)
Caracteres curinga
Truncamento
Expressão
Booleana
Pesquisa por campo
Limitar
Proximidade
Pesquisa de sequência de caracteres
Vocabulário controlado/Cabeçalhos de assunto
Agrupamento
Técnicas de busca
Menos é mais
Escolha o(s) campo(s) correto(s)
Opções avançadas de busca
Termos alternativos
Experiência
Catálogos da biblioteca
Dados organizados em campos
Vocabulário controlado
Versões alternativas do banco de dados
Exemplos de pesquisa booleana e correlatos
Tipos de pesquisa
contenham
Pesquisa de exemplo
Palavra (palavra-chave)
keokuk
AND (geralmente automático)
família Snow
OR
(pode ser |)
nascimento OR casamento
NOT (-)
chamberlain -neville
“neville”
Pesquisa por expressão
“cidade de Nova York”
York”
Sinônimos (palavras semelhantes) ~genealogia
família” “sobrenome”
Pesquisa pela raiz de palavras (variantes de palavra) plasket
Interromper busca forçada por palavras
+is
+to
Truncamento
cas
“casamento”
Curingas: caractere
Sm?th
Curingas: múltiplos
town*
Proximidade (near/adj)
ellis york@5
espaçamento de até 5 palavras
Soundex (fonético)
chamberlain
Encontrar os resultados que
“keokuk”
tanto “snow” quanto“família”
“nascimento” ou“casamento”
“chamberlain”, mas não
a expressão: "cidade de Nova
“árvore familiar” “história da
plasket e plaskett
“is” “to”
“casar”, “casado”,
Smith, Smyth
towns, township, townland
“ellis” e “york” com
chamberlin, chambers, etc.
Onde encontrar versões alternativas de alguns bancos de dados
Sites importantes de bancos de dados de genealogia
Sites governamentais (principalmente para registros vitais)
Sites de condados da GenWeb
Sites de registros específicos (como listas de cemitérios ou de passageiros)
Algumas coleções “acadêmicas”
Referências bibliográficas sobre buscas
Calishain, Tara. Web Search Garage. Upper Saddle River, NJ: Prentice Hall, 2005.
Crume, Rick. “Top 10 Public Libraries” (10 melhores bibliotecas públicas)
FamilyTreeMagazine.com 10/8/2010.
Hill, Brad. Google for Dummies. New York: Wiley Pub., 2003. 360 pgs.
Lynch, Daniel M. Google Your Family Tree. Provo: FamilyLink.com, 2008. 340 pgs.
Mann, Thomas. The Oxford Guide to Library Research, 3a ed. New York: Oxford, 2005.
ProQuest Database Guide: Heritage Quest Online (Online: ProQuest, 2010),
<http://www.proquest.com/assets/downloads/products/hqo_db_guide.pdf> accessed Nov. 2013.
Research Buzz periódico online diário de Tara Calishain <http://www.researchbuzz.com>
[email protected]
Comparação de recursos de busca em bancos de dados selecionados
Observação: Alguns bancos de dados têm parâmetros de pesquisa diferentes. [# indica qualquer
número]
Fornecedor/ba
Fonético
nco de dados
Booleana
Caracte
TrunProxire
Expressão
camento
midade
Curinga
Pesquisa por
campo
Ancestry
Não
* after 3
Soundex
*
Não
Não
Sim
Textos do
Fuzzy ~
Internet Archive
AND , OR,
*
NOT
*
“aspas”
Não
Pesquisa
Avançada
Heritage Quest:
Não
PERSI
and, or, not
*
Não
“aspas”
Não
Sim
Google
Não
AND, OR,
NOT
Raiz
palavra
na
“aspas”
expressã
o
Não
Não
GNIS
Não
auto and
*
*
“aspas”
Não
Sim
Bowker / Books Desconhecid and, or,
in Print
o
andnot
*
Não
Não
Não
Pesquisa
Avançada
Chadwyck Healey
Desconhecid
and, or, not
o
*
?
default
near. #
Usa caixas de
entrada do
campo.
RootsWeb
Soundex
Metaphone
Não
*
*
“aspas”
Não
Sim
Fold3
Não
AND, OR,
NOT
*
*
“aspas”
Não
Pesquisa
Avançada
World Bio. Info.
Não
Systems
AND, OR,
NOT
*
*
“aspas”
Não
Pesquisa
biográfica
Arquivo de
jornal
Sim, por
campo
Não
Não
Sim,
campo
Não
Sim
Genealogy Bank Não
and, or, not
*
?
“aspas”
near#
Name & date
The Genealogist Sim
Não
*
Não
Não
Não
Sim
Encyclopedia
Britannica
Não
Não
*
Não
Pesquisa Avançada
não disponível
Origins
Network
NameX
Não
*
*, ?
Não
Não
Classificar
colunas
WorldCat
Não
and, or, not
+, |, -
* or ?
after 3
#, ?
“aspas”
n#
Pesquisa
Avançada
GaleNet
Não
and, or, not
*
?
“aspas”
n#
Pesquisa
personalizada
JSTOR
Não
and, or,
andnot
+ for
-s or es
Não
Sim
near
Usar menus
suspensos
Oxford Eng.
Não
and, or,
*
?
default
near,
Usar menus
Não
Dictionary
and not
before,
after
suspensos
Definições
Booleana – Método de busca que usa dois ou mais termos, combinados ou excludentes, e
“conectores” específicos (chamados de 'operadores') que definem a relação entre as duas
palavras. Os conectores geralmente são: AND, OR, NOT. A busca tem esse nome por causa de
George Boole.
Vocabulário controlado – Palavras com significados semelhantes ou relacionados são mapeadas
a uma palavra específica. As pesquisas que utilizarem essa palavra terão como resultado todas as
palavras do mapa. Exemplo: Bavária, Prússia e Hessen são todas mapeadas a Alemanha nas
pesquisas do recenseamento dos EUA, no Ancestry.com.
Pesquisa por campo – As solicitações de pesquisa são feitas em campos especificamente
identificados e encontram como resultado somente os dados correspondentes que estão naquele
campo.
Dados organizados em campos – Todas as informações de um banco de dados são inseridas em
campos específicos, tais como “Nome”, “Local de nascimento”, “Data de falecimento”, etc.
Palavra-chave – Tem a capacidade de pesquisar uma palavra específica, geralmente em vários
campos de dados. Além disso, é a busca por palavras “importantes” em meio a palavras
irrelevantes, de “parada”, que não são procuradas na pesquisa.
Limitada – Exige que os resultados de busca estejam dentro de um intervalo específico, como o
campo de data em um catálogo de biblioteca.
Agrupamento – A pesquisa booleana exige que certas combinações (busca agrupada) sejam feitas
antes de outras.
Fonéticos – Pesquisa por palavras (especialmente sobrenomes) com sonoridade semelhante, mas
que podem ser escritas de modo diferente. Existem vários sistemas diferentes de indexação. Dois
dos mais comuns são Soundex e Metaphone.
Expressão – Pesquisa duas ou mais palavras em uma sequência específica. As palavras
geralmente são digitadas entre “aspas duplas”
Proximidade – Os termos de pesquisa podem ser encontrados próximos uns dos outros no
conjunto de dados. Geralmente, a distância pode ser definida como um número específico de
caracteres ou palavras.
Pesquisa por sequência – Pesquisa qualquer número de caracteres consecutivos
Cabeçalhos de assunto – Nos catálogos de biblioteca, palavras especificamente selecionadas são
usadas para categorizar vários tópicos relacionados. Por exemplo, o termo “Impostos” pode ser
usado para taxas, impostos territoriais, tributos, tributáveis, etc.
Texto – Um conjunto de dados que é composto basicamente de texto eletrônico. As informações
não estão separadas em campos específicos. Também chamado de “texto livre”.
Truncamento – Pesquisa que utiliza apenas as primeiras letras (geralmente três a cinco, ou mais)
de uma palavra para obter uma lista de todas as palavras que começam com essas letras.
Caracteres Curinga – Uso de um símbolo para representar uma ou mais letras em uma pesquisa.
Símbolos típicos incluem ‘?’ que substitui qualquer letra e ‘*’ que representa duas ou mais letras.