biblioteca

Transcrição

biblioteca
Os portais de informação empresarial assumem importância cada vez maior para os negócios,
traduzindo todo o manancial de conteúdo informacional proveniente das mais variadas fontes
da empresa em informação útil para a tomada de decisões nos três níveis: estratégico, tático e
operacional.
!
#
INTRODUÇÃO
Quantas organizações falam de “core
competencies” sem compreender que as
competências essenciais das mesmas são
baseadas em conjuntos de informações e
conhecimentos que precisam ser criados,
organizados, atualizados e disseminados de
maneira sistemática. É no contexto da
discussão de “core competencies” que iremos
tratar do tema taxonomia. Taxonomia não é um
termo muito comum no dia-a-dia do mundo dos
negócios. De fato, taxonomia soa como algo
restrito, capaz de despertar interesse apenas
em cientistas ou bibliotecários. No entanto,
vamos argumentar neste artigo que taxonomias
são elementos estruturantes, estratégicos e
centrais para negócios baseados em
informação e conhecimento.
A taxonomia é um sistema para classificar e
facilitar o acesso à informação, e que tem como
objetivos: representar conceitos através de
termos; agilizar a comunicação entre
especialistas e entre especialistas e outros
públicos; encontrar o consenso; propor formas
"
$
#"
# %&
'
de controle da diversidade de significação; e
oferecer um mapa de área que servirá como
guia em processos de conhecimento. É
portanto, um vocabulário controlado de uma
determinada área do conhecimento, e acima de
tudo um instrumento ou elemento de estrutura
que permite alocar, recuperar e comunicar
informações dentro de um sistema, de maneira
lógica.
Embora recentemente tenha ganho muita
importância no mundo dos negócios, a
disciplina da taxonomia não é nova. Ela sempre
esteve
presente,
por
exemplo,
na
biblioteconomia e no universo científico. O
exemplo clássico é a Classificação dos Seres
Vivos, de 1735, fruto do trabalho do botânico
sueco Karl von Linné. Em sua taxonomia, o
cientista dividiu os seres vivos em grupos, de
acordo com suas características em comum,
obedecendo a uma ordem hierárquica. Um
exemplo bastante simplificado do que seria uma
estrutura taxonômica vem a seguir:
©TerraForum Consultores
1
O conceito de taxonomia tem se tornado ainda
mais importante nos tempos atuais na medida
que o volume de informações cresce de forma
exponencial e os usuários adquirem um papel
essencial tanto na produção, como na
categorização e uso de informações. No
contexto do mundo de negócios, podemos
definir de maneira simplificada que taxonomias
são regras de alto nível para organizar e
classificar informação e conhecimento. E isto é
essencial, pois organizações que não
conseguem
fazer
isto acabam não
compreendendo as atividades agregadoras de
valor dentro delas mesmas; atividades estas
que crescentemente estão baseadas na
produção e uso de informação e conhecimento.
A importância da taxonomia para informações
não estruturadas (Intranets, sites, e-mails,
documentos Office, etc) é apontada, por alguns
especialistas, como equivalente à importância
que os bancos de dados tiveram para as
informações tabulares. Sabendo que a maior
parte das informações em uma empresa estão
sob a forma de textos, vê-se que seu
tratamento é um assunto essencial, e que seu
uso correto no dia-a-dia deverá favorecer o
desempenho de outras atividades corporativas.
OBJETIVOS ESPECÍFICOS
As organizações necessitam desenvolver
categorias e estruturas de informação que
façam sentido para seus próprios negócios e
comunidades específicas de usuários que
utilizam o sistema. No ambiente web, em
particular, as taxonomias servem para
simplificar as buscas e a navegação e designar
responsabilidades em termos de avaliação,
organização, eliminação e arquivamento de
informações. O verdadeiro teste de qualquer
taxonomia é a eficiência que ela fornece para o
grupo de usuários para o qual foi projetada. A
seguinte pergunta resume bem essa questão:
apoiados pela taxonomia, os usuários são
capazes de encontrar informação relevante e
significativa de maneira eficiente e em tempo
hábil?
As boas taxonomias devem facilitar a busca por
documentos, permitindo que as pesquisas
possam ser conduzidas por diferentes critérios
(ex: autor, data, formato de arquivo, domínio de
conhecimento, etc.). Não existe, ademais, certo
ou errado universal: pessoas diferentes
desenvolverão
taxonomias
diferentes.
Conseqüentemente, a taxonomia deve ajudar a
criar caminhos (categorias) múltiplos para
encontrar a mesma informação, de acordo com
o ponto de vista adotado. No entanto, alguns
critérios devem ser observados:
©TerraForum Consultores
2
Comunicabilidade: os termos utilizados devem
transparecer os conceitos carregados, de
acordo com a linguagem utilizada pelos
usuários do sistema. Em uma indústria química
faz sentido a utilização do termo “cloreto de
sódio” ou “NaCl”. No entanto, para um público
leigo, o termo “sal” comunica de forma mais
clara e objetiva.
Utilidade: uma taxonomia deve apresentar
somente os termos necessários. Isto significa
que ainda que um termo possa ser dividido em
outros termos, isso somente é feito se esses
termos forem utilizados na organização. Basta
citar o termo frutas, ou é necessário especificar
cada uma: maçã, limão, pêra...?
Estimulação: uma boa taxonomia apresenta
termos que induzem o usuário a continuar a
navegação pelo sistema. Este critério é
relacionado ao da comunicabilidade, uma vez
que também é o resultado de um estudo da
linguagem dos usuários do sistema.
Compatibilidade: a taxonomia deve conter
somente estruturas do campo que se está
ordenando e que façam parte das atividades ou
funções da organização.
A taxonomia deve tornar intuitivo para os
empregados o processo de busca por uma
informação específica, colocando-os em contato
com tópicos e categorias relacionadas não
previstas anteriormente. Isto é mais bem
explicado se imaginarmos usuários buscando
por livros colocados em prateleiras de uma
biblioteca bem organizada, mas fazendo isto de
maneira muito mais rápida e multidimensional.
Os funcionários devem estar familiarizados com
os nomes, categorias e sinais usados na
taxonomia. Nesse ponto, a experiência on-line
não deveria ser muito diferente da experiência
off-line (com a diferença que no mundo off-line
não é possível realizar buscas com várias
visões e multidimensionais).
Feita esta analogia, é importante destacar
também que são muitas as diferenças
relacionadas à taxonomia entre o mundo
tradicional da biblioteca e o espaço digital. A
mais evidente é que um livro só pode estar em
um único local e é acessado tradicionalmente
nas bibliotecas por meio de uma única
taxonomia. Na web, nenhuma destas restrições
existe. Outra importante diferença é que os
sistemas de classificação de conteúdos das
bibliotecas tradicionais são estabelecidos de
maneira totalmente centralizada sem nenhuma
participação dos usuários. Isto é impossível no
ambiente web ou de um portal desenhado a
partir de princípios de gestão do conhecimento.
TIPOS DE TAXONOMIA
As taxonomias e as categorizações são
usualmente hierárquicas. Entretanto, novas
formas mais visuais, como por exemplo as
árvores espaciais ou hiperbólicas, estão se
tornando a cada dia mais comuns, como as
fornecidas pela Antartic.ca, TheBrain ou
InXight. Arquitetos da informação ajudados de
perto pelos “proprietários” dos conteúdos são
usualmente responsáveis pela definição da
taxonomia empregada em cada empresa. Em
alguns casos, eles usam ferramentas de
classificação automática, como a SemioMap da
Semio e a Verity, com o objetivo de simplificar
ou acelerar o processamento (as ferramentas
de classificação são algoritmos que permitem o
agrupamento de documentos baseando-se em
regras estatísticas ou de proximidade
semântica).
TAXONOMIA E METADADOS
Metadados são classicamente definidos como
informação sobre informação, responsáveis por
fornecer o contexto informacional necessário,
facilitando assim a localização dos documentos
pelos
mecanismos
de
busca
independentemente de alguma informação
prévia da localização física. Os metadados
também desempenham um papel importante ao
©TerraForum Consultores
3
permitir que documentos diferentes possam ser
facilmente agrupados de forma lógica. Para que
isso aconteça é necessário acontecer a
rotulação (tagging) dos documentos, o que
pode ser um processo muito trabalhoso, pois
requer cooperação entre os criadores/geradores
de conteúdo (para facilitar este processo, novas
ferramentas são criadas com o objetivo de
minimizar a maioria das entradas manuais
através da geração automática de informações
para índices como autor, data de criação, etc.).
empresa. Isto ocorre porque estas pessoas já
têm suas próprias maneiras idiossincráticas de
procurar por informação que eles precisam.
Sendo que, em geral, são os novatos e os
agentes externos (clientes, parceiros, etc) que
necessitam de ajuda para compreender como
um determinado campo do conhecimento é
organizado e se relaciona com outros campos
do conhecimento.
Na maioria dos casos, os integradores externos
de sistemas ou firmas de desenvolvimento web
são responsáveis por desenvolver um esboço
de taxonomia inicial. No entanto, no processo
de elaboração de taxonomias, além do
cumprimento das etapas metodológicas para
recolhimento das informações a serem
organizadas, existe um momento de grande
importância para o sucesso da empreitada: a
validação.
A captura de metadados ocorreria idealmente
logo após a criação do conteúdo. Isso tem
ocorrido cada vez mais através da combinação
de processos automáticos (tipicamente autor,
nome, data, etc.) e manuais (palavras-chave,
categorias, etc.). Os metadados mais
importantes, no entanto, são aqueles
usualmente fornecidos pelos próprios autores e
incluem
informações
detalhadas
dos
documentos (ex: resumo, contexto na criação,
objetivo, outros autores que tenham contribuído,
etc). Em um ambiente no qual exista uma
taxonomia definida e compartilhada, os
metadados são armazenados de forma
(
Neste momento, são reunidos grupos de
funcionários com funções heterogêneas dentro
da organização, que recebem conceitos
relacionados à construção e à validação da
taxonomia, e participam de exercícios de
)
+
*
)
,
.
organizada e padronizada, e o trabalho tanto de
quem publica informação, como de quem a
pesquisa é otimizado.
DESENVOLVIMENTO DE TAXONOMIAS
Preferencialmente, a construção de uma
taxonomia deveria começar com entradas
construídas em conjunto com os especialistas
ou “proprietários” dos conteúdos e os arquitetos
da informação. Em muitos casos, esta é uma
colaboração importante porque muitos
especialistas não estão muito preocupados
sobre como o conhecimento é organizado na
)/
pesquisa e classificação de informações
geradas pela empresa.
Essa etapa é fundamental por pelo menos três
motivos:
1. Os geradores de informação se vêem
como pesquisadores ou usuários da
mesma, e passam a enxergar a
padronização dos metadados com
mais cuidado e relevância;
2. Atinge-se a consistência e coerência
na validação das estruturas, uma vez
que quem as utiliza (ou a utilizará) de
fato tem a oportunidade de interferir
no processo. Além disso, são trazidos
©TerraForum Consultores
4
elementos e conceitos que realmente
representam as informações da
organização;
3. Finalmente, há a integração dos
funcionários no processo, que
passam a entender a importância da
taxonomia e a internalizar seus
procedimentos.
Como resultado do processo, surge uma
estrutura taxonômica que se apresenta como
um mapa das informações da organização, de
forma padronizada, e que integra as várias
visões existentes dentro da empresa por meio
de uma interface única, adaptável às
necessidades de cada funcionário e usuário das
informações da organização.
USO DE FERRAMENTAS DE TI
Há várias ferramentas disponíveis no mercado
que visam auxiliar grandes corporações nas
etapas de criação, população, utilização e
manutenção de árvores de classificação.
Empresas como Verity, Entrieva (antiga Semio)
e Stratify oferecem softwares que incorporam
algoritmos bastante diversificados, que visam
interpretar documentos em texto, reconhecer
semelhanças entre contextos e definir se devem
pertencer a uma determinada categoria ou não.
A definição de uma boa estrutura de categorias
é um passo fundamental, e sua obtenção deve
ser respaldada pelo uso de uma metodologia
bem definida. Há, entretanto, ferramentas de TI
que têm por finalidade analisar grandes
números de documentos, mostrando pontos em
que há semelhanças, bem como critérios para
diferenciação entre eles. A análise deste
resultado é útil, porque revela eventuais interrelacionamentos que passariam despercebidos,
e que, caso sejam considerados relevantes,
poderão ser incorporados à árvore de
categorização proposta.
Há também fornecedores que têm estruturas de
classificação já prontas. Tal como os resultados
obtidos pela aplicação das ferramentas, estas
estruturas prontas (e já validadas em seus
segmentos de mercado) podem ser usadas
para confrontação e enriquecimento do
resultado do trabalho realizado nas dinâmicas
com usuários e arquitetos de informação.
À primeira vista, a classificação manual seria
uma boa forma para associar documentos a
estruturas de categorias pré-definidas. Pessoas
com conhecimento prévio dos documentos
saberiam categorizar corretamente, o que
garantiria a qualidade do resultado final (vide,
por exemplo, o que as pessoas já fazem
naturalmente nos diretórios de seus próprios
desktops ou redes departamentais).
Entretanto, o processo de categorização
executado apenas manualmente não é viável
quando o número de documentos é muito
grande (dezenas de milhares). Os algoritmos de
classificação automática, por sua vez, possuem
capacidade
para
processar
grandes
quantidades, com regras uniformes para todo o
universo de documentos. Dentre as técnicas
mais utilizadas na classificação automática,
encontram-se:
Classificação baseada em regras, onde as
“regras” definidas previamente por especialistas
são aplicadas ao conteúdo dos documentos,
metadados e situações específicas do negócio,
como, por exemplo, o tempo de validade de
documentos;
Análises estatísticas aplicadas ao conteúdo,
que tentam aprimorar o entendimento do
contexto e reduzir ambigüidades de termos
isolados. Examina-se a freqüência de palavras
e sua localização no texto, entre outras
características;
Cálculos de probabilidade Bayesiana: em
que o nível de correlação às palavras que
definem uma categoria é determinado através
da presença, no texto, de outras afins;
©TerraForum Consultores
5
Correlação semântica e lingüística: que
dependem do idioma e utilizam dicionários e
tesauros para aprimorar o “entendimento”;
Support Vector Machines (SVM): que
considera cada documento como sendo um
“vetor”, com “direção” calculada em função da
gama de palavras contidas e “magnitude”
definida conforme a quantidade destas
palavras. Documentos são classificados às
categorias que possuem “vetores” semelhantes.
As aplicações e ferramentas relacionadas às
atividades relacionadas à classificação de
documentos pertencem a um segmento
excepcionalmente dinâmico de mercado, já que
tanto as tecnologias quanto os usos para
árvores taxonômicas estão em constante
evolução. Ainda assim, algumas tendências
podem ser antevistas, tais como:
1. Integração gradual de taxonomias a
diversos sistemas corporativos, como
mecanismos de busca, portais
corporativos, geradores de conteúdo
e outros;
2. Uso de representações espaciais de
categorias e inter-relacionamentos;
3. Adoção de linguagens específicas,
como a proposta pela iniciativa
TopicMap.org, que procura incorporar
contexto às informações de forma
padronizada;
4. Reconhecimento dos usuários e das
informações que têm interesse
(personalização). Ainda, técnicas
computacionais
destinadas
à
interpretação de texto deverão se
desenvolver bastante nos próximos
anos, o que deverá favorecer ainda
mais a utilização de software para
esta finalidade.
VALIDAÇÃO
E
TAXONOMIAS
MANUTENÇÃO
DAS
A validação da estrutura de categorias é feita
através do constante monitoramento do
desempenho da taxonomia. Neste sentido,
observam-se indicadores específicos, tais
como:
1. A quantidade de usuários que não
encontram os documentos que
procuram;
2. Os documentos e categorias que têm
volume de acessos muito acima ou
abaixo da média;
3. Número
de
documentos
não
categorizados automaticamente;
4. Número de documentos presentes nas
diversas categorias, bem como seu
crescimento e diminuição no tempo.
Os resultados obtidos podem indicar
necessidade de re-estruturação da
árvore, alteração de regras para
alocação de documentos, etc.
A manutenção atualizada das categorias de
informação validadas exigirá, porém, a
designação de várias novas responsabilidades
para os funcionários da empresa e o uso de
ferramentas sofisticadas para automatizar parte
do esforço de classificação do conteúdo
existente. Neste processo, que é permanente,
são diversos os desafios para os quais as
empresas devem se preparar:
• Quem traz a voz do cliente ou usuário?
• Como permitir a re-categorização de
documentos com base em feedback dos
usuários?
• Como conciliar diferentes visões sobre a
organização
do
conhecimento
organizacional?
• Quem deve decidir sobre quais categorias
um documento deve ser enquadrado?
• Quem manterá a integridade da taxonomia
à medida que ela cresce ao longo do
tempo?
Estas questões são fundamentais para que se
mantenha uma taxonomia de qualidade: suas
respostas determinarão o rumo do mapeamento
das informações na organização. Além disso, é
importante ressaltar o caráter dinâmico desse
©TerraForum Consultores
6
instrumento assim como das informações
organizadas, o que explica a necessidade de
freqüente manutenção, atualização e validação
da taxonomia.
taxonomias.
Seu
[email protected]
e-mail
é
Carlos Eduardo Franco é consultor associado
da TerraForum e trabalha como consultor na
criação e reestruturação de websites de
empresas e organizações interessadas em
otimizar os resultados de sua presença na
Internet.
Seu
e-mail
é
[email protected]
CONSIDERAÇÕES FINAIS
Empresas que vivem na Era da Informação e do
Conhecimento precisam dar o devido
tratamento aos seus principais inputs e fatores
de produção: a informação e o conhecimento. O
desenvolvimento de taxonomias específicas
para o negócio da empresa é um dos pilares da
gestão da informação do conhecimento. Esta
disciplina ou conceito, no entanto, precisa da
devida atenção dos níveis mais altos da
organização e, como procuramos destacar
neste artigo, do trabalho de especialistas com
métodos e ferramentas testadas na prática.
01
# !1
"0
A TerraForum Consultores é uma empresa de
consultoria e treinamento em Gestão do
Conhecimento
(GC)
e
Tecnologia
da
Informação. Os clientes da empresa são, em
0& !
sua maioria, grandes e médias organizações
Taxonomia - Conceitos e Confusões
dos setores público, privado e terceiro setor. A
empresa atua em todo o Brasil e também no
***
José Cláudio Cyrineu Terra é presidente da
TerraForum Consultores. Atua como consultor e
palestrante no Canadá, nos Estados Unidos,
em Portugal, na França e no Brasil. Também é
professor de vários programas de pósgraduação e MBA e autor de vários livros sobre
o tema. Seu e-mail é [email protected]
Ricardo Schoueri é consultor associado da
TerraForum e sócio fundador da Íntegra
Tecnologia. Ricardo atua há 15 anos como
consultor e engenheiro de software, onde tem
procurado adequar recursos de TI e modelos
matemáticos a problemas reais de negócio. Seu
e-mail é [email protected]
Michely Jabala M. Vogel é consultora
associada da TerraForum, Bibliotecária formada
pela USP, mestranda em Ciência da Informação
pela mesma instituição. Especialista na
elaboração e aplicação de ontologias e
exterior, tendo escritórios em São Paulo,
Brasília e Ottawa no Canadá. É dirigida pelo Dr.
José Cláudio Terra, pioneiro e maior referência
em Gestão do Conhecimento no país. Além
disso, conta com uma equipe especializada e
internacional de consultores.
234
50671
"1
!!0'
8!2#
Gestão do Conhecimento e E-learning na
Prática
Portais Corporativos, a Revolução na Gestão
do Conhecimento
Gestão do Conhecimento - O Grande Desafio
Empresarial
©TerraForum Consultores
7
Gestão do Conhecimento em pequenas e
médias empresas
Realizing the Promise of Corporate Portals:
Leveraging Knowledge for Business Success
Gestão de Empresas na Era do Conhecimento
©TerraForum Consultores
8

Documentos relacionados

Taxonomia e a Web, Construção e Uso.

Taxonomia e a Web, Construção e Uso. variantes lexicais na interface de navegação não causa estranheza, pois o usuário logo

Leia mais