Internet1 - Toda a gente tem um..

Transcrição

Internet1 - Toda a gente tem um..
Principais Serviços da Internet
• WEB ou WWW (World-Wide Web) - navegar entre páginas hipermédia (páginas WEB)
• Email (Correio Electrónico) - troca de mensagens electrónicas (pequenos ficheiros de texto)
INTERNET
entre utilizadores através de caixas de correio (mailbox).
• Newsgroups - Grupos de discussão/noticias organizadas por temas especializados em que os
utilizadores trocam mensagens entre si de forma pública.
• FTP (File Transfer Protocol) - Transferência de Ficheiros entre computadores remotos
• IRC (Internet Relay Chat) - conversas em tempo real (on-line) entre utilizadores remotos
• ............
pag. 1
Web
Web ou
ou WWW
WWW (World
(World Wide
Wide Web)
Web)
INTERNET
WWW ou WEB =
rede de documentos multimédia (texto, som ou imagem), em formato HTML,
interligados entre si através de ligações dinâmicas (hyperlinks).
O protocolo para a sua manipulação é o HTTP (HyperText Transfer Protocol)
A WEB existe dentro da própria Internet.
HTML (HyperText Markup Language) - linguagem normalizada utilizada para construir
documentos Web
HTTP (HyperText Transfer Protocol) - protocolo de comunicação utilizado na Web e que
gere o acesso a documentos WWW
HyperLink - ligação que permite ter associado a um conjunto de palavras ou imagem o
endereço para acesso a uma outra página Web ou a outra parte da mesma página.
A activação desta ligação desencadeia o processo de acesso ao novo endereço
pag. 2
O que faz da WEB um Sistema Distribuído?
A WEB assenta sobre dois protocolos essenciais:
- um protocolo que permite a transferência de informação entre dois computadores (HTTP)
- um protocolo de descrição/construção das páginas (HTML)
INTERNET
A linguagem de descrição das páginas permite
elaborar aquilo a que chamamos hipertexto,
na base da informação distribuída.
-------.......
.......
xxxx
-------.......
.......
xxxx
A WEB é um grande documento, acessível de todo o lado e composto
por uma imensidade de páginas distribuídas por milhões de computadores
diferentes.
A cola que permite manter alguma unidade em toda
esta informação, e que permite “navegar” na mesma,
pag. 3
são os chamados hyperlinks, embebidos no texto,
que permitem saltar de uma página para outra.
-------.......
.......
xxxx
-------.......
.......
xxxx
1. Navegar na Web
“Navegar” na Internet = “Navegar” na Web
=> percorrer as ligações (também designadas por hiperligações) entre páginas Web
à procura da informação pretendida
INTERNET
Browser - programa que permite navegar na Web, i.e., permite ver páginas Web e seguir
as suas ligações. Os mais conhecidos: Internet Explorer e o Netscape Navigator
Internet Explorer 4.0
pag. 4
voltar à página visitada imediatamente
antes da página actual
ir para a página seguinte,
após ter retrocedido
suspender o carregamento da página
(útil quando surgem problemas)
recarregar a página actual
INTERNET
ir para a página inicial (Home Page - aquela que é carregada no inicio da sessão)
efectuar pesquisas utilizando
motores de busca
lista dos Web sites favoritos
lista das páginas já visitadas,
organizadas por datas
pag. 5
imprimir a página actual
Caixa Endereço - onde é digitado o endereço URL da página que se pretende abrir.
Após introduzir o endereço, basta Enter ou Ir Para
INTERNET
pag. 6
lista de páginas Web
visitadas recentemente
“Navegar” - percorrer as hiperligações entre páginas Web
à procura da informação pretendida
abrir páginas Web
1 - introduzir o endereço da página na Caixa Endereço
INTERNET
pag. 7
2 - percorrer as hiperligações
Um objecto numa página Web é uma hiperligação se ao passar o ponteiro do rato sobre o objecto:
- o ponteiro fica com o aspecto de uma mão
- na barra de estado surge o endereço URL de uma página Web
- Fazer: clique com o botão esquerdo do rato => percorrer a hiperligação
Uma hiperligação pode estar associada a:
Descrição Textual
INTERNET
Imagem
Uma imagem pode ser simples ou
composta.
Uma imagem simples está associada
a um link
pag. 8
Uma imagem composta pode estar
associada a mais do que um link
Observações:
1. Várias janelas podem estar abertas em simultâneo.
Em cada janela podemos ter uma página diferente.
=> podemos estar a ver/carregar várias páginas em simultâneo
Multitarefa
INTERNET
Arquivo → Novo → Janela
2. Armazenar informação contida numa página:
- seleccionar e copiar/colar blocos de texto
- carregar todas as páginas ligadas a uma página (utilitário Grab-a-Site)
- gravar imagens
pag. 9
- gravar a página Web no nosso computador (pode ser gravada como ficheiro de texto)
INTERNET
pag. 10
2. URL - endereços das páginas Web
Uma página Web é identificada por um endereço electrónico próprio (e único)
=> URL (Uniform Resource Locator)
- os endereços URL não se limitam a identificar páginas Web
- permitem a uniformização da referência de recursos na Internet
INTERNET
Formato genérico dos endereços
protocolo://servidor_Internet/localização
URL (Uniform Resource Locator)
protocolo => indica ao Browser que deverá contactar o servidor designado no endereço,
utilizando o protocolo indicado: http (Web); ftp (FTP);news (News);...
servidor_Internet => identificação da máquina (servidor) onde está alojado o documento
(ex. página Web) sendo responsável pela resposta aos pedidos pelo documento
localização => é a localização precisa do documento (ficheiro) dentro do servidor
Se omitido considera-se index.html
Se protocolo = http => documento = página Web
pag. 11
http://www.ipca.pt/~ajtavares/inf/programa.html
protocolo: http => o documento é uma página Web
servidor_Internet: www.ipca.pt
=> nome do servidor = www (nome comum a um servidor Web)
INTERNET
=> domínio da entidade = ipca
=> domínio de topo = pt (domínio Português)
localização: ~ajtavares/inf/programa.html
=> nome do documento = programa.html (página Web)
=> localização do documento no servidor = ~ajtavares/inf (pastas)
Maiúsculas são iguais a minúsculas
Exemplos de URLs válidas:
pag. 12
http://www.ipca.pt/~ajtavares/
ftp://ftp.ci.uminho.pt/pub/
http://www.altavista.com
http://www.infocid.pt
http://www.uminho.pt/index.html
http://www.uminho.pt
Domínio - um domínio identifica o sistema na Internet estando normalmente relacionado com o
nome da empresa ou instituição a que pertence. Existem domínios de topo (países e
algumas organizações) e sub-domínios (empresas ou instituições)
Todos os domínios são geridos por organizações que se encarregam de evitar conflitos de endereços.
Em Portugal essa responsabilidade cabe à FCCN - Fundação para a Computação Científica Nacional.
INTERNET
Alguns domínios de topo:
.pt - Portugal
.es - Espanha
.uk - Reino Unido
.com - Organizações Comerciais
.edu - Universidades
.mil - Organismos militares (EUA)
.gov - Organismos Governamentais (EUA)
.net - Organismos de suporte/controlo da Internet
Lista completa de:
- Domínios de Topo
- Sub-domínios de pt
pag. 13
.us - Estados Unidos
procurar em => http://www.fccn.pt
Correio
Correio Electrónico
Electrónico ou
ou email
email
Serviço que permite que as pessoas ligadas à Internet troquem mensagens entre si.
As mensagens são pequenos ficheiros de texto (constituídos por bytes - caracteres).
INTERNET
- Cada utilizador tem uma caixa de correio electrónico à qual corresponde um endereço de email
Endereço do docente da disciplina: [email protected]
- É possível anexar ficheiros (gráficos, documentos word, folhas de cálculo) à mensagem
- Um servidor de correio electrónico (mail.ipca.pt) deposita as mensagens que recebe nas caixas de
correio dos utilizadores a que se destinam
- Caixa de Correio => filosofia Assíncrona
O destinatário da mensagem não tem de estar activo (on-line) para receber uma mensagem.
As mensagens são depositadas numa caixa de correio, podendo ser lidas em qualquer altura.
pag. 14
- Uma mensagem chega ao destinatário em poucos segundos e a um custo extremamente baixo
independentemente do local a que se destina
1. Os endereços de correio electrónico
Os endereços de email contêm o símbolo @ (“éte” ou “arroba”) e
- têm o formato: nome@domínio
- nome - identificação do utilizador destinatário
- domínio - identificação do domínio a que pertence o utilizador
- a cada domínio corresponde um servidor responsável pelo serviço de email
INTERNET
- servidor de email do ipca: mail.ipca.pt
Endereços de email do docente da disciplina:
[email protected] - endereço no ipca
[email protected] - endereço no ISP Clix
- um utilizador pode ter o mesmo nome em domínios diferentes
- um utilizador não pode ter o mesmo nome no mesmo domínio
Locais onde se pode criar uma caixa de correio grátis
pag. 15
http://www.clix.pt
http://www.sapo.pt
http://mail.pt
http://www.hotmail.com
Listas de email ou Mailing Lists
Constituem um meio simples e prático de se manter correspondência com um grupo de
pessoas interessadas num mesmo assunto
INTERNET
- um participante numa lista ao enviar uma mensagem de email para a lista, esta é
recebida por todos os participantes na lista
- os participantes numa lista apenas têm de ter um endereço de email
=> Serviço já antigo mas bastante utilizado nos meios académicos
=> Serviço percursor dos newsgroups
pag. 16
2. Estrutura de uma mensagem de correio electrónico
Funcionalidades básicas de um programa de correio electrónico:
Enviar - enviar uma mensagem para um determinado endereço ou para vários endereços
Receber - consultar a caixa de correio (no servidor)
Responder - responder a uma mensagem que nos foi enviada
Encaminhar (Forward) - enviar uma cópia de uma mensagem recebida a uma outra pessoa(s)
INTERNET
Anexar - anexar um ficheiro a uma mensagem a enviar
Estrutura de uma mensagem:
De - endereço do autor da mensagem
Data - altura em que a mensagem foi enviada
Cabeçalho - especifica o assunto da mensagem e os endereços dos destinatários da mensagem
Mensagem - texto da mensagem
Ficheiros anexos - ficheiros (imagens, folhas de cálculo, ...) que vêm anexados à mensagem
Assinatura - possibilidade de incluir, automaticamente, no final de todas as mensagens a enviar,
uma assinatura com informações acerca do autor (ex. nome, cargo, endereços e telefones, ....)
pag. 17
Cabeçalho de uma mensagem:
INTERNET
Para - endereços dos destinatários principais da mensagem (se mais do que um separar por ;).
Cada destinatário fica a conhecer a lista de todos os destinatários.
Cc - endereços dos destinatários secundário que receberão uma cópia da mensagem enviada para
os destinatários principais (“Carbon copy”). Cada destinatário conhece a lista de destinatários.
Cco - tal como em Cc mas cada destinatário não conhece a lista de destinatários.
Assunto - assunto ou título da mensagem.
pag. 18
3. Utilização do correio electrónico
Ler
LerooCorreio
CorreioElectrónico
Electrónico
- clientes de correio electrónico: Outlook Express; Eudora Light; Netscape Mail; ...
Protocolo POP3 (Post Office Protocol)
INTERNET
Botão de acesso ao
ficheiro anexado
Indica que a mensagem
tem um ficheiro anexado
pag. 19
- Webmail - ler o correio electrónico através de páginas Web
INTERNET
pag. 20
Conselhos
Conselhos
- consulte a sua caixa de correio periodicamente (1xdia)
- as mensagens devem ser breves e concisas
- no campo assunto descreva de forma resumida o teor da mensagem
INTERNET
- responda o mais rápido possível
- verifique com antivírus os ficheiros anexados a mensagens.
Cuidado com programas anexados a mensagens duvidosas
- não envie ficheiros anexados excessivamente grandes (> 1MB)
- envie ficheiros anexados compactados (ex. WinZip)
- uma mensagem enviada e não recebida é devolvida pelo servidor.
Verifique se o endereço está correcto e envie mais tarde.
pag. 21
- ..... outras regras de ETIQUETA
4. Antivírus
INTERNET
Vírus - pequeno programa que se pode acoplar (unir) a outro programa ou ficheiro,
multiplicando-se assim por sucessivos programas/ficheiros.
- A sua transmissão pode ser feita através de: ficheiros anexados a mensagens email,
macros em documentos do Word, programas executáveis, disquetes, ....
- A sua execução é automática, não dependendo do utilizador
- As consequências da sua execução podem ser: inutilização de discos rígidos;
alteração dos dados de ficheiros; pequenas brincadeiras inofensivas; ....
AntiVírus - programa que analisa o sistema informático de modo a detectar a presença
de vírus e a efectuar a sua remoção.
Estes programas devem ser actualizados com bastante regularidade.
Exemplo:
- Norton AntiVirus
- McAfee VirusScan
pag. 22
4. Compressão e Descompressão de ficheiros
Quanto mais pequeno for um ficheiro:
- mais rapidamente pode ser enviado através da Internet (download, email, ...)
- mais facilmente é armazenado numa disquete
INTERNET
Comprimir ficheiro - compactar o seu conteúdo (dados) num ficheiro mais pequeno
mas ilegível.
Descomprimir ficheiro - descompactar o conteúdo dum ficheiro compactado,
de modo a que fique legível.
Um conjunto de ficheiros e pastas podem ser comprimidas num único ficheiro.
A extensão de um arquivo comprimido indica o formato de compressão utilizado.
Formatos de compressão: .arj .arc .lzh
.zip → Winzip (Programa compressor/descompressor)
pag. 23
Arquivos com auto-extracção - alguns ficheiros com extensão .exe podem ser ficheiros
comprimidos de auto-extracção (não necessitam de programa descompressor)
5. Obter utilitários - locais na Internet
Compactadores
Compactadores
http://tucows.ip.pt/comp95.html
http://tucows.ip.pt/virus95.html
http://tucows.esoterica.pt/comp95.html
http://tucows.esoterica.pt/virus95.html
INTERNET
OOSoftware
Softwareobtido
obtidoéénormalmente
normalmenteShareware
Shareware
http://tucows.ip.pt
http://tucows.esoterica.pt
pag. 24
AntiVírus
AntiVírus
mirrors
mirrorsdo
doTUCOWS
TUCOWS
Tucows é um dos maiores
repositórios de Software em
toda a Internet
Mirror - computador onde se armazena uma cópia de informação residente em
outro computador distante, cópia essa actualizada automaticamente.
Os utilizadores não necessitam de se ligar ao local original sempre
que necessitarem de informação. Em vez disso, deve ligar-se ao
local mais próximo.
Grupos
Grupos de
de Discussão
Discussão ou
ou newsgroups
newsgroups
São grupos de mensagens públicas organizadas por temas mais ou menos
especializados onde os participantes no grupo podem ler e colocar (post)
artigos visíveis a todos os outros participantes.
INTERNET
São uma espécie de boletins de parede, onde toda a gente pode ler textos e também colocar (post)
o seu pequeno texto para que outros o leiam.
Um texto pode ser colocado para pedir ajuda, por exemplo, mas também pode ser anexado como
comentário ou resposta a outro texto já existente, podendo-se assim criar uma cadeia de
comentários a um texto inicial sempre visível a nível mundial.
É o local ideal para:
- colocar questões do género: Alguém me pode dizer como ...?
- obter informação quanto a matérias muito específicas
- obter consensos na discussão de matérias
pag. 25
As newsgroups estão organizadas por hierarquias, em forma de árvore, sendo cada folha o local
onde se encontram os texto publicados.
O número de newsgroups (folhas) actualmente existentes ultrapassa já os 80000, dividindo-se em
diversas hierarquias de topo:
INTERNET
soc: temas sociais;
sic: ciência;
rec: recriação e desporto;
biz: negócios;
pt: hierarquia portuguesa
alt: grupos alternativos (todos os temas possíveis);
comp: informática, computadores;
Exemplos: pt.política
pt.soc.economia
comp.infosystems.www.misc
Um newsgroups pode ser moderado ou não moderado, i.e., as mensagens colocadas no
grupo podem ser ou não controladas
FAQs (www.faqs.org)- a maioria dos newsgroups disponibiliza periodicamente um arquivo
contendo as FAQs (Frequently Asked Questions) i.e., as respostas às perguntas mais
frequentes relativas aos assuntos discutidos no grupo. Antes de colocar questões ao grupo
pag. 26
deve primeiro procurar a resposta à sua pergunta nas FAQs
INTERNET
pag. 27
Webmail - ler os grupos de discussão através de páginas Web
Endereços
Endereçosúteis
úteis
http://www.deja.com => é também o maior pesquisador de news no mundo
http://www.supernews.com
Servidores públicos de news:
INTERNET
news.telepac.pt
http://www.newspage.com/
http://www.reed.edu/~greaber/url-servers.html
http://www1.stuttgart.netsurf.de/~ronz/index.html
http://schedule96.net
http://www.4a2z.com/cgi/rfrsearch.cgi?4anything-2-http://newssearch.pilum.net/
http://www.neurophys.wisc.edu/~kochhar/freenew.html
http://www.arcwebserv.com/jumpsite/usenet.html
pag. 28
Transferência
Transferência de
de Ficheiros
Ficheiros -- FTP
FTP
INTERNET
Na Internet a maior parte da informação está disponível sob a forma de ficheiros e não
como páginas Web.
O FTP é um protocolo de comunicação que permite transferir, com rapidez e segurança,
ficheiros entre computadores mesmo que tenham sistemas operativos diferentes.
O protocolo FTP permite:
- Download - transferência de ficheiros de um servidor (remoto) para o computador do utilizador.
- Upload - operação inversa, i.e., transferência de ficheiros do computador (local) do utilizador para
um servidor (remoto).
Os grandes repositórios de Software
estão em servidores FTP
Aceder a um servidor de FTP:
=> FTP Anónimo - quando não tem autorização especial de acesso
Login:anonymous
pag. 29
Password:endereço de mail
=> Com senha de acesso pessoal
Organização de um servidor FTP:
Um servidor de FTP tem um número gigantesco de ficheiros organizados numa estrutura de
directorias e sub-directorias.
Um utilizador que entre no servidor através de FTP Anónimo, normalmente, apenas tem acesso à
directoria Pub (e todo o seu conteúdo).
INTERNET
Normalmente, existe em cada directoria um ficheiro de texto (ex. index.txt ou contents.txt) com o
índice e descrição da respectiva directoria.
Alguns servidores de FTP:
pag. 30
ftp.ip.pt
servidor de FTP da IP (operador Internet Portugal)
ftp.esoterica.pt
servidor de FTP da Esotérica (operador)
ftp.ci.uminho.pt
servidor de FTP do Centro de Informática na Universidade do Minho
ftp.ua.pt
arquivo de Software da Universidade de Aveiro
ftp.dei.uc.pt
servidor de FTP do Depart. de Eng. Informática da Universidade do Minho
ftp.ncc.up.pt
servidor de FTP da Universidade do Porto
ftp.ualg.pt
servidor de FTP da Universidade do Algarve
Transferir ficheiros via FTP:
- Através de um programa específico (ex. WS_FTP)
INTERNET
- Através de um Browser
=> através do endereço URL ftp://servidor/caminho temos acesso ao servidor
por FTP Anónimo
o login é automático
=> um link de uma página Web pode apontar para um ficheiro de um servidor FTP.
O carregamento desse ficheiro é feito directa ou indirectamente por FTP Anónimo.
Método usual para Download de programas
pag. 31
=> FTP Anónimo
através de Browser
INTERNET
=> carregamento de ficheiro
através de Browser
pag. 32
IRC
IRC -- Internet
Internet Relay
Relay Chat
Chat
O IRC é um serviço que permite aos seus utilizadores conversarem entre si,
em modo texto e em tempo real.
INTERNET
Necessário: programa específico (cliente): ex. Mirc ; servidor de Irc
Funcionamento do IRC:
- o utilizador escolhe:
- um pseudónimo (nickname) real ou inventado pelo qual é identificado pelos outros
utilizadores
- um dos canais (salas) para conversar com os utilizadores presentes nesse canal
- tudo aquilo que escrever é visto por todos os utilizadores presentes no canal
- o utilizador vê tudo aquilo que é escrito por todos os utilizadores presentes no canal
- é possível o estabelecimento de conversas privadas entre dois utilizadores
pag. 33
Problemas:
- utilização de Pseudónimo (Anonimato) => alteração de personalidade
- desperdício de recursos a nível global ?!?!
É a grande dor de cabeça dos Responsáveis por Departamentos de Informática:
INTERNET
- baixa brutal na rentabilidade dos recursos informáticos da organização
- aumento acentuado do tráfego a nível mundial
Ganho de produtividade = zero ?!?!
Opinião do docente
não publicável
pag. 34
Pesquisa
Pesquisa de
de Informação
Informação na
na WEB
WEB
INTERNET
Encontrar coisas/informação na Web
=> Objectivo: “Navegar” na Web sem se perder
=> Situações:
- sabemos com mais/menos exactidão qual a informação que procuramos
(ex. um artigo, um programa, uma pessoa, ...)
- não sabemos com exactidão qual a informação que procuramos, i.e.,
apenas temos uma ideia acerca do que procuramos
(ex. informação acerca de uma área cientifica, de um assunto, ....)
=> Recursos:
- conhecimento pessoal (os sites de que temos conhecimento)
- índices ou directórios (gigantescos repositórios de endereços organizados)
- ferramentas (software) para pesquisa automática
- .....
- PORTAIS (locais de partida)
pag. 35
Boa fonte de informação acerca da própria WEB => http://www.w3.org/
1. Métodos de procura de informação na WEB
1.1- Pergunta directa ou Consulta de páginas de Instituições credíveis
(ex. Universidades, Instituições Governamentais, tucows, etc.)
INTERNET
1.2- As news como boa fonte de informação acerca de endereços de páginas e ......
- consulta de FAQs
- grupos de anuncio de endereços
comp.infosystems.www.announce
=> http://www.boutell.com/announce
pt.mercado
pt.internet.www
=> http://faq.etc.pt pesquisa de FAQs
1.3- Páginas Brancas - Lista que contém nomes de pessoas, juntamente com os respectivos
meios de contacto, geralmente o email e o endereço da página pessoal
Lista telefónica nacional => http://net118.telecom.pt/
Páginas Amarelas => http://www.paginasamarelas.pt
Internet Address Finder => http://www.iaf.net
Outras ferramentas: http://www.altavista.com/
pag. 36
1.4- Directórios ou índices (ou Páginas Amarelas)
Os directórios da Internet, são locais na WEB que funcionam como pontos de partida para a
pesquisa de informação
- são repositórios que albergam quantidades enormes de referências e endereços
- as referências estão organizadas em categorias (hierarquicamente)
INTERNET
- útil quando não se tem uma ideia muita precisa em relação ao que se quer procurar.
- o seu conteúdo (referências) é da responsabilidade de pessoas
- os detentores das páginas pedem a sua inclusão (registo) no repositório
- os gestores do repositório decidem quais os pedidos de registo que são aceites
- os gestores do repositório acrescentam os registos aceites de forma organizada
- também permitem pesquisas automáticas sobre o repositório com base em palavras chave
pag. 37
YAHOO
http://www.yahoo.com
--> o pioneiro
Infoseek
http://www.infoseek.com
SAPO
http://www.sapo.pt
Galaxy
http://galaxy.einet.net
www Virtual Library
http://www.vlib.org
ClearingHouse
http://www.clearinghouse.net --> índice de índices
4anything
http://www.4a2z.com ou 4anything.com --> índice de índices
1.5- Motores de busca
Os Motores de busca (ou pesquisadores ou Robots) mantêm um gigantesco repositório de
endereços e referências
- o utilizador efectua uma pesquisa automática sobre essas referências com base em palavras chave
- alimentam repositórios que contêm grandes quantidades de referências
INTERNET
- a alimentação do repositório é feita continuamente e automaticamente pelos motores de procura
e sem a intervenção humana
- a forma como a informação é adquirida determina os pontos fortes e os pontos fracos
do pesquisador => Não existe o melhor motor de busca
- mais informações acerca de motores de busca em
Consumer´s Guide to Search Engines
http://www.imaginarylandscape.com/helpweb/www/seek.html
Os mecanismos de pesquisa na Internet dividem-se em dois grandes grupos:
• directórios em que a informação existente é colocada manualmente após verificação;
pag. 38
• directórios em que a informação é angariada por um motor de procura ou Robot
INTERNET
Altavista
http://www.altavista.com
Ask Jeeves
http://www.askjeeves.com
Excite
http://www.excite.com
Hotbot
http://www.hotbot.com
Infoseek
http://www.infoseek.com
Lycos
http://www.lycos.com
WebCrawler
http://webcrawler.com
Yahoo!
http://www.yahoo.com
Go
http://www.go.com
Snap
http://www.snap.com
....
pag. 39
ou
http://hotbot.lycos.com
1.6- Meta-pesquisadores
São motores de busca (ou pesquisadores) que se alimentam i.e. que combinam os
resultados das pesquisas de outros pesquisadores. São pesquisadores de pesquisadores
INTERNET
pag. 40
Search:
http://www.search.com/
Metasearch:
http://www.metasearch.com/
Web Search:
http://www.web-search.com/
Metacrawler:
http://www.metacrawler.com/
Metafind:
http://www.metafind.com
Pusearch:
http://www.puresearch.com
Web locator:
http://weblocator.hypermart.net/
Dogpile:
http://www.dogpile.com/
The Big Hub:
http://www.thebighub.com/
ou http://search.cnet.com/
--> parte de Go2Net
--> meta-meta-pesquisador
2. Estratégias de procura de informação na WEB
Por parte dos Robots ou pesquisadores
INTERNET
=> Mantêm uma gigantesca base de dados com informação indexada (não copiada)
Quando obtém uma página, o Robot guarda na sua base de dados apenas
algumas palavras, de acordo com as estratégias:
- as primeiras X palavras da página
- as X palavras que mais se repetem
- o conteúdo do título da página
- o conteúdo de campos especiais da página
- todas as palavras diferentes
- ...
Quem concebe uma página WEB deve ter em atenção estes critérios.
Os critérios/estratégias utilizados pelo Robot determinam os seus resultados
pag. 41
Por parte dos Utilizadores
=> quando um utilizador inicia uma pesquisa fornecendo uma palavra-chave,
obtém uma lista ordenada de resultados (por ordem decrescente de pontuação)
INTERNET
Estratégias para pontuar páginas:
- quanto mais palavras iguais à palavra-chave a página tiver, mais alta é a pontuação
- se forem fornecidas várias palavras-chave, a primeira é a mais importante, a segunda
vem logo a seguir em termos de “pontos” e assim sucessivamente
- .........
Estratégia de afinação de resultados
=> começar com palavras genéricas e ir sucessivamente refinando a pesquisa
de maneira a ter uma boa ideia acerca dos resultados possíveis e dos
resultados que vão sendo eliminados.
pag. 42
Regra de Ouro: não limitar a pesquisa à utilização de um único motor de pesquisa
3. Portais - os pontos de entrada
Portal - é uma entrada para a Internet.
- é um ponto aglutinador de tráfego
- é um ponto agregador de informação, serviços e tecnologia
INTERNET
Características:
=> maior ou menor diversidade de conteúdos
=> é utilizado por uma comunidade mais ou menos alargada de pessoas
=> é financiado por publicidade a qual é paga em função do número de visitas realizadas
Tipos de Portais: generalistas; comerciais; empresariais; pessoais
Estrutura tipo:
=> suportado por um Directório ou por um Motor de busca
=> permite pesquisas por palavras chave e por categorias (directório)
=> canais
=> notícias
pag. 43
=> permite pesquisar em Páginas Web, em Noticias (news), em grupos de discussão, ...
INTERNET
=> pesquisa por categorias
pag. 44
Alguns Portais relevantes
Portais Internacionais
Portais Nacionais
INTERNET
AOL
http://www.aol.com
http://www.sapo.pt
YAHOO
http://www.yahoo.com
http://www.clix.pt
MSN
http://www.msn.com
http://www.portal.pt
Lycos
http://www.lycos.com
http://www.aeiou.pt
http://www.netc.pt
pag. 45
GO
http://www.go.com
Excite
http://www.excite.com
Altavista
http://www.altavista.com
http://www.teleweb.pt
Netcenter
http://www.netcenter.com
http://www.iupi.pt
http://www.cusco.pt
http://www.telepac.pt
4. Pesquisa com base em palavras chave
Existem ligeiras diferenças entre os diferentes motores de busca/portais => consultar help
INTERNET
Caso de estudo: Altavista
contabilidade publica
Procura documentos que contêm a palavra contabilidade ou a palavra publica ou ambas
as palavras (em quaisquer variantes maiúsculas/minúsculas - publica, Publica, PUBLICA)
Contabilidade Publica
pag. 46
Procura documentos que contêm a palavra Contabilidade ou a palavra Publica ou ambas
as palavras, mas não quaisquer outras variantes maiúsculas/minúsculas
Maiúsculas => procura exacta
+contabilidade+publica Procura documentos que contêm ambas as palavras
“Contabilidade Publica” Procura documentos que contenham a sequência de texto que
se encontra entre aspas, i.e., Contabilidade Publica
INTERNET
+Contabilidade-publica
Procura documentos que contêm a palavra Contabilidade
mas não contêm a palavra publica e suas variantes
+Contabilidade+pub*
Procura documentos que contêm a palavra Contabilidade
e qualquer palavra que comece por pub
Resolve situações como: conta, contar, contagem, .....
pag. 47