TCC SEO Analytics - Uma ferramenta para análise de SEO

Transcrição

TCC SEO Analytics - Uma ferramenta para análise de SEO
UNIVERSIDADE DO VALE DO RIO DOS SINOS - UNISINOS
CIÊNCIAS EXATAS E TECNOLÓGICAS
CURSO DE SISTEMAS DE INFORMAÇÃO
ENÉAS URIEL SCHREIBER GESING
SEO ANALYTICS: UMA FERRAMENTA PARA ANÁLISE DE SEO
São Leopoldo
2010
ENÉAS URIEL SCHREIBER GESING
SEO ANALYTICS: UMA FERRAMENTA PARA ANÁLISE DE SEO
Trabalho de conclusão de curso apresentado à
Universidade do Vale do Rio dos Sinos –
UNISINOS, como requisito parcial para a
obtenção do título de bacharel em Sistemas de
Informação.
Orientador: Prof. Ms. Cláudia Flores
São Leopoldo
2010
DEDICATÓRIA
Aqui presto minha homenagem a todos aqueles que de alguma forma me auxiliaram
durante minha vida acadêmica. Dedico este trabalho:
•
Aos meus pais, Lauro Manuel Gesing e Silvana Schreiber Gesing, que me
guiaram pelo caminho correto e permitiram que hoje chegasse até aqui
•
À minha esposa, Patrícia Firme Graciano, por ser compreensiva nos
momentos de ausência e por me motivar a continuar a caminhada, sempre
com muito amor e carinho
•
Aos meus irmãos, Ezael Gesing e Eliel Gesing, que compartilham comigo
momentos especiais e representam para mim uma motivação adicional
•
Aos meus amigos, que sempre estão ao meu lado
•
Aos motoristas de ônibus que me conduziram por mais de 160.000 km de
minha cidade até a universidade durante os sete anos de graduação
•
Ao Programa Universidade para Todos (ProUni), sem o qual não conseguiria
concluir minha graduação nesta excelente universidade que é a Unisinos
AGRADECIMENTOS
Aqui presto homenagem àqueles que contribuíram de maneira relevante para a
elaboração do presente trabalho. Agradeço:
•
À professora orientadora Cláudia Flores, por aceitar o tema por mim sugerido
e por estar constantemente presente durante a elaboração do trabalho
•
À empresa SEOmoz, por conceder acesso gratuito à API Site Intelligence,
autorizar o uso da pesquisa Search Engine Ranking Factors 2009 e responder
rapidamente aos meus questionamentos
•
Aos 72 especialistas de SEO que contribuíram com a pesquisa Search Engine
Ranking Factors 2009
•
Às pessoas que aceitaram avaliar a ferramenta proposta neste trabalho
•
À empresa em que trabalho, representada pelo meu coordenador e amigo
Alexandre Saraiva Soares, por permitir em alguns momentos tornar meu
horário flexível e alterar meu posto de trabalho para que eu pudesse elaborar
o trabalho e realizar encontros presenciais na universidade
RESUMO
A Internet vem crescendo rapidamente em todo o mundo. A cada dia surgem novos
sites e aumenta o número de usuários da rede. A maior parte destes usuários, quando deseja
algum tipo de informação, produto ou serviço, utiliza mecanismos de busca como Google,
Yahoo! e Bing, para encontrar o que quer. Logo, para um site que tenha por objetivo aumentar
o número de visitantes, é essencial estar entre os primeiros resultados das buscas efetuadas
nesses buscadores. O conjunto de estratégias que visa otimizar um site para aparecer entre os
primeiros resultados chama-se Search Engine Optimization (Otimização para Mecanismos de
Busca, ou SEO). Embora existam referências bibliográficas sobre o assunto em quantidade
significativa, não há no mercado uma única ferramenta que forneça indicadores e meça
resultados de SEO de um site e de seus concorrentes de forma satisfatória. Essa monografia
apresenta o desenvolvimento de uma ferramenta capaz de preencher essas lacunas, o SEO
Analytics. A ferramenta está dividida em cinco módulos, e apresenta indicadores e
informações de SEO sobre qualquer site ou página que se deseje medir. Para fins de
validação, a ferramenta foi submetida a especialistas e entusiastas da área para verificação da
aplicação da ferramenta no cotidiano dessas pessoas.
Palavras-Chave: SEO. Análise de SEO. Fatores de Ranking. Indicadores de SEO. SEO
Analytics.
5
ABSTRACT
The Internet is growing rapidly worldwide. Every day brings new sites and increases
the number of network users. Most of these users, when want some information, product or
service, uses search engines like Google, Yahoo and Bing, to find what they want. Therefore,
for a site that has the objective of increasing the number of visitors, it is essential to be among
the top results of searches made in these search engines. The set of strategies aimed at
optimizing a site to appear among the top results is called Search Engine Optimization (SEO).
Although there are references about SEO in significant amount, no there a unique tool on the
market that provides indicators and measure results of an SEO site and your competitors in a
satisfactory manner. This paper presents the development of a tool capable of filling these
gaps, the SEO Analytics. The tool is divided into five modules, and presents indicators and
information on SEO on any site or page. For verification purposes, the tool was submitted to
specialists and enthusiasts in the area to verify the application of the tool in the daily life of
these people.
Keywords: SEO. SEO Analysis. Ranking Factors. SEO Indicators. SEO Analytics.
LISTA DE FIGURAS
Figura 1 - Participação dos motores de busca no mercado em setembro de 2010 .18
Figura 2 - Popularidade de links.............................................................................23
Figura 3 - Barra de ferramentas SEOQuake...........................................................29
Figura 4 - Informações do SEOQuake nos resultados de uma busca.....................29
Figura 5 - Relatório oriundo de uma análise feita usando o SenSEO ....................30
Figura 6 - Parte de relatório do SEO Analytics sobre o conteúdo de um domínio.36
Figura 7 - Estrutura de um link em HTML (RICOTTA, 2010) .............................36
Figura 8 - Pesquisa no Google por “clique aqui” ...................................................37
Figura 9 - Parte de relatório sobre os textos-âncora recebidos por um domínio....38
Figura 10 – Módulo de resultados ..........................................................................39
Figura 11 - Arquitetura multiusuário do SEO Analytics ........................................40
Figura 12 - Fluxo dos dados do SEO Analytics......................................................40
Figura 13 - Interface do SEO Analytics..................................................................42
Figura 14 - Diagrama compacto do banco de dados da aplicação SEO Analytics .43
LISTA DE ABREVIATURAS E SIGLAS
FTP – File Transfer Protocol
SEM – Search Engine Marketing
SEO – Search Engine Optimization
PPC – Pay Per Click
TLD – Top Level Domain
URL – Uniform Resource Locator
SUMÁRIO
1 INTRODUÇÃO ..................................................................................................10
1.1 OBJETIVOS DO TRABALHO ........................................................................11
1.1.1 Objetivo Geral ..............................................................................................11
1.1.2 Objetivos Específicos....................................................................................11
1.2 JUSTIFICATIVA ..............................................................................................12
1.3 DELIMITAÇÃO DO ESTUDO........................................................................12
1.4 ESTRUTURA DO TRABALHO ......................................................................13
2 REFERENCIAL TEÓRICO .............................................................................15
2.1 MECANISMOS DE BUSCA............................................................................15
2.1.1 Objetivos dos Mecanismos de Busca...........................................................17
2.1.2 Mercado dos Mecanismos de Busca............................................................17
2.1.3 Como os Mecanismos de Busca Funcionam...............................................18
2.2 SEARCH ENGINE OPTIMIZATION ................................................................19
2.2.1 Fatores de Ranking .......................................................................................19
2.2.1.1 Fatores on-page relacionados à palavra-chave............................................21
2.2.1.2 Fatores on-page não relacionados à palavra-chave .....................................22
2.2.1.3 Fatores da página relacionados à popularidade de links..............................22
2.2.1.4 Fatores do site relacionados à popularidade de links...................................24
2.2.1.5 Fatores do site não relacionados à popularidade de links............................24
2.2.1.6 Fatores relacionados aos dados das mídias sociais sobre o site ou página..25
2.2.1.7 Fatores relacionados ao uso do site .............................................................25
2.2.1.8 Fatores negativos .........................................................................................25
2.2.1.9 Fatores que afetam negativamente o valor de links externos ......................27
2.2.1.10 Fatores geográficos....................................................................................27
2.2.2 Ferramentas para Análise de SEO Existentes ...........................................28
2.2.2.1 SEOQuake ...................................................................................................28
2.2.2.2 SenSEO 29
2.2.2.3 Ferramentas de SEO privadas......................................................................30
2.2.3 Linkscape .......................................................................................................31
3 METODOLOGIA...............................................................................................32
3.1 DESENHO DE PESQUISA ..............................................................................32
3.1.1 Levantamento Bibliográfico ........................................................................32
3.2 FERRAMENTA SEO ANALYTICS ..................................................................33
3.2.1 Características da Ferramenta....................................................................33
3.2.1.1 Módulos do SEO Analytics .........................................................................33
3.2.1.1.1 Módulo de Métricas de URL ....................................................................33
3.2.1.1.2 Módulo de Links .......................................................................................34
3.2.1.1.3 Módulo de Conteúdo ................................................................................35
3.2.1.1.4 Módulo de Texto-âncora ..........................................................................36
3.2.1.1.5 Módulo de Resultados ..............................................................................38
3.2.2 Arquitetura do SEO Analytics.....................................................................39
3.2.3 Desenvolvimento da Ferramenta ................................................................41
3.2.4 Interface.........................................................................................................41
3.2.5 Banco de Dados.............................................................................................42
9
3.3 COLETA DE DADOS ......................................................................................44
3.4 PREPARAÇÃO PARA A VALIDAÇÃO ........................................................44
3.4.1 Submissão aos Avaliadores ..........................................................................45
3.4.2 Identificação dos Avaliadores......................................................................45
4 VALIDAÇÃO DA FERRAMENTA .................................................................46
4.1 PERCEPÇÃO DOS AVALIADORES..............................................................46
4.1.1 Interface.........................................................................................................46
4.1.2 Contribuições para SEO ..............................................................................47
4.1.3 Gestão do SEO ..............................................................................................48
4.1.4 Substituição das Ferramentas Atuais .........................................................49
4.1.5 Recomendação da Ferramenta....................................................................50
5 CONCLUSÕES E TRABALHOS FUTUROS.................................................52
5.1 IMPLICAÇÕES GERENCIAIS........................................................................52
5.2 IMPLICAÇÕES ACADÊMICAS .....................................................................53
5.3 TRABALHOS FUTUROS ................................................................................53
REFERÊNCIAS ....................................................................................................55
ANEXO A – LISTA DE INDICADORES DE URL FORNECIDOS PELA API SITE
INTELLIGENCE ...................................................................................................57
APÊNDICE 1 – CONVITE ENVIADO AOS INTEGRANTES DO GRUPO DE
DISCUSSÃO BRSEO............................................................................................60
APÊNCIDE 2 – E-MAIL ENVIADO AOS AVALIADORES ...........................61
10
1 INTRODUÇÃO
O crescente aumento do número de pessoas com acesso à Internet no Brasil e em todo
o mundo (CETIC.BR, 2009) traz consigo um número cada vez mais elevado de empresas
interessadas em obter clientes na grande rede. Para uma empresa, independente do seu ramo
de negócios, estar presente na Internet pode representar um excelente meio de atrair novos
clientes e manter os já existentes.
Segundo a empresa de consultoria Serasa Experian Hitwise, a maior fonte de tráfego
na Internet brasileira, é o site de buscas Google, que representa 95,37% do mercado de buscas
na Internet no Brasil. Estima-se, por exemplo, que 53,76% dos visitantes de sites do setor de
saúde sejam originários do Google (o restante se origina de outras fontes como tráfego direto,
links de outros sites e de outros motores de busca). Para um site, estar entre os primeiros
resultados das buscas efetuadas pelos usuários no Google (ou em outros buscadores)
representa obter quantidades consideráveis de visitantes.
A área que visa promover sites aumentando sua visibilidade e os posicionado entre os
primeiros resultados nos motores de busca é conhecida como SEM (Search Engine
Marketing) (LEDFORD, 2007). SEM, por sua vez, é dividido em links patrocinados, que
posicionam o site entre os primeiros resultados em uma parte específica para anunciantes
mediante pagamento de taxa por clique (PPC - Pay Per Click), e SEO (Search Engine
Optimization) que é um conjunto de estratégias de otimização que visam tornar os sites mais
relevantes, importantes e legíveis sob o ponto de vista do mecanismo de busca se baseando
em dados históricos, engenharia reversa do algoritmo de classificação dos buscadores e em
documentos fornecidos pelos próprios sites de busca, com o objetivo de posicionar sites entre
os primeiros resultados de determinadas buscas (LEDFORD, 2007). Estas informações
permitem que diversos fatores de ranking de sites em mecanismos de busca sejam
especulados pelos especialistas da área (ENGE, 2009).
Os investimentos iniciais em SEO costumam ser relativamente baixos porque
envolvem apenas recursos humanos. Entretanto, conforme pode ser verificado em grande
parte dos sites pessoais e de empresas seja pela fraca atuação das equipes que desenvolvem os
sites, por desconhecimento dos fatores de ranking (ENGE, 2009), por desconhecimento dos
benefícios que podem ser obtidos ou mesmo por falta de análise dos resultados, os
webmasters, em geral, não aplicam corretamente estratégias relacionadas à SEO em seus sites.
11
A ferramenta proposta neste trabalho tem por objetivo fornecer indicadores e
informações de SEO a webmasters, facilitando o gerenciamento das campanhas de SEO de
sites e páginas, inclusive dos concorrentes. Por isto, deve ser integrada à pesquisa Search
Engine Ranking Factors (SEOMOZ, 2009) para que as métricas disponibilizadas estejam
alinhadas aos fatores de ranking estimados pela pesquisa.
1.1 OBJETIVOS DO TRABALHO
Considerando o contexto apresentado até o momento, o estudo pretende atingir os
seguintes objetivos.
1.1.1 Objetivo Geral
Desenvolver uma ferramenta capaz de gerar relatórios analíticos sobre SEO de um site
e seus concorrentes, apoiando o webmaster no acompanhamento histórico dos resultados
obtidos.
1.1.2 Objetivos Específicos
O trabalho conta com os seguintes objetivos específicos:
•
Estudar a API Site Intelligence e as métricas por ela fornecidas
•
Testar a ferramenta com uma amostra de sites reais
•
Estudar os fatores de posicionamento em mecanismos de busca
12
1.2 JUSTIFICATIVA
Apesar de estar ligada ao aumento do número de clientes e, posteriormente, ao
aumento do faturamento de uma empresa, SEO ainda é uma área pouco explorada no mundo
acadêmico. Um trabalho de conclusão relacionado ao tema, além de contribuir como mais
uma referência sobre o assunto, pode abrir portas para que outros trabalhos sobre o tema
sejam desenvolvidos no futuro. O desenvolvimento de uma ferramenta de SEO por um
acadêmico pode motivar outros estudantes a continuar o trabalho ou a desenvolver suas
próprias ferramentas.
Atualmente não no mercado uma única ferramenta que forneça dados suficientes para
uma gestão de SEO satisfatória. Isso acarreta em grande dificuldade por parte de webmasters
e de consultores da área em medir, monitorar e acompanhar a aplicação de estratégias porque
os obriga a utilizar diversas ferramentas para coleta de dados e controle. Além disso, o
acompanhamento da concorrência exige que o trabalho de coleta e controle seja multiplicado
pelo número de concorrentes que se deseje acompanhar.
O desenvolvimento de uma ferramenta única para preencher estas lacunas representa
um grande ganho para o público que otimiza sites para mecanismos de busca. O uso da
ferramenta pode permitir que esse público substitua o tempo perdido com a coleta e controle
de dados pela aplicação de estratégias de SEO, focando mais nos resultados.
1.3 DELIMITAÇÃO DO ESTUDO
O foco deste estudo foi fornecer indicadores de SEO, através da ferramenta SEO
Analytics, de conjuntos de sites fornecidos pelo usuário. É importante citar, portanto, que a
versão desenvolvida neste estudo possui algumas limitações:
•
Embora estejam contemplados mecanismos de segurança de acesso no sistema,
não foram efetuados testes para comprovar a eficácia dos mesmos.
•
Não há, no sistema, interface para gerenciamento de usuários, sendo a
inclusão, edição e exclusão dos mesmos, feitas diretamente no banco de dados
13
•
Os resultados exibidos podem estar divergentes da realidade devido ao fato de
a API Site Intelligence, de onde se originam os dados, os obter do índice Web
Linkscape que tenta imitar um mecanismo de busca, mas não o faz
integralmente (SEOMOZ, 2010)
•
As informações para os grupos Links, Conteúdo e Texto-âncora não serão
persistidas porque não serão acompanhadas historicamente e serão fornecidas
na ferramenta diretamente das APIs que as oferecem.
•
Espera-se que a ferramenta seja compatível a qualquer navegador moderno
(Internet Explorer 7+, Mozilla Firefox 2+, Opera e Safari), entretanto testes
mais aprofundados foram realizados apenas no Mozilla Firefox, versão 3.6.6.
•
No módulo de resultados previa-se a utilização de webservices do Google para
verificação do posicionamento de sites analisados. Entretanto, foi constatado
pelo pesquisador que os resultados das buscas executados pelo webservice
eram divergentes dos resultados das buscas no mecanismo de busca principal.
Para alimentação do módulo de resultados, estão sendo extraídos os dados do
mecanismo principal, o que gera um resultado mais confiável. Porém, é uma
prática não recomendada pelo Google.
•
Ainda no módulo de resultados, é importante deixar claro que os resultados são
obtidos do Google.com. Os resultados obtidos em versões locais como
Google.com.br (Brasil) e Google.com.ar (Argentina) serão diferentes. Há um
trabalho futuro em que o pesquisador pretende permitir a escolha da audiência
no momento do cadastro da campanha e que deve contornar essa divergência.
1.4 ESTRUTURA DO TRABALHO
Além da introdução realizada anteriormente, o trabalho compreende os seguintes
capítulos:
•
O Capítulo 2, que apresenta o referencial teórico, está dividido em:
o Mecanismos de Busca: uma breve história dos mecanismos de busca,
seus objetivos, mercado e como funcionam.
14
o SEO: descreve o que é SEO, quais são os fatores de ranking
importantes que atuam sobre os algoritmos dos mecanismos de busca e
ferramentas que existem no mercado para análise de informações.
•
O Capítulo 3 contém a metodologia empregada no desenvolvimento do
trabalho.
•
O Capítulo 4 apresenta a validação da ferramenta desenvolvida.
•
O Capítulo 5, por sua vez, contém as considerações finais do autor sobre o
desenvolvimento do trabalho.
Posteriormente, ao final do trabalho, estão as referências bibliográficas, os anexos e os
apêndices.
15
2 REFERENCIAL TEÓRICO
Neste capítulo é abordado o referencial teórico que permitiu que a ferramenta SEO
Analytics fosse desenvolvida. Inicialmente é abordada uma breve história dos mecanismos de
busca, seus objetivos, mercado e como funcionam. Logo após, é descrito o conceito de SEO,
os fatores de ranking importantes que atuam sobre os algoritmos dos mecanismos de busca e
ferramentas que existem no mercado para análise de informações.
2.1 MECANISMOS DE BUSCA
No princípio, quando foi criada, a Internet era apenas uma coleção de sites FTP em
que os usuários baixavam e enviavam arquivos. Para encontrar algum arquivo, o usuário
precisava navegar pasta por pasta até encontrar ou criar atalhos (considerando, nesse caso, que
o usuário já conhecia a localização do arquivo original). Esse processo era difícil e demorado,
até que Alan Emtage, um estudante da Universidade McGill em Montreal, criou em 1990 a
primeira ferramenta de busca da Internet. Sua criação, um índice de arquivos na Internet,
chamava-se Archie (LEDFORD, 2007).
Posteriormente, outro estudante percebeu que se era possível localizar arquivos na
Internet, também era possível pesquisar referências dentro de arquivos de texto puro (que
posteriormente se tornariam sites de Internet, mas que até então não passavam de simples
arquivos de texto). Mark McCahill, da Universidade de Minnesota, criou o Gopher que
indexava o conteúdo dos arquivos. Com a criação do Gopher, era necessário o surgimento de
programas que fossem capazes de encontrar referências no seu índice. Veronica (Very Easy
Rodent-Oriented Net-wide Index to Computerized Archives) e Jughead (Jonzy’s Universal
Gopher Hierarchy Excavation and Display) foram criados com esse propósito. Esses dois
programas funcionavam de uma forma similar, permitindo que os usuários fizessem buscas
por palavras-chave (LEDFORD, 2007).
O primeiro mecanismo de busca similar aos que existem hoje, o Wandex, foi criado
em 1993 por Matthew Gray. O Wandex foi o primeiro programa a indexar e buscar em
páginas da Internet e serviu de base para todos os rastreadores de sites existentes (LEDFORD,
2007). De 1993 a 1998 foram criados grandes mecanismos de busca que existem até hoje:
16
•
Excite - 1993
•
Yahoo! - 1994
•
WebCrawler - 1994
•
Lycos - 1994
•
Infoseek - 1995
•
AltaVista - 1995
•
Inktomi - 1996
•
AskJeeves - 1997
•
Google – 1997
•
MSNSearch (Bing) – 1998
Atualmente, com os mecanismos de busca mais modernos, as buscas na Internet já
fazem parte do cotidiano das pessoas. Com mais de 15 bilhões de buscas sendo realizadas
todo mês, somente por americanos, como ocorreu em julho de 2010 (COMSCORE, 2010),
aproximadamente 500 milhões de buscas são efetuadas todos os dias. Isso significa que, em
média, a cada segundo os americanos executam mais de 5.500 buscas na Internet.
Como o Google tem cerca de 63,7% de participação no mercado de buscas nos
Estados Unidos (COMSCORE, 2010), isso significa que a tecnologia do Google precisa
manipular mais de 3.500 buscas por segundo. Além disso, cada vez mais os usuários esperam
que os resultados de suas pesquisas sejam gerados em menos de um segundo (ENGE, 2009).
Hoje, usando os sites de busca, as pessoas podem obter informações sobre qualquer
assunto em poucos segundos (ENGE, 2009). Há 20 anos, a busca por uma informação exigia
uma ida à biblioteca, uma pesquisa através da Classificação Decimal de Dewey1 e uma
pesquisa pelos corredores pelo volume, um processo que facilmente levava 2 horas ou mais
para ser executado.
O número elevado de usuários que executam buscas na Internet, em especial no
Google, gera uma competição entre sites interessados em aparecer entre os primeiros
resultados das buscas efetuadas. Um estudo sobre o comportamento de usuários de
mecanismos de busca (IPROSPECT, 2006) apontou que quando executam uma busca, 62%
17
deles não passam da primeira página de resultados e apenas 19% passam da segunda página,
sendo, portanto, essencial para um site que tenha por objetivo elevar o número de visitantes,
estar o mais próximo possível dos primeiros resultados. Além disso, o estudo demonstrou que
36% dos usuários de busca acreditam que as empresas que lideram os resultados também
lideram o mercado.
2.1.1 Objetivos dos Mecanismos de Busca
A grande fonte de renda dos motores de busca são os anúncios patrocinados em meio
aos resultados de buscas efetuadas pelos usuários (ENGE, 2009). Isso significa que quanto
mais usuários, mais renda será gerada. Como o uso dos motores é gratuito, os usuários
escolhem para efetuar suas buscas o motor mais rápido e relevante, aquele que proporciona a
ele uma experiência de busca mais agradável.
Como resultado, os buscadores investem uma grande quantidade de tempo, capital e
energia em tornar seus resultados relevantes ao usuário (ENGE, 2009). Isso inclui estudos
sobre as respostas dos usuários aos resultados e comparação de resultados com concorrentes,
por exemplo (ENGE, 2009).
2.1.2 Mercado dos Mecanismos de Busca
A Figura 1 mostra a participação dos mecanismos de busca no mercado mundial em
setembro de 2010 (NET APPLICATIONS, 2010), onde é possível perceber que o Google
domina o mercado.
1
A Classificação Decimal de Dewey é um sistema de classificação documentária puramente numérico e
infinitamente hierárquico desenvolvido por Melvil Dewey (1851–1931) em 1876 (WIKIPEDIA, 2010)
18
Figura 1 - Participação dos motores de busca no mercado em setembro de 2010
Fonte: Net Aplications
2.1.3 Como os Mecanismos de Busca Funcionam
Os mecanismos de busca Google, Bing e Yahoo! trabalham seguindo dois grandes
objetivos (ENGE, 2009):
•
Rastrear e indexar os bilhões de documentos acessíveis na Web;
•
Responder às pesquisas dos usuários mostrando resultados relevantes.
O rastreamento de páginas é feito através da varredura das páginas e dos links das
páginas. Cada página visitada pelo rastreador é indexada e seus links seguidos e também
rastreados (ENGE, 2009). Dessa forma o rastreador age continuamente, já que cada link leva a
outras páginas com mais links.
Os resultados das buscas e a ordem desses resultados fazem parte do segundo objetivo.
Esse processo exige duas coisas: que o motor de busca retorne ao usuário, entre os milhões de
documentos indexados, os documentos relevantes à pesquisa realizada e que os resultados
sejam ordenados conforme a sua importância para a pesquisa. De um modo geral, é a
combinação de relevância e importância que determina a ordem dos resultados das buscas
(ENGE, 2009).
A relevância é o primeiro passo para que uma página esteja entre os resultados de uma
pesquisa. Se uma página não é relevante, ela será descartada dos resultados. A relevância de
uma página é determinada pelo seu conteúdo e pela vizinhança em que se encontra (origem
dos links que a página e que o site recebem).
19
A importância pode ser vista como o meio de determinar qual página será o primeiro
resultado, qual será o segundo, qual será o terceiro, etc. entre páginas igualmente relevantes
para uma determinada pesquisa. A autoridade da página e a confiança que o mecanismo de
busca tem nela são determinantes nesse ponto (ENGE, 2009).
Tanto a relevância quanto a importância não são determinadas manualmente (ENGE,
2009). Isso seria uma tarefa intangível em meio as bilhões de páginas que existem na Web.
Ambas são calculadas através de algoritmos dos mecanismos de busca. Existem centenas de
componentes que atuam nesses algoritmos, conhecidos como fatores de ranking. O trabalho
sobre esses fatores e consequentemente, sobre os algoritmos, em resumo, é o SEO.
2.2 SEARCH ENGINE OPTIMIZATION
Search Engine Optimization (SEO) é um conjunto de estratégias que visa melhorar o
posicionamento de páginas em resultados orgânicos de mecanismos de busca. O termo SEO,
que também é usado para definir a indústria que presta consultoria na aplicação dessas
estratégias, existe desde 1997 quando a empresa online Multimedia Marketing Group
(MMG), de John Audette, publicou páginas mencionando o termo (LEDFORD, 2007).
As estratégias de SEO são baseadas no funcionamento dos algoritmos dos mecanismos
de busca, que são os responsáveis por classificar os sites nos resultados das buscas
(LEDFORD, 2007). As variáveis envolvidas nesses algoritmos não são formalmente
conhecidas porque os mecanismos de busca esperam que os resultados sejam naturais (não
manipulados). Tornar o algoritmo público faria com que os resultados das buscas fossem
facilmente manipulados pelos proprietários de sites interessados em posicionar seus sites entre
os primeiros resultados das buscas. As variáveis que podem afetar os algoritmos dos
mecanismos de busca são conhecidas como fatores de ranking.
2.2.1 Fatores de Ranking
Os fatores de ranking são componentes que atuam nos algoritmos de classificação dos
resultados das buscas. Como os algoritmos não são publicamente acessíveis, os fatores de
20
ranking são estimados através do conhecimento de especialistas da área de SEO e obtidos
empiricamente.
Uma empresa norte-americana, a SEOmoz, levantou 149 fatores potenciais e os
submeteu a 72 especialistas em SEO consagrados para que emitissem sua opinião sobre cada
fator. O resultado foi o artigo Search Engine Ranking Factors 2009, possivelmente uma das
melhores fontes de informação sobre SEO existente (SEOMOZ, 2009). No artigo, cada fator
recebeu um valor para a sua importância variando de 0% a 100% conforme a opinião emitida
pelos especialistas, sendo classificado em uma escala conforme a Tabela 1 - Classificação dos
Fatores de Ranking de Acordo com a sua Importância. A classificação de cada fator, segundo
sua importância, permite que os fatores com importância mínima e muito mínima sejam
desconsiderados neste referencial teórico, permitindo maior foco sobre os fatores que mais
impactam sobre os resultados de SEO.
Tabela 1 - Classificação dos Fatores de Ranking de Acordo com a sua Importância
Importância
Percentual
Muito Alta
65% a 100%
Alta
55% a 64%
Moderada
45% a 54%
Baixa
35% a 44%
Mínima
25% a 34%
Muito Mínima
0% a 24%
A análise dessa pesquisa permite que sejam levantadas quais são as variáveis que,
possivelmente, agem com maior intensidade nos algoritmos de classificação dos mecanismos
de busca. O conhecimento dessa intensidade permite que sejam identificados indicadores de
SEO que merecem maior atenção, medição e monitoramento. Os fatores de ranking foram
divididos pela pesquisa em dez categorias:
•
Fatores on-page relacionados à palavra-chave
•
Fatores on-page não relacionados à palavra-chave
•
Fatores da página relacionados à popularidade de links
•
Fatores do site relacionados à popularidade de links
•
Fatores do site não relacionados à popularidade de links
•
Fatores relacionados a mídias sociais e redes sociais
•
Fatores relacionados a dados de uso
21
•
Fatores negativos
•
Fatores que afetam negativamente o valor de links externos
•
Fatores geográficos
2.2.1.1 Fatores on-page relacionados à palavra-chave
Fatores on-page são aqueles que atuam sobre o conteúdo da página. Os fatores onpage relacionados à palavra-chave são influenciados pela palavra-chave que está sendo
buscada pelo visitante no mecanismo de busca. A pesquisa levantou os 24 fatores de ranking
nesta categoria, sendo que 12 deles apresentam pelo menos 35% de importância:
•
Uso da palavra-chave em qualquer lugar da tag HTML de título <title>
(importância de 66%)
•
Uso da palavra-chave no começo da tag HTML de título <title> (importância
de 63%)
•
Uso da palavra-chave no nome de domínio raiz (importância de 60%)
•
Uso da palavra-chave em qualquer lugar da tag HTML de cabeçalho <h1>
(importância de 49%)
•
Uso da palavra-chave em links internos na página (importância de 47%)
•
Uso da palavra-chave em links externos na página (importância de 46%)
•
Uso da palavra-chave no começo da tag HTML de cabeçalho <h1>
(importância de 45%)
•
Uso da palavra-chave entre as primeiras 50-100 palavras no HTML da página
(importância de 45%)
•
Uso da palavra-chave no nome de subdomínio (importância de 42%)
•
Uso da palavra-chave no nome da página na URL (importância de 38%)
•
Uso da palavra-chave no nome da pasta na URL (importância de 37%)
•
Uso da palavra-chave em tags HTML de cabeçalho de níveis inferiores <h2>,
<h3>, <hx> no conteúdo da página (importância de 35%)
22
2.2.1.2 Fatores on-page não relacionados à palavra-chave
Os fatores on-page não relacionados à palavra-chave influenciam no ranking
independentemente da palavra que esteja sendo buscada pelo usuário no mecanismo de busca.
A pesquisa levantou os 12 fatores de ranking nesta categoria, sendo que cinco deles
apresentam pelo menos 35% de importância:
•
Existência de um conteúdo único na página (importância de 65%)
•
Página criada recentemente (importância de 50%)
•
Uso de links que apontam para outras URLs no mesmo domínio (importância
de 41%)
•
Mudanças históricas no conteúdo (importância de 39%)
•
Uso de links externos na página (importância de 37%)
2.2.1.3 Fatores da página relacionados à popularidade de links
Popularidade de links é um termo usado para definir o quanto uma página ou site é
popular através do número e qualidade de links que recebe. Páginas que recebem mais links e
de maior qualidade, são mais populares que páginas que recebem menos links e de menor
qualidade, por exemplo. A analogia usada na Figura 2 - Popularidade de links, onde cada face
representa um site, o tamanho de cada uma, a sua popularidade, e as setas representam links,
explica como funciona esse conceito.
23
Figura 2 - Popularidade de links
Fonte: Google Imagens
A pesquisa levantou fatores que tenham relação com popularidade de links,
especificamente de uma determinada página. No total, 11 fatores foram abordados pela
pesquisa, dos quais nove apresentam importância superior a 35%:
•
Textos âncora de links externos com foco na palavra-chave (importância de
73%)
•
Popularidade de links externos (importância de 71%)
•
Diversidade da origem dos links (importância de 67%)
•
TrustRank da página (importância de 65%)
•
Popularidade global dos links com base em um algoritmo iterativo
(importância de 63%)
•
Origem dos links externos para a página com foco em um tópico específico
(importância de 58%)
•
Textos âncora de links internos com foco na palavra-chave (importância de
55%)
•
Localização da informação da página em relação à arquitetura do site
(importância de 51%)
•
Popularidade de links internos (importância de 51%)
24
2.2.1.4 Fatores do site relacionados à popularidade de links
A pesquisa levantou fatores que tenham relação com popularidade de links do site. No
total, sete fatores foram abordados, dos quais seis apresentam importância superior a 35%:
•
Confiança do domínio baseado na distância em links de sites confiáveis
(importância de 66%)
•
Popularidade global dos links do domínio baseado em um algoritmo iterativo
(importância de 64%)
•
Diversidade dos links do domínio (importância de 64%)
•
Links de autoridades em um tópico específico (importância de 64%)
•
Crescimento/redução dos links para o domínio (importância de 52%)
•
Links de domínios com extensão TLD de acesso restrito (importância de 47%)
2.2.1.5 Fatores do site não relacionados à popularidade de links
Entre os fatores não relacionados à popularidade de links do site, quatro possuem
importância, segundo a pesquisa Search Engine Ranking Factors, superior à 35%.
•
Arquitetura de site do domínio (importância de 52%)
•
Uso de links externos para sites de boa reputação, confiáveis (importância de
37%)
•
Idade do domínio (importância de 37%)
•
Histórico de registro do domínio (importância de 36%)
25
2.2.1.6 Fatores relacionados aos dados das mídias sociais sobre o site ou página
Entre os seis fatores de ranking relacionados aos dados das mídias sociais sobre o site
ou página, nenhum é considerado pela pesquisa como de baixa importância ou maior, o que
demonstra que a influência dos dados de sites como Twitter, Facebook e MySpace no ranking
ainda é pequena.
2.2.1.7 Fatores relacionados ao uso do site
Os fatores de ranking relacionados ao uso do site ainda representam pouco em relação
à importância. Estima-se, porém, que estes fatores tornem-se cada vez mais importantes
(SEOMOZ, 2009) porque tratam diretamente do comportamento do usuário. Dos sete fatores
da categoria, três foram considerados pelo menos 35% importantes:
•
Taxa histórica de cliques nos resultados das buscas para a página (importância
de 42%)
•
Taxa histórica de cliques nos resultados das buscas para o site (importância de
39%)
•
Buscas realizadas pelo nome do domínio ou marca associada (importância de
36%)
2.2.1.8 Fatores negativos
Fatores negativos são variáveis que compõe o algoritmo de classificação dos
mecanismos de busca agindo de forma a reduzir o posicionamento ou mesmo desclassificar
um site/página dos resultados das buscas.
•
Mostrar conteúdos diferentes conforme o tipo de usuário com intenção
maliciosa e/ou manipulativa (importância de 68%)
•
Aquisição de links de vendedores conhecidos (importância de 56%)
26
•
Links da página para sites/páginas spam (importância de 51%)
•
Mostrar conteúdos diferentes conforme o navegador (importância de 51%)
•
Servidor inacessível com frequência (importância de 51%)
•
Esconder texto com a mesma cor ou similar com a cor de fundo (importância
de 49%)
•
Links do domínio para sites/páginas spam (importância de 48%)
•
Repetição excessiva de um mesmo texto-âncora em uma página (importância
de 46%)
•
Mostrar conteúdos diferentes conforme o endereço IP (importância de 46%)
•
Esconder texto posicionando o elemento HTML fora da tela usando CSS
(importância de 44%)
•
Número excessivo de parâmetros dinâmicos na URL (importância de 43%)
•
Número excessivo de links de sites hospedados no mesmo endereço IP
(importância de 41%)
•
Aquisição de links em campanhas manipulativas de Bait-and-Switch (os sites
criam links para um conteúdo que é redirecionado para outro) (importância de
41%)
•
Keyword Stuffing2 popular excessivamente com palavras-chave no texto da
página (importância de 41%)
•
Esconder texto com CSS display:none; (importância de 40%)
•
Keyword Stuffing na tag <title> (importância de 39%)
•
Keyword Stuffing na URL (importância de 37%)
•
Aquisição de links a partir de campanhas manipulativas de widgets/selos
(importância de 37%)
•
Mostrar conteúdos diferentes conforme suporte do usuário à JavaScript ou
algum tipo de mídia (importância de 37
2
Keyword Stuffing significa inserir palavras-chave no título, na URL ou no conteúdo da página com o objetivo
de manipular os resultados dos mecanismos de busca e criando uma experiência negativa ao usuário (GOOGLE,
2010)
27
•
Mostrar conteúdos diferentes conforme cookies existentes no computador do
usuário (importância de 36%)
•
Aquisição de links a partir de diretórios pagos de baixa qualidade (importância
de 36%)
•
Número excessivo de links recebidos de sites com mesmo dono (importância
de 36%)
•
Existência de links para a página a partir de sites/páginas spam (importância de
36%)
2.2.1.9 Fatores que afetam negativamente o valor de links externos
Os links externos ainda representam a maior porção de importância entre os fatores de
ranking. Por isso, a pesquisa abordou fatores que podem negativamente afetar a qualidade de
links externos. Cinco fatores foram pontuados com importância superior a 35%:
•
Domínio de origem foi banido do Google por web spam (importância de 70%)
•
Domínio de origem foi punido pelo Google por web spam (importância de
65%)
•
Link foi determinado como pago, não natural (importância de 63%)
•
Domínio de origem contém links para web spam (importância de 52%)
•
Domínio de origem não recebeu links confiáveis (importância de 41%)
2.2.1.10 Fatores geográficos
Fatores geográficos estão relacionados com a localização do usuário que fez a busca
no mecanismo de busca. De modo geral, os resultados do Google são diferentes conforme o
país em que a busca é efetuada. Os fatores listados nessa categoria influenciam positivamente
sites com conteúdo voltado para uma região ou país específico.
28
•
Código de país TLD do domínio raiz (importância de 69%)
•
Linguagem do conteúdo usado no site (importância de 63%)
•
Links de outros domínios ligados ao país / região (importância de 60%)
•
Localização geográfica do endereço IP da hospedagem do site (importância de
57%)
•
Revisão manual / seleção pelos engenheiros do Google (importância de 53%)
•
Opção de Geo-Targeting selecionada na ferramenta Google Webmaster Tools
(importância de 52%)
•
Registro do site no Google Local com o país / região (importância de 45%)
•
Endereço no conteúdo da página (importância de 41%)
•
Endereço associado com o registro do domínio (importância de 35%)
2.2.2 Ferramentas para Análise de SEO Existentes
Embora sejam conhecidos os fatores que possivelmente atuam nos algoritmos dos
mecanismos de busca, não há no mercado ferramenta capaz de apoiar satisfatoriamente o
webmaster na medição, monitoramento e acompanhamento histórico desses fatores. Isso
ocorre especialmente porque boa parte das informações sobre os fatores de ranking não são
facilmente mensuráveis. A seguir serão apresentadas algumas ferramentas analisadas que
possuem características semelhantes em alguns pontos.
2.2.2.1 SEOQuake
SEOQuake é uma extensão para o navegador Mozilla Firefox que fornece algumas
informações úteis para análise de alguns fatores de SEO. Entretanto, os poucos dados
fornecidos são insuficientes para uma análise eficaz porque poucos fatores são atendidos.
29
A extensão instala no navegador uma barra de ferramentas que exibe dados sobre a
página aberta no navegador, conforme a Figura 3 - Barra de ferramentas SEOQuake.
Figura 3 - Barra de ferramentas SEOQuake
Fonte: Mozilla Firefox
O SEOQuake também permite que múltiplos sites sejam analisados. A extensão instala
um bloco de código nos resultados das buscas no Google, Bing e Yahoo!, conforme a Figura
4 - Informações do SEOQuake nos resultados de uma busca.
Figura 4 - Informações do SEOQuake nos resultados de uma busca
Fonte: Mozilla Firefox
2.2.2.2 SenSEO
SenSEO é outra extensão de SEO para Firefox, que possui como diferencial a
metodologia utilizada. O SenSEO gera uma pontuação a partir de uma análise automática dos
fatores de SEO da página relacionados ou não à palavra-chave. Em conjunto com a
pontuação, um relatório é fornecido com informações sobre como aumentar a pontuação
gerada. Na Figura 5 - Relatório oriundo de uma análise feita usando o SenSEO, é possível
observar parte de um relatório.
30
Figura 5 - Relatório oriundo de uma análise feita usando o SenSEO
Fonte: Mozilla Firefox
2.2.2.3 Ferramentas de SEO privadas
Algumas empresas especializadas em SEO oferecem relatórios para análise através de
diversas ferramentas cujo acesso se dá mediante pagamento de mensalidades. Estas
ferramentas oferecem diversas informações sobre SEO, mas não estão integradas entre si e
aos fatores de ranking. Além disso, poucas delas oferecem o acompanhamento evolutivo dos
resultados, essencial para determinar se uma campanha está sendo eficiente.
Infelizmente não foi possível, por parte do autor, pesquisar a fundo as ferramentas
oferecidas pelas empresas pelo seu caráter comercial, mas as conclusões foram tiradas a partir
da revisão bibliográfica das especificações de cada uma.
31
2.2.3 Linkscape
A limitação das ferramentas disponíveis em fornecer dados capazes de suportar a
análise dos fatores de SEO se deve à dificuldade em medir a maior parte dos fatores que agem
sobre os algoritmos dos buscadores, que só poderiam ser calculados em um ambiente similar a
um mecanismo de busca, com indexação constante de dados e links. Pensando nisso, a
empresa SEOmoz criou o Linkscape, um índice Web que funciona de modo muito similar a
um mecanismo de busca, indexando continuamente páginas e links (SEOMOZ, 2010). Em
outubro de 2010, o índice já armazenava 9,2 trilhões de links e 400 bilhões de páginas de 92
milhões de domínios diferentes (OPEN SITE EXPLORER, 2010).
Os dados gerados pelo Linkscape que podem ser úteis para SEO, podem ser extraídos
usando a API de dados Site Intelligence (SEOMOZ, 2010) também disponibilizada pela
empresa SEOmoz. A empresa criou a API para que os usuários que não encontraram
ferramentas adequadas entre as disponíveis possam criar suas próprias ferramentas.
A API tem duas versões: uma gratuita que fornece poucos dados e outra paga que
fornece maior quantidade. Mediante solicitação à empresa, o pesquisador conseguiu acesso
gratuito à versão completa até dezembro, que custaria de U$ 500 a U$ 10.000 mensais,
conforme o volume de dados usado, desde que o uso fosse exclusivamente acadêmico. Esta
API fornecerá a maior parte das informações que serão usadas na ferramenta a ser
desenvolvida neste estudo.
32
3 METODOLOGIA
Considerando o objetivo deste estudo de desenvolver uma ferramenta capaz de gerar
relatórios analíticos sobre SEO de um site e de seus concorrentes, apoiando o webmaster no
acompanhamento histórico dos resultados obtidos, foram utilizados os seguintes métodos para
este estudo. Inicialmente foi definido desenho da pesquisa, explicando a sua estratégia. A
seção seguinte apresenta o desenho de pesquisa, onde o formato de pesquisa que foi utilizado
é explicado.
3.1 DESENHO DE PESQUISA
A pesquisa qualitativa de natureza exploratória teve como finalidade proporcionar
maior familiaridade com os componentes necessários para a criação de um sistema para
análise de SEO. Para isto, um levantamento bibliográfico sobre SEO foi efetuado e, logo
após, foi desenvolvida a ferramenta proposta.
3.1.1 Levantamento Bibliográfico
Para permitir que uma ferramenta de análise de SEO fosse desenvolvida, o
pesquisador realizou um levantamento bibliográfico sobre o assunto, constituído
principalmente de livros e artigos científicos da área. O objetivo era verificar como uma
ferramenta computacional poderia agilizar, de forma eficaz, no processo de tomada de
decisão.
A revisão bibliográfica sobre SEO permitiu ao pesquisador identificar a melhor fonte
para os dados que são usados na ferramenta: a API Site Intelligence. Esta API, que oferece
dados do Linkscape, um índice Web que tem por finalidade agir como um mecanismo de
busca, é a única capaz de fornecer dados sobre fatores de ranking como popularidade de links
da página, confiança do domínio e poder de ranking passado através de links. A API fornece
grande parte das informações para análise disponibilizadas no SEO Analytics.
33
Além disso, para prover percepções e compreender melhor o contexto do problema foi
estudada profundamente a pesquisa Search Engine Ranking Factors 2009. A análise dessa
pesquisa permitiu identificar quais são as variáveis envolvidas em SEO e que necessitam ser
acompanhadas e medidas. A partir dessa identificação, foi desenvolvida a ferramenta que
fornece grande parte dessas variáveis, o SEO Analytics
3.2 FERRAMENTA SEO ANALYTICS
A ferramenta SEO Analytics é um sistema que fornece indicadores e informações de
SEO e visa preencher as lacunas que existem atualmente nas ferramentas para análise de SEO,
como a falta de acompanhamento histórico dos resultados e impossibilidade de comparação
de sites e páginas com concorrentes.
3.2.1 Características da Ferramenta
A ferramenta SEO Analytics é acessado via Web através de qualquer navegador Web
moderno. Sua arquitetura permite que seja usado por múltiplos usuários, cada um com suas
próprias campanhas e URLs de análise. As informações disponibilizadas estão disponíveis em
módulos, conforme será apresentado a seguir.
3.2.1.1 Módulos do SEO Analytics
As informações de SEO oferecidas pelo SEO Analytics estão organizadas em cinco
módulos.
3.2.1.1.1 Módulo de Métricas de URL
34
O módulo de métricas de URL fornece indicadores relacionados à página ou site
analisados. Ao todo são fornecidos 43 indicadores diferentes, que podem ser visualizados no
Anexo A – Lista de Indicadores de URL.
Estes indicadores oferecem informações fundamentais para uma boa gestão de SEO
porque englobam boa parte dos fatores de ranking estimados pela pesquisa Search Engine
Ranking Factors 2009. Na ferramenta SEO Analytics é possível acompanhar através de
gráfico a evolução do valor do indicador de todos os sites de uma campanha, permitindo, por
exemplo, que sites concorrentes sejam comparados.
3.2.1.1.2 Módulo de Links
Os links englobam alguns dos principais fatores de ranking conhecidos. O módulo de
links oferece quatro perspectivas diferentes:
•
Principais 50 links de entrada especificamente para a página cadastrada na
campanha, ordenados pela autoridade de página3 da origem do link.
•
Principais 50 links de entrada para o domínio da página ou site cadastrado(a)
na campanha, ordenados pela autoridade de página da origem do link.
•
Principais 50 domínios com links de entrada especificamente para a página
cadastrada na campanha, ordenados pela autoridade do domínio4 de origem.
•
Principais 50 domínios com links de entrada para o domínio da página ou site
cadastrado(a) na campanha, ordenados pela autoridade do domínio da origem
do link
Através deste módulo, o usuário pode identificar a origem dos links de seu site e de
sites concorrentes e direcionar táticas de Link Building5. O módulo oferece relatórios
dinâmicos, que se alteram conforme o site/página escolhido e filtros selecionados. Todos os
3
Autoridade de Página é uma métrica criada pela SEOmoz que melhor define a capacidade de uma página em se
posicionar entre os resultados dos mecanismos de busca. O cálculo que gera essa métrica envolve os resultados
reais nos mecanismos de busca e os dados existentes no índice Linkscape (SEOMOZ, 2010).
4
Autoridade de Domínio é a média dos valores de autoridade das páginas de um domínio (SEOMOZ, 2010).
5
Link Building é o termo que denomina todo o trabalho que envolve a aquisição de links para um determinado
site ou página. (MARCEL, 2010)
35
links são exibidos nos relatórios por ordem decrescente de Autoridade de Página da origem do
link. Os seguintes filtros podem ser aplicados:
•
Links internos: apresenta apenas os links internos para a página ou site
selecionados
•
Links externos: apresenta apenas os links externos para a página ou site
selecionados
•
Links nofollow: apresenta apenas os links sem poder de ranking (que possuem
o atributo rel=”nofollow”) para a página ou site selecionados.
•
Links follow: apresenta apenas os links com poder de ranking (que não
possuem o atributo rel=”nofollow”) para a página ou site selecionados
•
Redirecionamentos 301: apresenta apenas os redirecionamentos 301. Esse tipo
de redirecionamento, que é comumente usado quando um site é movido
permanentemente para outro endereço, passa consigo todo o poder de ranking
da URL movida. É uma prática comum entre os especialistas de SEO comprar
sites antigos e redirecionar todas as páginas para um domínio já existente com
o objetivo de adquirir o poder de ranking do antigo endereço (ENGE, 2009).
3.2.1.1.3 Módulo de Conteúdo
O módulo de conteúdo permite que o webmaster perceba quais conteúdos dos sites
analisados são mais relevantes para SEO. A análise desses dados possibilita que o webmaster
identifique os tipos de conteúdo que dão melhor resposta para SEO no seu site e nos sites
concorrentes. No módulo, são exibidas as principais 50 páginas do domínio apresentadas em
ordem decrescente de número de domínios com links para a página. A Figura 6 - Parte de
relatório do SEO Analytics sobre o conteúdo de um domínio, mostra parte de um relatório do
SEO Analytics sobre as principais páginas do domínio codeigniter.com.
36
Figura 6 - Parte de relatório do SEO Analytics sobre o conteúdo de um domínio
Fonte: SEO Analytics
3.2.1.1.4 Módulo de Texto-âncora
O texto-âncora é o texto que descreve um link. Na Figura 7 - Estrutura de um link em
HTML, onde a estrutura básica de links é representada, é possível visualizar qual porção de
um link é um texto-âncora O texto-âncora dos links de entrada de um site é muito importante
para SEO porque ele indica ao mecanismo de busca sobre o que se refere o site de destino do
link (SEOMOZ, 2009).
Figura 7 - Estrutura de um link em HTML (RICOTTA, 2010)
Fonte: Blog da empresa Mestre SEO
Uma prova de que os textos-âncora influenciam na classificação das buscas pode ser
visto na Figura 8 - Pesquisa no Google por “clique aqui”, onde uma busca no Google pela
expressão “clique aqui” retorna como resultados sites normalmente apontados por essa
expressão.
37
Figura 8 - Pesquisa no Google por “clique aqui”
Fonte: Google
O módulo texto-âncora permite que para cada site ou página analisados sejam
identificados quais textos-âncora ocorrem com maior frequência. Os textos-âncora exibidos
são ordenados por ordem decrescente de número de domínios com links que usam a âncora e
podem ser filtrados com os seguintes atributos:
•
Frase para Domínio: exibe apenas âncoras com dois ou mais termos em links
para qualquer página do domínio
•
Frase para Página: exibe apenas âncoras com dois ou mais termos em links
para a página cadastrada na campanha do SEO Analytics
•
Termo para Domínio: exibe apenas âncoras com termos simples em links para
qualquer página do domínio
•
Termo para Página: exibe apenas âncoras com termos simples em links para a
página cadastrada na campanha do SEO Analytics
38
A Figura 9 - Parte de relatório sobre os textos-âncora recebidos por um domínio, mostra parte de
um relatório do SEO Analytics sobre as 50 principais frases em textos-âncora para o domínio
unisinos.br.
Figura 9 - Parte de relatório sobre os textos-âncora recebidos por um domínio
Fonte: SEO Analytics
3.2.1.1.5 Módulo de Resultados
Neste módulo é possível acompanhar a evolução dos sites cadastrados na campanha ao
longo dos meses nos resultados do Google. Os sites são comparados nos resultados do
buscador e exibidos em um gráfico usando as palavras-chave cadastradas na campanha.
O módulo de resultados permite que o usuário conclua sobre a eficácia das suas
estratégias de SEO e de seus concorrentes com o passar dos meses. A Figura 10 – Módulo de
resultados mostra uma cópia da tela do módulo de resultados. A evolução de cada site/página
da campanha nos resultados das buscas no site Google.com é mostrada em um gráfico, dentro
desta figura.
39
Figura 10 – Módulo de resultados
Fonte: SEO Analytics
Os resultados apresentados neste módulo refletem uma busca realizada no site global
Google.com, que são diferentes de buscas realizadas nas versões locais do mecanismo de
busca, como por exemplo Google.com.br (Brasil) e Google.com.ar (Argentina).
3.2.2 Arquitetura do SEO Analytics
A ferramenta é multiusuário, sendo que cada usuário pode criar múltiplas campanhas
de análise. Cada campanha pode ser composta de muitos sites ou páginas. Um usuário pode
criar, por exemplo, uma campanha para acompanhar sites de diferentes universidades e outra
para acompanhar diversas páginas de um mesmo site. Esta arquitetura está representada na
Figura 11 - Arquitetura multiusuário do SEO Analytics.
40
Usuários
Campanhas de Análise
Páginas
Figura 11 - Arquitetura multiusuário do SEO Analytics
Fonte: Autor
As informações usadas na ferramenta são obtidas pelo índice web Linkscape através da
API Site Intelligence, que oferece os dados do índice, e de webservices dos mecanismos de
busca, conforme pode ser visto na Figura 12 - Fluxo dos dados do SEO Analytics. Os dados
obtidos são guardados mensalmente na base de dados do sistema para que um
acompanhamento histórico dos resultados possa ser disponibilizado. O acompanhamento é
mostrado em forma de gráficos, que são disponibilizados pela Open Flash Chart, uma
biblioteca open-source para geração de gráficos para uso em ambientes web (OPEN FLASH
CHART, 2010).
Webservices
SEO Analytics
Figura 12 - Fluxo dos dados do SEO Analytics
Fonte: Autor
Usuário
41
3.2.3 Desenvolvimento da Ferramenta
O SEO Analytics foi desenvolvido em linguagem de programação PHP (Hypertext
Preprocessor). Para desenvolvimento mais veloz, foi usado o framework open-source
CodeIgniter, que usa arquitetura MVC e reduz o tempo de desenvolvimento porque
disponibiliza diversas bibliotecas, ajudantes e plug-ins que com códigos comuns (ELLISLAB,
2010).
3.2.4 Interface
A interface da ferramenta é Web, acessível através de navegadores de Internet. Por ser
melhor difundida entre os profissionais de TI, a interface foi desenvolvida em inglês,
permitindo que um maior número de possíveis usuários seja atingido. Na Figura 13 - Interface
do SEO Analytics, é exibida uma cópia da tela do sistema mostrando o indicador Domain
Authority de uma campanha chamada “Meus Sites”. Em destaque estão diferentes pontos da
interface:
•
A: Dropdown de seleção da campanha ativa
•
B: Barra lateral com atalhos para as informações disponibilizadas pela
ferramenta
•
C: Área de seleção de sites/páginas que são mostrados nos gráficos
•
D: Gráfico evolutivo do indicador Domain Authority dos sites/páginas
selecionados
•
E: Informações sobre a última medição do indicador realizada
42
A
B
C
D
E
Figura 13 - Interface do SEO Analytics
Fonte: SEO Analytics
3.2.5 Banco de Dados
A partir da identificação dos dados disponibilizados pela API Site Intelligence e da
arquitetura esperada para a ferramenta, foi modelado o banco de dados, sendo utilizado como
gerenciador do banco de dados é usado o MySQL.
As informações para os grupos Links, Conteúdo e Texto-âncora não serão persistidas
porque não serão acompanhadas historicamente e serão fornecidas na ferramenta diretamente
das APIs que as oferecem. Já as informações que compõe os grupos de métricas de URL e
resultados serão armazenadas para acompanhamento da evolução dos mesmos.
43
O modelo de banco de dados, representado na Figura 14 - Diagrama compacto do
banco de dados da aplicação SEO Analytics, se resume a oito tabelas:
•
“api”: guarda informações sobre a API Site Intelligence (nome, descrição,
valores máximos e mínimos de cada valor da API). É essencial para a geração
de gráficos relacionados às métricas.
•
“metricas”: guarda os dados obtidos da API Site Intelligence. Os dados são
persistidos nessa tabela uma vez ao mês, periodicidade com que o índice
Linkscape é atualizado.
•
“usuarios”: guarda as informações dos usuários do sistema (nome de usuário e
senha de acesso criptografada)
•
“campanhas”: guarda as campanhas de cada usuário
•
“paginas”: guarda os sites e páginas de cada campanha
•
“log”: recebe informações de data e hora da importação de dados de cada
campanha
•
“palavras-chave”: guarda as palavras-chave que terão os resultados medidos e
cada campanha
•
“resultados”: guarda mensalmente os resultados obtidos nos mecanismos de
busca de cada página para cada palavra-chave.
Figura 14 - Diagrama compacto do banco de dados da aplicação SEO Analytics
Fonte: Autor
44
3.3 COLETA DE DADOS
A maior parte dos dados coletados pela ferramenta SEO Analytics são obtidos através
da API Site Intelligence. Essa API fornece dados do índice Web Linkscape, que tem por
objetivo imitar um mecanismo de busca (OPEN SITE EXPLORER, 2009). A API está
subdividida em outras quatro APIs:
•
URL Metrics: fornece indicadores para uma determinada URL passada como
parâmetro
•
Links: fornece informações sobre os links recebidos por uma URL passada
como parâmetro
•
Anchor Text: fornece informações sobre os textos-âncora dos links recebidos
por uma URL passada como parâmetro
•
Top Content: fornece informações sobre as principais páginas do domínio de
uma URL passada como parâmetro
Outra parte dos dados, que fazem parte do módulo de resultados, são obtidos dos
próprios mecanismos de busca.
3.4 PREPARAÇÃO PARA A VALIDAÇÃO
Por ser uma ferramenta com aplicabilidade real, para validação optou-se por submetêla a especialistas e entusiastas de SEO, que foram convidados a validar o SEO Analytics
através de grupo de discussão e fóruns sobre SEO, e de mídias sociais. Os convites em fóruns
e mídias sociais tiveram caráter pessoal e informal, enquanto o convite ao grupo de discussão
BrSEO (composto de 20 membros) foi feito através de um e-mail formal encaminhado a todos
os integrantes (ver Apêndice 1 – Convite enviado aos integrantes do grupo de discussão
BrSEO).
45
3.4.1 Submissão aos Avaliadores
Após os contatos iniciais com os possíveis avaliadores, 19 deles retornaram
demonstrando interesse em avaliar a ferramenta. Aos interessados em efetuar a validação, foi
encaminhado um texto explicativo sobre a ferramenta, dados de acesso e questões para serem
respondidas após a avaliação (ver Apêndice 2 – E-mail enviado aos avaliadores).
Dos 19 avaliadores, quatro responderam às questões com sua análise. Embora o
número pareça pequeno, envolveu quatro tipos distintos de profissionais, conforme
apresentado a seguir.
3.4.2 Identificação dos Avaliadores
Para fins de preservação, os avaliadores serão identificados pelo número e não por
seus verdadeiros nomes. O avaliador 1 estuda SEO e está prestes a abrir uma empresa no
ramo. O avaliador 2 é desenvolvedor de sites e iniciante em SEO. O avaliador 3 é escocês e
trabalha para uma empresa de SEO. O avaliador 4 é sócio-diretor de uma empresa de
marketing digital, com foco em SEO.
46
4 VALIDAÇÃO DA FERRAMENTA
O processo de validação teve início no dia 8 de novembro de 2010, quando foram
encaminhados os convites para avaliar o SEO Analytics através de grupos de discussão e
fóruns sobre SEO, e de mídias sociais. Durante os seguintes cinco dias, foram recebidos por
e-mail os contatos de interessados em efetuar a validação e os feedbacks dos que já haviam
efetuado. A seguir será apresentada uma análise sobre a perceção dos avaliadores e, logo
após, uma análise das avaliações realizadas.
4.1 PERCEPÇÃO DOS AVALIADORES
Após o recebimento das avaliações, os dados foram analisados para verificar a
percepção dos avaliadores. De uma forma geral, a ferramenta SEO Analytics foi bem aceita
pelos avaliadores. As avaliações também indicaram alguns pontos de melhoria, que serão
contemplados pelo autor em trabalhos futuros. Alguns problemas foram identificados e serão
aprofundados a seguir juntamente com a análise das avaliações. A seguir serão apresentadas
as avaliações efetuadas pelos avaliadores da ferramenta. Estas serão agrupadas em itens como
interface; contribuições para SEO; gestão de SEO; substituição da ferramenta atual; e
recomendação da ferramenta.
4.1.1 Interface
A primeira pergunta enviada aos avaliadores questionava sobre a acessibilidade e
organização das informações na interface. Os quatro avaliadores concordaram que as
informações no SEO Analytics estão acessíveis e organizadas. Alguns problemas foram
identificados, conforme a seguir.
O avaliador 1 respondeu que
47
“As informações estão organizadas, o complicado é o cadastro das campanhas,
poderia ser mais simples. Sinceramente não gostei do layout do tipo Google
Analytics, deixa uma expectativa no visitante”.
O avaliador 1 achou complicado o cadastro de campanhas na ferramenta, completando
que poderia ser mais simples. Na mesma resposta também expressou uma opinião particular
sobre certa expectativa que a interface, por ser semelhante à do site Google Analytics, deixaria
no visitante.
O avaliador 2 levantou um problema de inconsistência de informações no módulo de
resultados. Embora isto não seja um problema de interface, é importante esclarecer que o
problema se deve ao fato de que os resultados mostrados no SEO Analytics são provenientes
do mecanismo de busca global Google.com e não de buscadores locais como Google.com.br
(Brasil) e Google.co.jp (Japão). Esta limitação está contemplada nas delimitações do software.
O avaliador 2 respondeu que:
As informações são bem organizadas, porém precisam ser feitas correções, pois
encontrei falhas no posicionamento de um link no mecanismo de busca (por
exemplo, um link que se encontra na 4ª posição foi informado como 55ª posição no
módulo de resultados).
Os avaliadores 3 e 4 concordaram que as informações do SEO Analytics estão
acessíveis e organizadas.
4.1.2 Contribuições para SEO
Os avaliadores também foram questionados se o SEO Analytics contribuía para SEO.
Todos os avaliadores concordaram que a ferramenta contribui para SEO. Os avaliadores 1 e 2
enaltecerem a qualidade da ferramenta de reduzir o tempo perdido com coleta de dados.
Nesta questão, o avaliador 1 respondeu que “sim, ela contribui e muito, pois ela
concentra várias informações nela, não precisa ficar garimpando na Internet. Isso adianta o
serviço”. De forma similar, o avaliador 2 respondeu
48
“Com certeza a ferramenta disponibiliza informações necessárias que manualmente
são difíceis de adquirir, pois precisam ser colhidas uma a uma, sendo assim
recomendado o uso da ferramenta”.
O avaliador 4 também escreveu que os dados demoram para ser atualizados. Isso
ocorre porque a maior parte dos dados é proveniente do índice Linkscape, que embora seja
indexado constantemente, tem seus dados atualizados apenas uma vez ao mês. Ele disse que:
“Sim, os relatórios de link building, apesar de demorarem a atualizar (isso já é do
SEOMoz), são bons e facilitam a vida separando os links follow e nofollow, além de
organizar de acordo com as várias métricas existentes”.
O avaliador 3 escreveu que que “a ferramenta pode ser muito boa para quem está
iniciando na indústria”,
4.1.3 Gestão do SEO
A terceira questão de avaliação perguntava se o SEO Analytics fornece informações
em quantidade e qualidades suficientes para uma boa gestão de SEO. Neste ponto de
avaliação, os avaliadores 1 e 3 concordaram que o SEO Analytics fornece informações em
quantidade e qualidade suficientes para uma boa gestão de SEO. O avaliador 1 reforçou
também a qualidade da ferramenta em permitir análise de concorrentes.
“As informações que ele oferece são algumas das necessárias, muito legal a
comparação que ela faz com os concorrentes, isso ilustra o mercado em que iremos
embarcar. Bom para avaliar uma nova oportunidade”.
O avaliador 2 disse achar que a ferramenta oferece quantidade média de informações,
podendo fornecer mais no futuro: “as informações fornecidas contêm uma quantia média de
49
informações. Dá para posteriormente fornecer mais informações”. O avaliador 4 acha que a
ferramenta não fornece informações suficientes para um mercado mais competitivo:
“Depende do mercado analisado, se for um mercado muito competitivo, precisamos de mais
informações, mas se for um mercado de competitividade média, fornece sim”. Infelizmente
nenhum dos dois citou nas respostas que informações adicionais poderiam ser fornecidas.
O avaliador 3 concordou que o SEO Analytics fornece informações em quantidade e
qualidades suficientes para uma boa gestão de SEO. Já o avaliador 4 respondeu que
4.1.4 Substituição das Ferramentas Atuais
A quarta pergunta questionou os avaliadores se eles trocariam as ferramentas que
usam atualmente pelo SEO Analytics. O objetivo desta pergunta foi comparar o SEO
Analytics com as ferramentas utilizadas pelos avaliadores. Apenas o avaliador 2 respondeu
que trocaria as ferramentas que usa pelo SEO Analytics. O avaliador 1 respondeu que trocaria
algumas ferramentas utilizadas
“Eu trabalho hoje com as ferramentas da MestreSEO e SemRush, e algumas
extensões do Firefox. Algumas ferramentas podem ser substituídas tranquilamente,
outras já não”.
Neste item, o avaliador 2 disse preferir ferramentas em língua portuguesa, mas diz
também que mesmo sendo em inglês, a ferramenta é fácil de usar.
“Particularmente prefiro ferramentas com nosso idioma o que é praticamente
impossível no mercado, porém a ferramenta mesmo sendo em inglês é muito simples
de ser entendida sendo assim a usaria no lugar de outras”.
Já o avaliador 3 não trocaria as ferramentas atuais pelo SEO Analytics, mas a incluiria
entre as ferramentas que usa. Escreveu que “infelizmente não trocaria outras ferramentas que
uso por esta (porque eu uso as ferramentas da SEOmoz), mas definitivamente a adicionaria à
lista de ferramentas que uso”.
50
O avaliador 4 respondeu que não substituiria porque, segundo ele, o SEO Analytics
não tem nenhum diferencial em relação às ferramentas da empresa SEOmoz. Como é
assinante da SEOmoz, não trocaria. “Se algum dia o SEO Analytics tiver algum diferencial
em relação às ferramentas da SEOmoz, trocaria sim”.
4.1.5 Recomendação da Ferramenta
Na última pergunta os avaliadores foram solicitados a escrever sobre o que acharam da
ferramenta e se recomendariam a outros profissionais. Todos demonstraram aprovar a
ferramenta e escreveram que recomendariam a ferramenta.
O avaliador 1 respondeu
“Eu utilizaria a ferramenta e acredito que ela seria muito útil na execução da alguns
trabalhos e também no orçamento dos jobs então, sim, eu recomendaria para outras
pessoas”.
Os avaliadores 2 e 3 identificaram necessidade de ajustes na ferramenta, sem
especificar quais são . O avaliador 2 respondeu que “a ferramenta é de boa qualidade precisa
de alguns ajustes, mas recomendaria sim para outros profissionais experimentarem, pois não
se arrependeriam”. Já o avaliador 3 respondeu:
“Eu gostei da ferramenta, mas gostaria de criar uma campanha, um domínio e então
cadastrar palavras-chave, ao invés de inserir as palavras-chave e depois um domínio.
Eu recomendaria isso a outros. Eu acredito que precisa ainda de algum
desenvolvimento, mas como um projeto acadêmico está ótimo!”
Apesar da aprovação, o avaliador 3 recomendou que as palavras-chave fossem
cadastradas após o cadastro das URLs.
Encerrando as avaliações, o avaliador 4 sugeriu que os dados pudessem ser exportados
para planilha eletrônica, o que deve ser contemplado futuramente pelo autor:
51
“Achei interessante, sugiro possibilitar a exportação dos relatórios para Excel.
Recomendaria sim, dependendo do valor a ser pago. De forma geral utilizo a
plataforma do SEOMoz e não avaliei se o que ele disponibiliza é grátis ou pago no
site do SEOMoz, mas em geral a ferramenta é boa.”
52
5 CONCLUSÕES E TRABALHOS FUTUROS
As buscas na Internet já fazem parte do cotidiano das pessoas. Usando os mecanismos
de busca, as pessoas podem obter informações sobre qualquer assunto em poucos segundos,
tarefa que há 20 anos levaria horas para ser executada. Esse poder dos mecanismos de busca
de processar uma busca rapidamente e retornar resultados cada vez mais relevantes faz com
que as pessoas os usem como porta de entrada para a Internet, além de torná-los mais
populares a cada dia.
Para um site que deseje obter quantidade significativa de visitantes, estar bem
posicionado entre os resultados das buscas é essencial. Para tanto, a aplicação de estratégias
de SEO é fundamental nesse ponto, porque elas trabalham diretamente com os fatores que
influenciam os algoritmos de classificação dos mecanismos de busca. Embora existam
pesquisas que estimem quais são esses fatores, há carência no mercado de ferramentas para
medir e monitorar o trabalho sobre esses fatores.
5.1 IMPLICAÇÕES GERENCIAIS
Atualmente, os maiores problemas entre webmasters e consultores de SEO são medir
e monitorar os resultados de SEO de sites e concorrentes. Essa prática exige uma consulta a
diversas ferramentas para coleta dados e o uso de outras para acompanhamento, sendo comum
entre os profissionais de SEO o uso de planilhas de Excel para a segunda tarefa. Esse trabalho
é multiplicado pelo número de concorrentes que se deseja acompanhar.
O SEO Analytics, através da sua interface amigável e fácil de usar, consegue reduzir o
desgaste desses profissionais, permitindo que eles gastem seu tempo na aplicação efetiva das
estratégias de SEO, ao invés de perder tempo com coleta e armazenamento de dados. A
ferramenta fornece dados sobre grande parte dos fatores de ranking estimados pela pesquisa
Search Engine Ranking Factors 2009 (SEOMOZ, 2009), podendo ser um diferencial
competitivo em favor de quem fizer seu uso.
As avaliações da ferramenta efetuadas por brasileiros demonstraram que o SEO
Analytics tem grande potencial para SEO no mercado nacional. A avaliação feita por um
53
escocês que trabalha no ramo há três anos demonstrou que o SEO Analytics é uma “ótima
ferramenta” que precisa de um pouco mais de desenvolvimento. De uma forma geral, as
avaliações aprovaram a ferramenta e esperam que algumas melhorias sejam implantadas.
Essas sugestões serão contempladas futuramente pelo pesquisador.
5.2 IMPLICAÇÕES ACADÊMICAS
Apesar dos benefícios que pode trazer, como aumento do lucro de uma empresa
através do aumento do número de clientes em seu site, SEO ainda é um tema pouco abordado
entre os acadêmicos. Espera-se que este trabalho possa servir como base e estímulo para que
outros estudantes pesquisem sobre o assunto. Os trabalhos futuros a seguir trazem alguns
temas que podem ser abordados nestas pesquisas.
5.3 TRABALHOS FUTUROS
Como trabalhos futuros para o tema SEO, o pesquisador sugere:
•
Desenvolvimento de um índice Web capaz de funcionar de forma similar a um
mecanismo de busca
•
Desenvolvimento de um sistema capaz de avaliar um site ou página em relação
aos fatores de ranking e gerar um relatório e pontuação
•
Um estudo de caso de aplicação de técnicas de SEO em um site real
(demonstrando crescimento no número de visitantes, no número de vendas
etc.)
•
Um estudo sobre a viabilidade de uso de blogs da plataforma Wordpress como
sites empresariais (considerando que, entre diversas vantagens, com poucos
ajustes a plataforma está bem otimizada para os fatores de ranking on-page)
•
Um estudo sobre o emprego de técnicas de SEO pelas empresas em seus sites
com o objetivo de descobrir por que as empresas que não empregam não o
54
fazem (desinteresse ou desconhecimento dos benefícios que podem ser
obtidos)
55
REFERÊNCIAS
COMSCORE comScore Releases July 2010 U.S. Search Engine Rankings. Disponível em:
<http://www.comscore.com/Press_Events/Press_Releases/2010/8/comScore_Releases_July_2
010_U.S._Search_Engine_Rankings>. Acesso em: 15 set. 2010.
ELLISLAB, Inc. CodeIgniter: an open source Web Application Framework that helps you
write PHP programs. Disponível em: <http://codeigniter.com/>. Acesso em: 30 ago. 2010.
ENGE, E.; SPENCER, S.; FISHKIN, R.; STRICCHIOLA, J. The Art of SEO: Mastering
Search Engine Optimization. Primeira Edição. O'Reilly Media, Inc., 2009. 544 páginas.
GYONGYI, Zoltán. Combating Web Spam with TrustRank.
<http://www.vldb.org/conf/2004/RS15P3.PDF>. Acesso em: 4 nov. 2010.
Disponível
em:
GOOGLE Webmaster Central. Keyword stuffing - Webmaster Tools Help. Disponível em:
<http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=66358>. Acesso
em 23 set. 2010
IPROSPECT. iProspect Search Engine User Behavior Study. Disponível em
<http://www.iprospect.com/premiumPDFs/WhitePaper_2006_SearchEngineUserBehavior.pd
f>. Acesso em 23 set. 2010
LEDFORD, J. SEO: Search Engine Optimization Bible. Edição Ilustrada. Wiley, 2007. 408
páginas.
MARCEL, Frank. Glossário SEM e SEO | Mestre SEO. Disponível
<http://www.mestreseo.com.br/seo/glossario-seo-e-sem>. Acesso em: 11 nov. 2010
em
NET
APPLICATIONS.
Search
Engine
Market
Share.
Disponível
em
<http://www.netmarketshare.com/search-engine-market-share.aspx?qprid=4>. Acesso em: 15
set. 2010
OPEN FLASH CHART. Open Flash Chart - Home. Disponível
<http://teethgrinder.co.uk/open-flash-chart-2/>. Acesso em: 11 nov. 2010.
em:
56
RICOTTA, Fabio. Linkbuilding – O Poder do Texto Âncora | Mestre SEO. Disponível em
<http://www.mestreseo.com.br/link-building/linkbuilding-o-poder-do-texto-ancora>. Acesso
em: 4 nov. 2010
SENSEO. SenSEO Firefox Extension. Disponível em <https://addons.mozilla.org/enUS/firefox/addon/9403>. Acesso em 22 set. 2010
SEOMOZ.
Search
Engine
Ranking
Factors
2009.
Disponível
<http://www.seomoz.org/article/search-ranking-factors>. Acesso em: 21 jun. 2010.
em:
SEOMOZ. Site Intelligence API. Disponível em: <http://www.seomoz.org/api>. Acesso em:
30 ago. 2010.
SEOMOZ. Open Site Explorer: Link Popularity & Backlink Analysis Tool. Disponível em:
<http://www.opensiteexplorer.org>. Acesso em: 10 set. 2010.
WIKIPEDIA: a enciclopédia livre. Classificação decimal de Dewey. Disponível em:
<http://pt.wikipedia.org/wiki/Classificação_decimal_de_Dewey>. Acesso em: 8 nov. 2010.
57
ANEXO A – LISTA DE INDICADORES DE URL FORNECIDOS PELA API SITE
INTELLIGENCE
Os indicadores constantes no Quadro 1 - Indicadores de URL disponíveis no SEO
Analytics Erro! Fonte de referência não encontrada., são disponibilizados pela API Site
Intelligence e na ferramenta SEO Analytics para análise. A sigla que denomina cada indicador
foi criada pela empresa SEOmoz..
Indicador
Título
Descrição
ueid
External Links
The number of juice-passing external links to the url.
feid
Subdomain External Links
The number of juice-passing external links to the
subdomain of the url.
peid
Root Domain External
Links
The number of juice-passing external links to the
root domain of the url.
ujid
Juice-Passing6 Links
The number of juice-passing links (internal or
external) to the url.
uifq
Subdomains Linking
The number of subdomains with any pages linking to
the url.
uipl
Root Domains Linking
The number of root domains with any pages linking
to the url.
uid
Links
The number of links (juice-passing or not, internal or
external) to the url.
fid
Subdomain Subdomains
Linking
The number of subdomains with any pages linking to
the subdomain of the url.
pid
Root Domain Root
Domains Linking
The number of root domains with any pages linking
to the root domain of the url.
umrp
mozRank7
The mozRank of the url.
fmrp
Subdomain mozRank
The mozRank of the subdomain of the url.
pmrp
Root Domain mozRank
The mozRank of the Root Domain of the url.
utrp
mozTrust8
The mozTrust of the url.
ftrp
Subdomain mozTrust
The mozTrust of the subdomain of the url.
6
Juice-passing é uma expressão para definir links e redirecionamentos que passam poder de ranking. Alguns
sites, em especial aqueles em que o conteúdo é gerado por usuários como comentários de blogs e fóruns, os links
recebem o atributo rel=”nofollow”, o que remove o poder de ranking do link. Essa é uma prática comum para
evitar spam.
7
mozRank é um índice que representa a popularidade de links de um site ou página.
8
mozTrust é um índice que representa a distância em links de um site ou página de sites confiáveis escolhidos
manualmente. Quanto menor a distância, maior é o índice. O cálculo do índice é baseado no algoritmo
TrustRank (GYÖNGYI, 2004)
58
Indicador
Título
Descrição
ptrp
Root Domain mozTrust
The mozTrust of the root domain of the url.
uemrp
External mozRank
The portion of the url's mozRank coming from
external links.
fejp
Subdomain External
Domain Juice
The portion of the mozRank of all pages on the
subdomain coming from external links.
pejp
Root Domain External
Domain Juice
The portion of the mozRank of all pages on the root
domain coming from external links.
fjp
Subdomain Domain Juice
The mozRank of all pages on the subdomain
combined.
pjp
Root Domain Domain Juice
The mozRank of all pages on the root domain
combined.
fuid
Links to Subdomain
Total links (including internal and nofollow links) to
the subdomain of the url in question.
puid
Links to Root Domain
Total links (including internal and nofollow links) to
the root domain of the url in question.
fipl
Root Domains Linking to
Subdomain
The number of root domains with at least one link to
the subdomain of the url in question.
upa
Page Authority
A score out of 100-points representing the likelihood
for arbitrary content to rank on this page
pda
Domain Authority
A score out of 100-points representing the likelihood
for arbitrary content to rank on this domain
ued
All external links page to
page
The number of external links from one page to
another (included followed and nofollowed).
ujfq
Followed Domains Linking The number of unique domains with followed links
Page
to the target url.
ujp
Followed IPs Linking
The number unique IPs with a followable link to a
target url.
uip
IPs Linking
The total number of unique IPs linking to a target
url.
ujpl
Followed Domains to Page
The number of unique domains with followed links
to a given url.
uib
All Cblock Linking
The total number unique cblocks linking to a page.
ujb
Followed CBLocks Linking
The total number unique cblocks with followed links
to a page.
fjid
Followed Subdomain
Linking Domains
A count of all unique subdomains with followed
links to the target domain.
fed
Subdomain External Links
The total number (followed and nofollowed) external
links to the subdomain of the url.
fjf
Followed Subdomain
The number of subdomains with followed links to
59
Indicador
Título
Descrição
Subdomains Links
the subdomain of the url.
fjd
Followed Domain
Subdomains Links
The number of unique domains with followed links
to the subdomain of the url.
pjid
Followed Root Domain
Links
The total number of followed links (both internal and
external) from a page to a domain.
ped
All Root Domain External
Links
The total number of external links (both followed
and no-followed) from a page to a domain.
pjd
All Followed Root Domains The total number of followed root domains linking to
Linking Domain
the target's domain.
pip
IPs Linking to Domain
The total number of unique IPs linking to the target's
domain.
pjip
Followed IPs Linking to
Domain
The total number of unique IPs with followed links
to the target's domain.
pib
All Cblock Linking Domain
The number of unique cblocks with a link to a
domain.
pjb
Followed Cblock Linking
Domain
The total number of cblock with followed links to a
domain.
Quadro 1 - Indicadores de URL disponíveis no SEO Analytics
60
APÊNDICE 1 – CONVITE ENVIADO AOS INTEGRANTES DO GRUPO DE
DISCUSSÃO BRSEO
Pessoal,
Desenvolvi uma ferramenta excelente para análise de SEO e preciso de voluntários
para testá-la. A ferramenta foi desenvolvida como meu trabalho de conclusão de curso,
portanto a validação através de testes por profissionais de SEO é obrigatória.
A ferramenta, que chamo de SEO Analytics, fornece dados importantes sobre um site e
seus concorrentes. Além disso, ela permite que os dados tenham sua evolução com o passar
dos meses comparada. Ela está dividida em cinco módulos:
Métricas de URL: fornece 43 métricas sobre as URLs cadastradas na campanha (ex:
número de backlinks, links internos, externos, autoridade de domínio, autoridade de página)
Links: mostra os principais 50 links que as URLs cadastradas recebem, ordenados
pela autoridade da página de origem
Conteúdo: mostra as pricipais 50 páginas dos domínios das URLs cadastradas
ordenadas pelo número de links externos que recebem
Texto-âncora: mostra os pricipais 50 texto-âncoras que as URLs cadastradas
recebem, ordenados pelo número de links externos que os usam
Resultados: mostra graficamente a evolução das URLs cadastradas no Google para
um conjunto de keywords fornecido
Quem tiver interesse favor me mandar um e-mail para que eu possa gerar um usuário e
senha e encaminhar algumas instruções. É importante conhecer SEO, especialmente os fatores
que contribuem para ranking, do contrário, os dados fornecidos serão pouco úteis.
Preciso disso com certa urgência porque preciso entregar o trabalho na próxima
semana. Para terem uma idéia do que se trata, em anexo estão algumas screenshots da
ferramenta.
Um grande abraço a todos.
Enéas Gesing
61
APÊNCIDE 2 – E-MAIL ENVIADO AOS AVALIADORES
<Nome do Avaliador,>
Obrigado pelo interesse. Seguem os dados para acesso:
Endereço: http://www.webosfera.com.br/ferramentas/seoanalytics
Usuário: nome de usuário
Senha: senha de acesso
Preciso que você responda às seguintes perguntas depois de usar com a ferramenta. As
respostas não precisam ser apenas "sim" ou "não", pelo contrário, quanto mais completas
forem, melhor.
•
Inicialmente descreva a sua relação com SEO. (escreva aqui uma pequena
biografia, se você tem um site e/ou empresa sobre o assunto, se tem um ou
mais sites em que aplica as técnicas de SEO ou se apenas se interessa pelo
assunto)
•
As informações que são fornecidas pela ferramenta SEO Analytics estão
acessíveis e organizadas?
•
A ferramenta contribui, de alguma forma, com quem trabalha com SEO?
•
O SEO Analytics fornece informações em quantidade e qualidade suficientes
para uma boa gestão de SEO?
•
Você trocaria outras ferramentas de análise de SEO que existem no mercado
pelo SEO Analytics?
•
De uma forma geral, o que você achou da ferramenta? Você recomendaria a
outras pessoas que trabalham com SEO?
Para iniciar o uso da ferramenta, basta seguir os seguintes passos:
62
•
Efetuar login
•
Acessar o menu no topo"My Campaigns"
•
Clica em "Add new campaign"
•
Digita um nome para a campanha (exemplo: Imobiliárias de São Paulo) e clica
em "Next"
•
Adiciona algumas palavras-chave para acompanhar na campanha (exemplo:
“imoveis em são paulo”, “imobiliaria são paulo”) e clica em "Finish" (você
pode adicionar quantas palavras quiser, mas peço a gentileza de não incluir
mais que cinco por campanha nesse momento)
•
Seleciona a campanha
•
Clica em "Add new site / page to selected campaign" e adiciona um site ou
página. Repete esses passos para o numero de sites que deseja acompanhar
(recomendo que você cadastre seu site e de concorrentes)
•
Agora é só acessar cada um dos módulos e ver os indicadores e resultados. Os
módulos URL Metrics e Results guardam os resultados uma vez ao mês para
acompanhamento evolutivo.
Esses são os módulos:
Métricas de URL: fornece 43 métricas sobre as URLs cadastradas na campanha (ex:
número de backlinks, links internos, externos, autoridade de domínio, autoridade de página)
Links: mostra os principais 50 links que as URLs cadastradas recebem, ordenados pela
autoridade da página de origem
Conteúdo: mostra as principais 50 páginas dos domínios das URLs cadastradas
ordenadas pelo número de links externos que recebem
Texto-âncora: mostra os pricipais 50 texto-âncoras que as URLs cadastradas
recebem, ordenados pelo número de links externos que os usam
Resultados: mostra graficamente a evolução das URLs cadastradas no Google para
um conjunto de keywords fornecido
63
Atenciosamente,
Enéas Gesing

Documentos relacionados