TCC SEO Analytics - Uma ferramenta para análise de SEO
Transcrição
TCC SEO Analytics - Uma ferramenta para análise de SEO
UNIVERSIDADE DO VALE DO RIO DOS SINOS - UNISINOS CIÊNCIAS EXATAS E TECNOLÓGICAS CURSO DE SISTEMAS DE INFORMAÇÃO ENÉAS URIEL SCHREIBER GESING SEO ANALYTICS: UMA FERRAMENTA PARA ANÁLISE DE SEO São Leopoldo 2010 ENÉAS URIEL SCHREIBER GESING SEO ANALYTICS: UMA FERRAMENTA PARA ANÁLISE DE SEO Trabalho de conclusão de curso apresentado à Universidade do Vale do Rio dos Sinos – UNISINOS, como requisito parcial para a obtenção do título de bacharel em Sistemas de Informação. Orientador: Prof. Ms. Cláudia Flores São Leopoldo 2010 DEDICATÓRIA Aqui presto minha homenagem a todos aqueles que de alguma forma me auxiliaram durante minha vida acadêmica. Dedico este trabalho: • Aos meus pais, Lauro Manuel Gesing e Silvana Schreiber Gesing, que me guiaram pelo caminho correto e permitiram que hoje chegasse até aqui • À minha esposa, Patrícia Firme Graciano, por ser compreensiva nos momentos de ausência e por me motivar a continuar a caminhada, sempre com muito amor e carinho • Aos meus irmãos, Ezael Gesing e Eliel Gesing, que compartilham comigo momentos especiais e representam para mim uma motivação adicional • Aos meus amigos, que sempre estão ao meu lado • Aos motoristas de ônibus que me conduziram por mais de 160.000 km de minha cidade até a universidade durante os sete anos de graduação • Ao Programa Universidade para Todos (ProUni), sem o qual não conseguiria concluir minha graduação nesta excelente universidade que é a Unisinos AGRADECIMENTOS Aqui presto homenagem àqueles que contribuíram de maneira relevante para a elaboração do presente trabalho. Agradeço: • À professora orientadora Cláudia Flores, por aceitar o tema por mim sugerido e por estar constantemente presente durante a elaboração do trabalho • À empresa SEOmoz, por conceder acesso gratuito à API Site Intelligence, autorizar o uso da pesquisa Search Engine Ranking Factors 2009 e responder rapidamente aos meus questionamentos • Aos 72 especialistas de SEO que contribuíram com a pesquisa Search Engine Ranking Factors 2009 • Às pessoas que aceitaram avaliar a ferramenta proposta neste trabalho • À empresa em que trabalho, representada pelo meu coordenador e amigo Alexandre Saraiva Soares, por permitir em alguns momentos tornar meu horário flexível e alterar meu posto de trabalho para que eu pudesse elaborar o trabalho e realizar encontros presenciais na universidade RESUMO A Internet vem crescendo rapidamente em todo o mundo. A cada dia surgem novos sites e aumenta o número de usuários da rede. A maior parte destes usuários, quando deseja algum tipo de informação, produto ou serviço, utiliza mecanismos de busca como Google, Yahoo! e Bing, para encontrar o que quer. Logo, para um site que tenha por objetivo aumentar o número de visitantes, é essencial estar entre os primeiros resultados das buscas efetuadas nesses buscadores. O conjunto de estratégias que visa otimizar um site para aparecer entre os primeiros resultados chama-se Search Engine Optimization (Otimização para Mecanismos de Busca, ou SEO). Embora existam referências bibliográficas sobre o assunto em quantidade significativa, não há no mercado uma única ferramenta que forneça indicadores e meça resultados de SEO de um site e de seus concorrentes de forma satisfatória. Essa monografia apresenta o desenvolvimento de uma ferramenta capaz de preencher essas lacunas, o SEO Analytics. A ferramenta está dividida em cinco módulos, e apresenta indicadores e informações de SEO sobre qualquer site ou página que se deseje medir. Para fins de validação, a ferramenta foi submetida a especialistas e entusiastas da área para verificação da aplicação da ferramenta no cotidiano dessas pessoas. Palavras-Chave: SEO. Análise de SEO. Fatores de Ranking. Indicadores de SEO. SEO Analytics. 5 ABSTRACT The Internet is growing rapidly worldwide. Every day brings new sites and increases the number of network users. Most of these users, when want some information, product or service, uses search engines like Google, Yahoo and Bing, to find what they want. Therefore, for a site that has the objective of increasing the number of visitors, it is essential to be among the top results of searches made in these search engines. The set of strategies aimed at optimizing a site to appear among the top results is called Search Engine Optimization (SEO). Although there are references about SEO in significant amount, no there a unique tool on the market that provides indicators and measure results of an SEO site and your competitors in a satisfactory manner. This paper presents the development of a tool capable of filling these gaps, the SEO Analytics. The tool is divided into five modules, and presents indicators and information on SEO on any site or page. For verification purposes, the tool was submitted to specialists and enthusiasts in the area to verify the application of the tool in the daily life of these people. Keywords: SEO. SEO Analysis. Ranking Factors. SEO Indicators. SEO Analytics. LISTA DE FIGURAS Figura 1 - Participação dos motores de busca no mercado em setembro de 2010 .18 Figura 2 - Popularidade de links.............................................................................23 Figura 3 - Barra de ferramentas SEOQuake...........................................................29 Figura 4 - Informações do SEOQuake nos resultados de uma busca.....................29 Figura 5 - Relatório oriundo de uma análise feita usando o SenSEO ....................30 Figura 6 - Parte de relatório do SEO Analytics sobre o conteúdo de um domínio.36 Figura 7 - Estrutura de um link em HTML (RICOTTA, 2010) .............................36 Figura 8 - Pesquisa no Google por “clique aqui” ...................................................37 Figura 9 - Parte de relatório sobre os textos-âncora recebidos por um domínio....38 Figura 10 – Módulo de resultados ..........................................................................39 Figura 11 - Arquitetura multiusuário do SEO Analytics ........................................40 Figura 12 - Fluxo dos dados do SEO Analytics......................................................40 Figura 13 - Interface do SEO Analytics..................................................................42 Figura 14 - Diagrama compacto do banco de dados da aplicação SEO Analytics .43 LISTA DE ABREVIATURAS E SIGLAS FTP – File Transfer Protocol SEM – Search Engine Marketing SEO – Search Engine Optimization PPC – Pay Per Click TLD – Top Level Domain URL – Uniform Resource Locator SUMÁRIO 1 INTRODUÇÃO ..................................................................................................10 1.1 OBJETIVOS DO TRABALHO ........................................................................11 1.1.1 Objetivo Geral ..............................................................................................11 1.1.2 Objetivos Específicos....................................................................................11 1.2 JUSTIFICATIVA ..............................................................................................12 1.3 DELIMITAÇÃO DO ESTUDO........................................................................12 1.4 ESTRUTURA DO TRABALHO ......................................................................13 2 REFERENCIAL TEÓRICO .............................................................................15 2.1 MECANISMOS DE BUSCA............................................................................15 2.1.1 Objetivos dos Mecanismos de Busca...........................................................17 2.1.2 Mercado dos Mecanismos de Busca............................................................17 2.1.3 Como os Mecanismos de Busca Funcionam...............................................18 2.2 SEARCH ENGINE OPTIMIZATION ................................................................19 2.2.1 Fatores de Ranking .......................................................................................19 2.2.1.1 Fatores on-page relacionados à palavra-chave............................................21 2.2.1.2 Fatores on-page não relacionados à palavra-chave .....................................22 2.2.1.3 Fatores da página relacionados à popularidade de links..............................22 2.2.1.4 Fatores do site relacionados à popularidade de links...................................24 2.2.1.5 Fatores do site não relacionados à popularidade de links............................24 2.2.1.6 Fatores relacionados aos dados das mídias sociais sobre o site ou página..25 2.2.1.7 Fatores relacionados ao uso do site .............................................................25 2.2.1.8 Fatores negativos .........................................................................................25 2.2.1.9 Fatores que afetam negativamente o valor de links externos ......................27 2.2.1.10 Fatores geográficos....................................................................................27 2.2.2 Ferramentas para Análise de SEO Existentes ...........................................28 2.2.2.1 SEOQuake ...................................................................................................28 2.2.2.2 SenSEO 29 2.2.2.3 Ferramentas de SEO privadas......................................................................30 2.2.3 Linkscape .......................................................................................................31 3 METODOLOGIA...............................................................................................32 3.1 DESENHO DE PESQUISA ..............................................................................32 3.1.1 Levantamento Bibliográfico ........................................................................32 3.2 FERRAMENTA SEO ANALYTICS ..................................................................33 3.2.1 Características da Ferramenta....................................................................33 3.2.1.1 Módulos do SEO Analytics .........................................................................33 3.2.1.1.1 Módulo de Métricas de URL ....................................................................33 3.2.1.1.2 Módulo de Links .......................................................................................34 3.2.1.1.3 Módulo de Conteúdo ................................................................................35 3.2.1.1.4 Módulo de Texto-âncora ..........................................................................36 3.2.1.1.5 Módulo de Resultados ..............................................................................38 3.2.2 Arquitetura do SEO Analytics.....................................................................39 3.2.3 Desenvolvimento da Ferramenta ................................................................41 3.2.4 Interface.........................................................................................................41 3.2.5 Banco de Dados.............................................................................................42 9 3.3 COLETA DE DADOS ......................................................................................44 3.4 PREPARAÇÃO PARA A VALIDAÇÃO ........................................................44 3.4.1 Submissão aos Avaliadores ..........................................................................45 3.4.2 Identificação dos Avaliadores......................................................................45 4 VALIDAÇÃO DA FERRAMENTA .................................................................46 4.1 PERCEPÇÃO DOS AVALIADORES..............................................................46 4.1.1 Interface.........................................................................................................46 4.1.2 Contribuições para SEO ..............................................................................47 4.1.3 Gestão do SEO ..............................................................................................48 4.1.4 Substituição das Ferramentas Atuais .........................................................49 4.1.5 Recomendação da Ferramenta....................................................................50 5 CONCLUSÕES E TRABALHOS FUTUROS.................................................52 5.1 IMPLICAÇÕES GERENCIAIS........................................................................52 5.2 IMPLICAÇÕES ACADÊMICAS .....................................................................53 5.3 TRABALHOS FUTUROS ................................................................................53 REFERÊNCIAS ....................................................................................................55 ANEXO A – LISTA DE INDICADORES DE URL FORNECIDOS PELA API SITE INTELLIGENCE ...................................................................................................57 APÊNDICE 1 – CONVITE ENVIADO AOS INTEGRANTES DO GRUPO DE DISCUSSÃO BRSEO............................................................................................60 APÊNCIDE 2 – E-MAIL ENVIADO AOS AVALIADORES ...........................61 10 1 INTRODUÇÃO O crescente aumento do número de pessoas com acesso à Internet no Brasil e em todo o mundo (CETIC.BR, 2009) traz consigo um número cada vez mais elevado de empresas interessadas em obter clientes na grande rede. Para uma empresa, independente do seu ramo de negócios, estar presente na Internet pode representar um excelente meio de atrair novos clientes e manter os já existentes. Segundo a empresa de consultoria Serasa Experian Hitwise, a maior fonte de tráfego na Internet brasileira, é o site de buscas Google, que representa 95,37% do mercado de buscas na Internet no Brasil. Estima-se, por exemplo, que 53,76% dos visitantes de sites do setor de saúde sejam originários do Google (o restante se origina de outras fontes como tráfego direto, links de outros sites e de outros motores de busca). Para um site, estar entre os primeiros resultados das buscas efetuadas pelos usuários no Google (ou em outros buscadores) representa obter quantidades consideráveis de visitantes. A área que visa promover sites aumentando sua visibilidade e os posicionado entre os primeiros resultados nos motores de busca é conhecida como SEM (Search Engine Marketing) (LEDFORD, 2007). SEM, por sua vez, é dividido em links patrocinados, que posicionam o site entre os primeiros resultados em uma parte específica para anunciantes mediante pagamento de taxa por clique (PPC - Pay Per Click), e SEO (Search Engine Optimization) que é um conjunto de estratégias de otimização que visam tornar os sites mais relevantes, importantes e legíveis sob o ponto de vista do mecanismo de busca se baseando em dados históricos, engenharia reversa do algoritmo de classificação dos buscadores e em documentos fornecidos pelos próprios sites de busca, com o objetivo de posicionar sites entre os primeiros resultados de determinadas buscas (LEDFORD, 2007). Estas informações permitem que diversos fatores de ranking de sites em mecanismos de busca sejam especulados pelos especialistas da área (ENGE, 2009). Os investimentos iniciais em SEO costumam ser relativamente baixos porque envolvem apenas recursos humanos. Entretanto, conforme pode ser verificado em grande parte dos sites pessoais e de empresas seja pela fraca atuação das equipes que desenvolvem os sites, por desconhecimento dos fatores de ranking (ENGE, 2009), por desconhecimento dos benefícios que podem ser obtidos ou mesmo por falta de análise dos resultados, os webmasters, em geral, não aplicam corretamente estratégias relacionadas à SEO em seus sites. 11 A ferramenta proposta neste trabalho tem por objetivo fornecer indicadores e informações de SEO a webmasters, facilitando o gerenciamento das campanhas de SEO de sites e páginas, inclusive dos concorrentes. Por isto, deve ser integrada à pesquisa Search Engine Ranking Factors (SEOMOZ, 2009) para que as métricas disponibilizadas estejam alinhadas aos fatores de ranking estimados pela pesquisa. 1.1 OBJETIVOS DO TRABALHO Considerando o contexto apresentado até o momento, o estudo pretende atingir os seguintes objetivos. 1.1.1 Objetivo Geral Desenvolver uma ferramenta capaz de gerar relatórios analíticos sobre SEO de um site e seus concorrentes, apoiando o webmaster no acompanhamento histórico dos resultados obtidos. 1.1.2 Objetivos Específicos O trabalho conta com os seguintes objetivos específicos: • Estudar a API Site Intelligence e as métricas por ela fornecidas • Testar a ferramenta com uma amostra de sites reais • Estudar os fatores de posicionamento em mecanismos de busca 12 1.2 JUSTIFICATIVA Apesar de estar ligada ao aumento do número de clientes e, posteriormente, ao aumento do faturamento de uma empresa, SEO ainda é uma área pouco explorada no mundo acadêmico. Um trabalho de conclusão relacionado ao tema, além de contribuir como mais uma referência sobre o assunto, pode abrir portas para que outros trabalhos sobre o tema sejam desenvolvidos no futuro. O desenvolvimento de uma ferramenta de SEO por um acadêmico pode motivar outros estudantes a continuar o trabalho ou a desenvolver suas próprias ferramentas. Atualmente não no mercado uma única ferramenta que forneça dados suficientes para uma gestão de SEO satisfatória. Isso acarreta em grande dificuldade por parte de webmasters e de consultores da área em medir, monitorar e acompanhar a aplicação de estratégias porque os obriga a utilizar diversas ferramentas para coleta de dados e controle. Além disso, o acompanhamento da concorrência exige que o trabalho de coleta e controle seja multiplicado pelo número de concorrentes que se deseje acompanhar. O desenvolvimento de uma ferramenta única para preencher estas lacunas representa um grande ganho para o público que otimiza sites para mecanismos de busca. O uso da ferramenta pode permitir que esse público substitua o tempo perdido com a coleta e controle de dados pela aplicação de estratégias de SEO, focando mais nos resultados. 1.3 DELIMITAÇÃO DO ESTUDO O foco deste estudo foi fornecer indicadores de SEO, através da ferramenta SEO Analytics, de conjuntos de sites fornecidos pelo usuário. É importante citar, portanto, que a versão desenvolvida neste estudo possui algumas limitações: • Embora estejam contemplados mecanismos de segurança de acesso no sistema, não foram efetuados testes para comprovar a eficácia dos mesmos. • Não há, no sistema, interface para gerenciamento de usuários, sendo a inclusão, edição e exclusão dos mesmos, feitas diretamente no banco de dados 13 • Os resultados exibidos podem estar divergentes da realidade devido ao fato de a API Site Intelligence, de onde se originam os dados, os obter do índice Web Linkscape que tenta imitar um mecanismo de busca, mas não o faz integralmente (SEOMOZ, 2010) • As informações para os grupos Links, Conteúdo e Texto-âncora não serão persistidas porque não serão acompanhadas historicamente e serão fornecidas na ferramenta diretamente das APIs que as oferecem. • Espera-se que a ferramenta seja compatível a qualquer navegador moderno (Internet Explorer 7+, Mozilla Firefox 2+, Opera e Safari), entretanto testes mais aprofundados foram realizados apenas no Mozilla Firefox, versão 3.6.6. • No módulo de resultados previa-se a utilização de webservices do Google para verificação do posicionamento de sites analisados. Entretanto, foi constatado pelo pesquisador que os resultados das buscas executados pelo webservice eram divergentes dos resultados das buscas no mecanismo de busca principal. Para alimentação do módulo de resultados, estão sendo extraídos os dados do mecanismo principal, o que gera um resultado mais confiável. Porém, é uma prática não recomendada pelo Google. • Ainda no módulo de resultados, é importante deixar claro que os resultados são obtidos do Google.com. Os resultados obtidos em versões locais como Google.com.br (Brasil) e Google.com.ar (Argentina) serão diferentes. Há um trabalho futuro em que o pesquisador pretende permitir a escolha da audiência no momento do cadastro da campanha e que deve contornar essa divergência. 1.4 ESTRUTURA DO TRABALHO Além da introdução realizada anteriormente, o trabalho compreende os seguintes capítulos: • O Capítulo 2, que apresenta o referencial teórico, está dividido em: o Mecanismos de Busca: uma breve história dos mecanismos de busca, seus objetivos, mercado e como funcionam. 14 o SEO: descreve o que é SEO, quais são os fatores de ranking importantes que atuam sobre os algoritmos dos mecanismos de busca e ferramentas que existem no mercado para análise de informações. • O Capítulo 3 contém a metodologia empregada no desenvolvimento do trabalho. • O Capítulo 4 apresenta a validação da ferramenta desenvolvida. • O Capítulo 5, por sua vez, contém as considerações finais do autor sobre o desenvolvimento do trabalho. Posteriormente, ao final do trabalho, estão as referências bibliográficas, os anexos e os apêndices. 15 2 REFERENCIAL TEÓRICO Neste capítulo é abordado o referencial teórico que permitiu que a ferramenta SEO Analytics fosse desenvolvida. Inicialmente é abordada uma breve história dos mecanismos de busca, seus objetivos, mercado e como funcionam. Logo após, é descrito o conceito de SEO, os fatores de ranking importantes que atuam sobre os algoritmos dos mecanismos de busca e ferramentas que existem no mercado para análise de informações. 2.1 MECANISMOS DE BUSCA No princípio, quando foi criada, a Internet era apenas uma coleção de sites FTP em que os usuários baixavam e enviavam arquivos. Para encontrar algum arquivo, o usuário precisava navegar pasta por pasta até encontrar ou criar atalhos (considerando, nesse caso, que o usuário já conhecia a localização do arquivo original). Esse processo era difícil e demorado, até que Alan Emtage, um estudante da Universidade McGill em Montreal, criou em 1990 a primeira ferramenta de busca da Internet. Sua criação, um índice de arquivos na Internet, chamava-se Archie (LEDFORD, 2007). Posteriormente, outro estudante percebeu que se era possível localizar arquivos na Internet, também era possível pesquisar referências dentro de arquivos de texto puro (que posteriormente se tornariam sites de Internet, mas que até então não passavam de simples arquivos de texto). Mark McCahill, da Universidade de Minnesota, criou o Gopher que indexava o conteúdo dos arquivos. Com a criação do Gopher, era necessário o surgimento de programas que fossem capazes de encontrar referências no seu índice. Veronica (Very Easy Rodent-Oriented Net-wide Index to Computerized Archives) e Jughead (Jonzy’s Universal Gopher Hierarchy Excavation and Display) foram criados com esse propósito. Esses dois programas funcionavam de uma forma similar, permitindo que os usuários fizessem buscas por palavras-chave (LEDFORD, 2007). O primeiro mecanismo de busca similar aos que existem hoje, o Wandex, foi criado em 1993 por Matthew Gray. O Wandex foi o primeiro programa a indexar e buscar em páginas da Internet e serviu de base para todos os rastreadores de sites existentes (LEDFORD, 2007). De 1993 a 1998 foram criados grandes mecanismos de busca que existem até hoje: 16 • Excite - 1993 • Yahoo! - 1994 • WebCrawler - 1994 • Lycos - 1994 • Infoseek - 1995 • AltaVista - 1995 • Inktomi - 1996 • AskJeeves - 1997 • Google – 1997 • MSNSearch (Bing) – 1998 Atualmente, com os mecanismos de busca mais modernos, as buscas na Internet já fazem parte do cotidiano das pessoas. Com mais de 15 bilhões de buscas sendo realizadas todo mês, somente por americanos, como ocorreu em julho de 2010 (COMSCORE, 2010), aproximadamente 500 milhões de buscas são efetuadas todos os dias. Isso significa que, em média, a cada segundo os americanos executam mais de 5.500 buscas na Internet. Como o Google tem cerca de 63,7% de participação no mercado de buscas nos Estados Unidos (COMSCORE, 2010), isso significa que a tecnologia do Google precisa manipular mais de 3.500 buscas por segundo. Além disso, cada vez mais os usuários esperam que os resultados de suas pesquisas sejam gerados em menos de um segundo (ENGE, 2009). Hoje, usando os sites de busca, as pessoas podem obter informações sobre qualquer assunto em poucos segundos (ENGE, 2009). Há 20 anos, a busca por uma informação exigia uma ida à biblioteca, uma pesquisa através da Classificação Decimal de Dewey1 e uma pesquisa pelos corredores pelo volume, um processo que facilmente levava 2 horas ou mais para ser executado. O número elevado de usuários que executam buscas na Internet, em especial no Google, gera uma competição entre sites interessados em aparecer entre os primeiros resultados das buscas efetuadas. Um estudo sobre o comportamento de usuários de mecanismos de busca (IPROSPECT, 2006) apontou que quando executam uma busca, 62% 17 deles não passam da primeira página de resultados e apenas 19% passam da segunda página, sendo, portanto, essencial para um site que tenha por objetivo elevar o número de visitantes, estar o mais próximo possível dos primeiros resultados. Além disso, o estudo demonstrou que 36% dos usuários de busca acreditam que as empresas que lideram os resultados também lideram o mercado. 2.1.1 Objetivos dos Mecanismos de Busca A grande fonte de renda dos motores de busca são os anúncios patrocinados em meio aos resultados de buscas efetuadas pelos usuários (ENGE, 2009). Isso significa que quanto mais usuários, mais renda será gerada. Como o uso dos motores é gratuito, os usuários escolhem para efetuar suas buscas o motor mais rápido e relevante, aquele que proporciona a ele uma experiência de busca mais agradável. Como resultado, os buscadores investem uma grande quantidade de tempo, capital e energia em tornar seus resultados relevantes ao usuário (ENGE, 2009). Isso inclui estudos sobre as respostas dos usuários aos resultados e comparação de resultados com concorrentes, por exemplo (ENGE, 2009). 2.1.2 Mercado dos Mecanismos de Busca A Figura 1 mostra a participação dos mecanismos de busca no mercado mundial em setembro de 2010 (NET APPLICATIONS, 2010), onde é possível perceber que o Google domina o mercado. 1 A Classificação Decimal de Dewey é um sistema de classificação documentária puramente numérico e infinitamente hierárquico desenvolvido por Melvil Dewey (1851–1931) em 1876 (WIKIPEDIA, 2010) 18 Figura 1 - Participação dos motores de busca no mercado em setembro de 2010 Fonte: Net Aplications 2.1.3 Como os Mecanismos de Busca Funcionam Os mecanismos de busca Google, Bing e Yahoo! trabalham seguindo dois grandes objetivos (ENGE, 2009): • Rastrear e indexar os bilhões de documentos acessíveis na Web; • Responder às pesquisas dos usuários mostrando resultados relevantes. O rastreamento de páginas é feito através da varredura das páginas e dos links das páginas. Cada página visitada pelo rastreador é indexada e seus links seguidos e também rastreados (ENGE, 2009). Dessa forma o rastreador age continuamente, já que cada link leva a outras páginas com mais links. Os resultados das buscas e a ordem desses resultados fazem parte do segundo objetivo. Esse processo exige duas coisas: que o motor de busca retorne ao usuário, entre os milhões de documentos indexados, os documentos relevantes à pesquisa realizada e que os resultados sejam ordenados conforme a sua importância para a pesquisa. De um modo geral, é a combinação de relevância e importância que determina a ordem dos resultados das buscas (ENGE, 2009). A relevância é o primeiro passo para que uma página esteja entre os resultados de uma pesquisa. Se uma página não é relevante, ela será descartada dos resultados. A relevância de uma página é determinada pelo seu conteúdo e pela vizinhança em que se encontra (origem dos links que a página e que o site recebem). 19 A importância pode ser vista como o meio de determinar qual página será o primeiro resultado, qual será o segundo, qual será o terceiro, etc. entre páginas igualmente relevantes para uma determinada pesquisa. A autoridade da página e a confiança que o mecanismo de busca tem nela são determinantes nesse ponto (ENGE, 2009). Tanto a relevância quanto a importância não são determinadas manualmente (ENGE, 2009). Isso seria uma tarefa intangível em meio as bilhões de páginas que existem na Web. Ambas são calculadas através de algoritmos dos mecanismos de busca. Existem centenas de componentes que atuam nesses algoritmos, conhecidos como fatores de ranking. O trabalho sobre esses fatores e consequentemente, sobre os algoritmos, em resumo, é o SEO. 2.2 SEARCH ENGINE OPTIMIZATION Search Engine Optimization (SEO) é um conjunto de estratégias que visa melhorar o posicionamento de páginas em resultados orgânicos de mecanismos de busca. O termo SEO, que também é usado para definir a indústria que presta consultoria na aplicação dessas estratégias, existe desde 1997 quando a empresa online Multimedia Marketing Group (MMG), de John Audette, publicou páginas mencionando o termo (LEDFORD, 2007). As estratégias de SEO são baseadas no funcionamento dos algoritmos dos mecanismos de busca, que são os responsáveis por classificar os sites nos resultados das buscas (LEDFORD, 2007). As variáveis envolvidas nesses algoritmos não são formalmente conhecidas porque os mecanismos de busca esperam que os resultados sejam naturais (não manipulados). Tornar o algoritmo público faria com que os resultados das buscas fossem facilmente manipulados pelos proprietários de sites interessados em posicionar seus sites entre os primeiros resultados das buscas. As variáveis que podem afetar os algoritmos dos mecanismos de busca são conhecidas como fatores de ranking. 2.2.1 Fatores de Ranking Os fatores de ranking são componentes que atuam nos algoritmos de classificação dos resultados das buscas. Como os algoritmos não são publicamente acessíveis, os fatores de 20 ranking são estimados através do conhecimento de especialistas da área de SEO e obtidos empiricamente. Uma empresa norte-americana, a SEOmoz, levantou 149 fatores potenciais e os submeteu a 72 especialistas em SEO consagrados para que emitissem sua opinião sobre cada fator. O resultado foi o artigo Search Engine Ranking Factors 2009, possivelmente uma das melhores fontes de informação sobre SEO existente (SEOMOZ, 2009). No artigo, cada fator recebeu um valor para a sua importância variando de 0% a 100% conforme a opinião emitida pelos especialistas, sendo classificado em uma escala conforme a Tabela 1 - Classificação dos Fatores de Ranking de Acordo com a sua Importância. A classificação de cada fator, segundo sua importância, permite que os fatores com importância mínima e muito mínima sejam desconsiderados neste referencial teórico, permitindo maior foco sobre os fatores que mais impactam sobre os resultados de SEO. Tabela 1 - Classificação dos Fatores de Ranking de Acordo com a sua Importância Importância Percentual Muito Alta 65% a 100% Alta 55% a 64% Moderada 45% a 54% Baixa 35% a 44% Mínima 25% a 34% Muito Mínima 0% a 24% A análise dessa pesquisa permite que sejam levantadas quais são as variáveis que, possivelmente, agem com maior intensidade nos algoritmos de classificação dos mecanismos de busca. O conhecimento dessa intensidade permite que sejam identificados indicadores de SEO que merecem maior atenção, medição e monitoramento. Os fatores de ranking foram divididos pela pesquisa em dez categorias: • Fatores on-page relacionados à palavra-chave • Fatores on-page não relacionados à palavra-chave • Fatores da página relacionados à popularidade de links • Fatores do site relacionados à popularidade de links • Fatores do site não relacionados à popularidade de links • Fatores relacionados a mídias sociais e redes sociais • Fatores relacionados a dados de uso 21 • Fatores negativos • Fatores que afetam negativamente o valor de links externos • Fatores geográficos 2.2.1.1 Fatores on-page relacionados à palavra-chave Fatores on-page são aqueles que atuam sobre o conteúdo da página. Os fatores onpage relacionados à palavra-chave são influenciados pela palavra-chave que está sendo buscada pelo visitante no mecanismo de busca. A pesquisa levantou os 24 fatores de ranking nesta categoria, sendo que 12 deles apresentam pelo menos 35% de importância: • Uso da palavra-chave em qualquer lugar da tag HTML de título <title> (importância de 66%) • Uso da palavra-chave no começo da tag HTML de título <title> (importância de 63%) • Uso da palavra-chave no nome de domínio raiz (importância de 60%) • Uso da palavra-chave em qualquer lugar da tag HTML de cabeçalho <h1> (importância de 49%) • Uso da palavra-chave em links internos na página (importância de 47%) • Uso da palavra-chave em links externos na página (importância de 46%) • Uso da palavra-chave no começo da tag HTML de cabeçalho <h1> (importância de 45%) • Uso da palavra-chave entre as primeiras 50-100 palavras no HTML da página (importância de 45%) • Uso da palavra-chave no nome de subdomínio (importância de 42%) • Uso da palavra-chave no nome da página na URL (importância de 38%) • Uso da palavra-chave no nome da pasta na URL (importância de 37%) • Uso da palavra-chave em tags HTML de cabeçalho de níveis inferiores <h2>, <h3>, <hx> no conteúdo da página (importância de 35%) 22 2.2.1.2 Fatores on-page não relacionados à palavra-chave Os fatores on-page não relacionados à palavra-chave influenciam no ranking independentemente da palavra que esteja sendo buscada pelo usuário no mecanismo de busca. A pesquisa levantou os 12 fatores de ranking nesta categoria, sendo que cinco deles apresentam pelo menos 35% de importância: • Existência de um conteúdo único na página (importância de 65%) • Página criada recentemente (importância de 50%) • Uso de links que apontam para outras URLs no mesmo domínio (importância de 41%) • Mudanças históricas no conteúdo (importância de 39%) • Uso de links externos na página (importância de 37%) 2.2.1.3 Fatores da página relacionados à popularidade de links Popularidade de links é um termo usado para definir o quanto uma página ou site é popular através do número e qualidade de links que recebe. Páginas que recebem mais links e de maior qualidade, são mais populares que páginas que recebem menos links e de menor qualidade, por exemplo. A analogia usada na Figura 2 - Popularidade de links, onde cada face representa um site, o tamanho de cada uma, a sua popularidade, e as setas representam links, explica como funciona esse conceito. 23 Figura 2 - Popularidade de links Fonte: Google Imagens A pesquisa levantou fatores que tenham relação com popularidade de links, especificamente de uma determinada página. No total, 11 fatores foram abordados pela pesquisa, dos quais nove apresentam importância superior a 35%: • Textos âncora de links externos com foco na palavra-chave (importância de 73%) • Popularidade de links externos (importância de 71%) • Diversidade da origem dos links (importância de 67%) • TrustRank da página (importância de 65%) • Popularidade global dos links com base em um algoritmo iterativo (importância de 63%) • Origem dos links externos para a página com foco em um tópico específico (importância de 58%) • Textos âncora de links internos com foco na palavra-chave (importância de 55%) • Localização da informação da página em relação à arquitetura do site (importância de 51%) • Popularidade de links internos (importância de 51%) 24 2.2.1.4 Fatores do site relacionados à popularidade de links A pesquisa levantou fatores que tenham relação com popularidade de links do site. No total, sete fatores foram abordados, dos quais seis apresentam importância superior a 35%: • Confiança do domínio baseado na distância em links de sites confiáveis (importância de 66%) • Popularidade global dos links do domínio baseado em um algoritmo iterativo (importância de 64%) • Diversidade dos links do domínio (importância de 64%) • Links de autoridades em um tópico específico (importância de 64%) • Crescimento/redução dos links para o domínio (importância de 52%) • Links de domínios com extensão TLD de acesso restrito (importância de 47%) 2.2.1.5 Fatores do site não relacionados à popularidade de links Entre os fatores não relacionados à popularidade de links do site, quatro possuem importância, segundo a pesquisa Search Engine Ranking Factors, superior à 35%. • Arquitetura de site do domínio (importância de 52%) • Uso de links externos para sites de boa reputação, confiáveis (importância de 37%) • Idade do domínio (importância de 37%) • Histórico de registro do domínio (importância de 36%) 25 2.2.1.6 Fatores relacionados aos dados das mídias sociais sobre o site ou página Entre os seis fatores de ranking relacionados aos dados das mídias sociais sobre o site ou página, nenhum é considerado pela pesquisa como de baixa importância ou maior, o que demonstra que a influência dos dados de sites como Twitter, Facebook e MySpace no ranking ainda é pequena. 2.2.1.7 Fatores relacionados ao uso do site Os fatores de ranking relacionados ao uso do site ainda representam pouco em relação à importância. Estima-se, porém, que estes fatores tornem-se cada vez mais importantes (SEOMOZ, 2009) porque tratam diretamente do comportamento do usuário. Dos sete fatores da categoria, três foram considerados pelo menos 35% importantes: • Taxa histórica de cliques nos resultados das buscas para a página (importância de 42%) • Taxa histórica de cliques nos resultados das buscas para o site (importância de 39%) • Buscas realizadas pelo nome do domínio ou marca associada (importância de 36%) 2.2.1.8 Fatores negativos Fatores negativos são variáveis que compõe o algoritmo de classificação dos mecanismos de busca agindo de forma a reduzir o posicionamento ou mesmo desclassificar um site/página dos resultados das buscas. • Mostrar conteúdos diferentes conforme o tipo de usuário com intenção maliciosa e/ou manipulativa (importância de 68%) • Aquisição de links de vendedores conhecidos (importância de 56%) 26 • Links da página para sites/páginas spam (importância de 51%) • Mostrar conteúdos diferentes conforme o navegador (importância de 51%) • Servidor inacessível com frequência (importância de 51%) • Esconder texto com a mesma cor ou similar com a cor de fundo (importância de 49%) • Links do domínio para sites/páginas spam (importância de 48%) • Repetição excessiva de um mesmo texto-âncora em uma página (importância de 46%) • Mostrar conteúdos diferentes conforme o endereço IP (importância de 46%) • Esconder texto posicionando o elemento HTML fora da tela usando CSS (importância de 44%) • Número excessivo de parâmetros dinâmicos na URL (importância de 43%) • Número excessivo de links de sites hospedados no mesmo endereço IP (importância de 41%) • Aquisição de links em campanhas manipulativas de Bait-and-Switch (os sites criam links para um conteúdo que é redirecionado para outro) (importância de 41%) • Keyword Stuffing2 popular excessivamente com palavras-chave no texto da página (importância de 41%) • Esconder texto com CSS display:none; (importância de 40%) • Keyword Stuffing na tag <title> (importância de 39%) • Keyword Stuffing na URL (importância de 37%) • Aquisição de links a partir de campanhas manipulativas de widgets/selos (importância de 37%) • Mostrar conteúdos diferentes conforme suporte do usuário à JavaScript ou algum tipo de mídia (importância de 37 2 Keyword Stuffing significa inserir palavras-chave no título, na URL ou no conteúdo da página com o objetivo de manipular os resultados dos mecanismos de busca e criando uma experiência negativa ao usuário (GOOGLE, 2010) 27 • Mostrar conteúdos diferentes conforme cookies existentes no computador do usuário (importância de 36%) • Aquisição de links a partir de diretórios pagos de baixa qualidade (importância de 36%) • Número excessivo de links recebidos de sites com mesmo dono (importância de 36%) • Existência de links para a página a partir de sites/páginas spam (importância de 36%) 2.2.1.9 Fatores que afetam negativamente o valor de links externos Os links externos ainda representam a maior porção de importância entre os fatores de ranking. Por isso, a pesquisa abordou fatores que podem negativamente afetar a qualidade de links externos. Cinco fatores foram pontuados com importância superior a 35%: • Domínio de origem foi banido do Google por web spam (importância de 70%) • Domínio de origem foi punido pelo Google por web spam (importância de 65%) • Link foi determinado como pago, não natural (importância de 63%) • Domínio de origem contém links para web spam (importância de 52%) • Domínio de origem não recebeu links confiáveis (importância de 41%) 2.2.1.10 Fatores geográficos Fatores geográficos estão relacionados com a localização do usuário que fez a busca no mecanismo de busca. De modo geral, os resultados do Google são diferentes conforme o país em que a busca é efetuada. Os fatores listados nessa categoria influenciam positivamente sites com conteúdo voltado para uma região ou país específico. 28 • Código de país TLD do domínio raiz (importância de 69%) • Linguagem do conteúdo usado no site (importância de 63%) • Links de outros domínios ligados ao país / região (importância de 60%) • Localização geográfica do endereço IP da hospedagem do site (importância de 57%) • Revisão manual / seleção pelos engenheiros do Google (importância de 53%) • Opção de Geo-Targeting selecionada na ferramenta Google Webmaster Tools (importância de 52%) • Registro do site no Google Local com o país / região (importância de 45%) • Endereço no conteúdo da página (importância de 41%) • Endereço associado com o registro do domínio (importância de 35%) 2.2.2 Ferramentas para Análise de SEO Existentes Embora sejam conhecidos os fatores que possivelmente atuam nos algoritmos dos mecanismos de busca, não há no mercado ferramenta capaz de apoiar satisfatoriamente o webmaster na medição, monitoramento e acompanhamento histórico desses fatores. Isso ocorre especialmente porque boa parte das informações sobre os fatores de ranking não são facilmente mensuráveis. A seguir serão apresentadas algumas ferramentas analisadas que possuem características semelhantes em alguns pontos. 2.2.2.1 SEOQuake SEOQuake é uma extensão para o navegador Mozilla Firefox que fornece algumas informações úteis para análise de alguns fatores de SEO. Entretanto, os poucos dados fornecidos são insuficientes para uma análise eficaz porque poucos fatores são atendidos. 29 A extensão instala no navegador uma barra de ferramentas que exibe dados sobre a página aberta no navegador, conforme a Figura 3 - Barra de ferramentas SEOQuake. Figura 3 - Barra de ferramentas SEOQuake Fonte: Mozilla Firefox O SEOQuake também permite que múltiplos sites sejam analisados. A extensão instala um bloco de código nos resultados das buscas no Google, Bing e Yahoo!, conforme a Figura 4 - Informações do SEOQuake nos resultados de uma busca. Figura 4 - Informações do SEOQuake nos resultados de uma busca Fonte: Mozilla Firefox 2.2.2.2 SenSEO SenSEO é outra extensão de SEO para Firefox, que possui como diferencial a metodologia utilizada. O SenSEO gera uma pontuação a partir de uma análise automática dos fatores de SEO da página relacionados ou não à palavra-chave. Em conjunto com a pontuação, um relatório é fornecido com informações sobre como aumentar a pontuação gerada. Na Figura 5 - Relatório oriundo de uma análise feita usando o SenSEO, é possível observar parte de um relatório. 30 Figura 5 - Relatório oriundo de uma análise feita usando o SenSEO Fonte: Mozilla Firefox 2.2.2.3 Ferramentas de SEO privadas Algumas empresas especializadas em SEO oferecem relatórios para análise através de diversas ferramentas cujo acesso se dá mediante pagamento de mensalidades. Estas ferramentas oferecem diversas informações sobre SEO, mas não estão integradas entre si e aos fatores de ranking. Além disso, poucas delas oferecem o acompanhamento evolutivo dos resultados, essencial para determinar se uma campanha está sendo eficiente. Infelizmente não foi possível, por parte do autor, pesquisar a fundo as ferramentas oferecidas pelas empresas pelo seu caráter comercial, mas as conclusões foram tiradas a partir da revisão bibliográfica das especificações de cada uma. 31 2.2.3 Linkscape A limitação das ferramentas disponíveis em fornecer dados capazes de suportar a análise dos fatores de SEO se deve à dificuldade em medir a maior parte dos fatores que agem sobre os algoritmos dos buscadores, que só poderiam ser calculados em um ambiente similar a um mecanismo de busca, com indexação constante de dados e links. Pensando nisso, a empresa SEOmoz criou o Linkscape, um índice Web que funciona de modo muito similar a um mecanismo de busca, indexando continuamente páginas e links (SEOMOZ, 2010). Em outubro de 2010, o índice já armazenava 9,2 trilhões de links e 400 bilhões de páginas de 92 milhões de domínios diferentes (OPEN SITE EXPLORER, 2010). Os dados gerados pelo Linkscape que podem ser úteis para SEO, podem ser extraídos usando a API de dados Site Intelligence (SEOMOZ, 2010) também disponibilizada pela empresa SEOmoz. A empresa criou a API para que os usuários que não encontraram ferramentas adequadas entre as disponíveis possam criar suas próprias ferramentas. A API tem duas versões: uma gratuita que fornece poucos dados e outra paga que fornece maior quantidade. Mediante solicitação à empresa, o pesquisador conseguiu acesso gratuito à versão completa até dezembro, que custaria de U$ 500 a U$ 10.000 mensais, conforme o volume de dados usado, desde que o uso fosse exclusivamente acadêmico. Esta API fornecerá a maior parte das informações que serão usadas na ferramenta a ser desenvolvida neste estudo. 32 3 METODOLOGIA Considerando o objetivo deste estudo de desenvolver uma ferramenta capaz de gerar relatórios analíticos sobre SEO de um site e de seus concorrentes, apoiando o webmaster no acompanhamento histórico dos resultados obtidos, foram utilizados os seguintes métodos para este estudo. Inicialmente foi definido desenho da pesquisa, explicando a sua estratégia. A seção seguinte apresenta o desenho de pesquisa, onde o formato de pesquisa que foi utilizado é explicado. 3.1 DESENHO DE PESQUISA A pesquisa qualitativa de natureza exploratória teve como finalidade proporcionar maior familiaridade com os componentes necessários para a criação de um sistema para análise de SEO. Para isto, um levantamento bibliográfico sobre SEO foi efetuado e, logo após, foi desenvolvida a ferramenta proposta. 3.1.1 Levantamento Bibliográfico Para permitir que uma ferramenta de análise de SEO fosse desenvolvida, o pesquisador realizou um levantamento bibliográfico sobre o assunto, constituído principalmente de livros e artigos científicos da área. O objetivo era verificar como uma ferramenta computacional poderia agilizar, de forma eficaz, no processo de tomada de decisão. A revisão bibliográfica sobre SEO permitiu ao pesquisador identificar a melhor fonte para os dados que são usados na ferramenta: a API Site Intelligence. Esta API, que oferece dados do Linkscape, um índice Web que tem por finalidade agir como um mecanismo de busca, é a única capaz de fornecer dados sobre fatores de ranking como popularidade de links da página, confiança do domínio e poder de ranking passado através de links. A API fornece grande parte das informações para análise disponibilizadas no SEO Analytics. 33 Além disso, para prover percepções e compreender melhor o contexto do problema foi estudada profundamente a pesquisa Search Engine Ranking Factors 2009. A análise dessa pesquisa permitiu identificar quais são as variáveis envolvidas em SEO e que necessitam ser acompanhadas e medidas. A partir dessa identificação, foi desenvolvida a ferramenta que fornece grande parte dessas variáveis, o SEO Analytics 3.2 FERRAMENTA SEO ANALYTICS A ferramenta SEO Analytics é um sistema que fornece indicadores e informações de SEO e visa preencher as lacunas que existem atualmente nas ferramentas para análise de SEO, como a falta de acompanhamento histórico dos resultados e impossibilidade de comparação de sites e páginas com concorrentes. 3.2.1 Características da Ferramenta A ferramenta SEO Analytics é acessado via Web através de qualquer navegador Web moderno. Sua arquitetura permite que seja usado por múltiplos usuários, cada um com suas próprias campanhas e URLs de análise. As informações disponibilizadas estão disponíveis em módulos, conforme será apresentado a seguir. 3.2.1.1 Módulos do SEO Analytics As informações de SEO oferecidas pelo SEO Analytics estão organizadas em cinco módulos. 3.2.1.1.1 Módulo de Métricas de URL 34 O módulo de métricas de URL fornece indicadores relacionados à página ou site analisados. Ao todo são fornecidos 43 indicadores diferentes, que podem ser visualizados no Anexo A – Lista de Indicadores de URL. Estes indicadores oferecem informações fundamentais para uma boa gestão de SEO porque englobam boa parte dos fatores de ranking estimados pela pesquisa Search Engine Ranking Factors 2009. Na ferramenta SEO Analytics é possível acompanhar através de gráfico a evolução do valor do indicador de todos os sites de uma campanha, permitindo, por exemplo, que sites concorrentes sejam comparados. 3.2.1.1.2 Módulo de Links Os links englobam alguns dos principais fatores de ranking conhecidos. O módulo de links oferece quatro perspectivas diferentes: • Principais 50 links de entrada especificamente para a página cadastrada na campanha, ordenados pela autoridade de página3 da origem do link. • Principais 50 links de entrada para o domínio da página ou site cadastrado(a) na campanha, ordenados pela autoridade de página da origem do link. • Principais 50 domínios com links de entrada especificamente para a página cadastrada na campanha, ordenados pela autoridade do domínio4 de origem. • Principais 50 domínios com links de entrada para o domínio da página ou site cadastrado(a) na campanha, ordenados pela autoridade do domínio da origem do link Através deste módulo, o usuário pode identificar a origem dos links de seu site e de sites concorrentes e direcionar táticas de Link Building5. O módulo oferece relatórios dinâmicos, que se alteram conforme o site/página escolhido e filtros selecionados. Todos os 3 Autoridade de Página é uma métrica criada pela SEOmoz que melhor define a capacidade de uma página em se posicionar entre os resultados dos mecanismos de busca. O cálculo que gera essa métrica envolve os resultados reais nos mecanismos de busca e os dados existentes no índice Linkscape (SEOMOZ, 2010). 4 Autoridade de Domínio é a média dos valores de autoridade das páginas de um domínio (SEOMOZ, 2010). 5 Link Building é o termo que denomina todo o trabalho que envolve a aquisição de links para um determinado site ou página. (MARCEL, 2010) 35 links são exibidos nos relatórios por ordem decrescente de Autoridade de Página da origem do link. Os seguintes filtros podem ser aplicados: • Links internos: apresenta apenas os links internos para a página ou site selecionados • Links externos: apresenta apenas os links externos para a página ou site selecionados • Links nofollow: apresenta apenas os links sem poder de ranking (que possuem o atributo rel=”nofollow”) para a página ou site selecionados. • Links follow: apresenta apenas os links com poder de ranking (que não possuem o atributo rel=”nofollow”) para a página ou site selecionados • Redirecionamentos 301: apresenta apenas os redirecionamentos 301. Esse tipo de redirecionamento, que é comumente usado quando um site é movido permanentemente para outro endereço, passa consigo todo o poder de ranking da URL movida. É uma prática comum entre os especialistas de SEO comprar sites antigos e redirecionar todas as páginas para um domínio já existente com o objetivo de adquirir o poder de ranking do antigo endereço (ENGE, 2009). 3.2.1.1.3 Módulo de Conteúdo O módulo de conteúdo permite que o webmaster perceba quais conteúdos dos sites analisados são mais relevantes para SEO. A análise desses dados possibilita que o webmaster identifique os tipos de conteúdo que dão melhor resposta para SEO no seu site e nos sites concorrentes. No módulo, são exibidas as principais 50 páginas do domínio apresentadas em ordem decrescente de número de domínios com links para a página. A Figura 6 - Parte de relatório do SEO Analytics sobre o conteúdo de um domínio, mostra parte de um relatório do SEO Analytics sobre as principais páginas do domínio codeigniter.com. 36 Figura 6 - Parte de relatório do SEO Analytics sobre o conteúdo de um domínio Fonte: SEO Analytics 3.2.1.1.4 Módulo de Texto-âncora O texto-âncora é o texto que descreve um link. Na Figura 7 - Estrutura de um link em HTML, onde a estrutura básica de links é representada, é possível visualizar qual porção de um link é um texto-âncora O texto-âncora dos links de entrada de um site é muito importante para SEO porque ele indica ao mecanismo de busca sobre o que se refere o site de destino do link (SEOMOZ, 2009). Figura 7 - Estrutura de um link em HTML (RICOTTA, 2010) Fonte: Blog da empresa Mestre SEO Uma prova de que os textos-âncora influenciam na classificação das buscas pode ser visto na Figura 8 - Pesquisa no Google por “clique aqui”, onde uma busca no Google pela expressão “clique aqui” retorna como resultados sites normalmente apontados por essa expressão. 37 Figura 8 - Pesquisa no Google por “clique aqui” Fonte: Google O módulo texto-âncora permite que para cada site ou página analisados sejam identificados quais textos-âncora ocorrem com maior frequência. Os textos-âncora exibidos são ordenados por ordem decrescente de número de domínios com links que usam a âncora e podem ser filtrados com os seguintes atributos: • Frase para Domínio: exibe apenas âncoras com dois ou mais termos em links para qualquer página do domínio • Frase para Página: exibe apenas âncoras com dois ou mais termos em links para a página cadastrada na campanha do SEO Analytics • Termo para Domínio: exibe apenas âncoras com termos simples em links para qualquer página do domínio • Termo para Página: exibe apenas âncoras com termos simples em links para a página cadastrada na campanha do SEO Analytics 38 A Figura 9 - Parte de relatório sobre os textos-âncora recebidos por um domínio, mostra parte de um relatório do SEO Analytics sobre as 50 principais frases em textos-âncora para o domínio unisinos.br. Figura 9 - Parte de relatório sobre os textos-âncora recebidos por um domínio Fonte: SEO Analytics 3.2.1.1.5 Módulo de Resultados Neste módulo é possível acompanhar a evolução dos sites cadastrados na campanha ao longo dos meses nos resultados do Google. Os sites são comparados nos resultados do buscador e exibidos em um gráfico usando as palavras-chave cadastradas na campanha. O módulo de resultados permite que o usuário conclua sobre a eficácia das suas estratégias de SEO e de seus concorrentes com o passar dos meses. A Figura 10 – Módulo de resultados mostra uma cópia da tela do módulo de resultados. A evolução de cada site/página da campanha nos resultados das buscas no site Google.com é mostrada em um gráfico, dentro desta figura. 39 Figura 10 – Módulo de resultados Fonte: SEO Analytics Os resultados apresentados neste módulo refletem uma busca realizada no site global Google.com, que são diferentes de buscas realizadas nas versões locais do mecanismo de busca, como por exemplo Google.com.br (Brasil) e Google.com.ar (Argentina). 3.2.2 Arquitetura do SEO Analytics A ferramenta é multiusuário, sendo que cada usuário pode criar múltiplas campanhas de análise. Cada campanha pode ser composta de muitos sites ou páginas. Um usuário pode criar, por exemplo, uma campanha para acompanhar sites de diferentes universidades e outra para acompanhar diversas páginas de um mesmo site. Esta arquitetura está representada na Figura 11 - Arquitetura multiusuário do SEO Analytics. 40 Usuários Campanhas de Análise Páginas Figura 11 - Arquitetura multiusuário do SEO Analytics Fonte: Autor As informações usadas na ferramenta são obtidas pelo índice web Linkscape através da API Site Intelligence, que oferece os dados do índice, e de webservices dos mecanismos de busca, conforme pode ser visto na Figura 12 - Fluxo dos dados do SEO Analytics. Os dados obtidos são guardados mensalmente na base de dados do sistema para que um acompanhamento histórico dos resultados possa ser disponibilizado. O acompanhamento é mostrado em forma de gráficos, que são disponibilizados pela Open Flash Chart, uma biblioteca open-source para geração de gráficos para uso em ambientes web (OPEN FLASH CHART, 2010). Webservices SEO Analytics Figura 12 - Fluxo dos dados do SEO Analytics Fonte: Autor Usuário 41 3.2.3 Desenvolvimento da Ferramenta O SEO Analytics foi desenvolvido em linguagem de programação PHP (Hypertext Preprocessor). Para desenvolvimento mais veloz, foi usado o framework open-source CodeIgniter, que usa arquitetura MVC e reduz o tempo de desenvolvimento porque disponibiliza diversas bibliotecas, ajudantes e plug-ins que com códigos comuns (ELLISLAB, 2010). 3.2.4 Interface A interface da ferramenta é Web, acessível através de navegadores de Internet. Por ser melhor difundida entre os profissionais de TI, a interface foi desenvolvida em inglês, permitindo que um maior número de possíveis usuários seja atingido. Na Figura 13 - Interface do SEO Analytics, é exibida uma cópia da tela do sistema mostrando o indicador Domain Authority de uma campanha chamada “Meus Sites”. Em destaque estão diferentes pontos da interface: • A: Dropdown de seleção da campanha ativa • B: Barra lateral com atalhos para as informações disponibilizadas pela ferramenta • C: Área de seleção de sites/páginas que são mostrados nos gráficos • D: Gráfico evolutivo do indicador Domain Authority dos sites/páginas selecionados • E: Informações sobre a última medição do indicador realizada 42 A B C D E Figura 13 - Interface do SEO Analytics Fonte: SEO Analytics 3.2.5 Banco de Dados A partir da identificação dos dados disponibilizados pela API Site Intelligence e da arquitetura esperada para a ferramenta, foi modelado o banco de dados, sendo utilizado como gerenciador do banco de dados é usado o MySQL. As informações para os grupos Links, Conteúdo e Texto-âncora não serão persistidas porque não serão acompanhadas historicamente e serão fornecidas na ferramenta diretamente das APIs que as oferecem. Já as informações que compõe os grupos de métricas de URL e resultados serão armazenadas para acompanhamento da evolução dos mesmos. 43 O modelo de banco de dados, representado na Figura 14 - Diagrama compacto do banco de dados da aplicação SEO Analytics, se resume a oito tabelas: • “api”: guarda informações sobre a API Site Intelligence (nome, descrição, valores máximos e mínimos de cada valor da API). É essencial para a geração de gráficos relacionados às métricas. • “metricas”: guarda os dados obtidos da API Site Intelligence. Os dados são persistidos nessa tabela uma vez ao mês, periodicidade com que o índice Linkscape é atualizado. • “usuarios”: guarda as informações dos usuários do sistema (nome de usuário e senha de acesso criptografada) • “campanhas”: guarda as campanhas de cada usuário • “paginas”: guarda os sites e páginas de cada campanha • “log”: recebe informações de data e hora da importação de dados de cada campanha • “palavras-chave”: guarda as palavras-chave que terão os resultados medidos e cada campanha • “resultados”: guarda mensalmente os resultados obtidos nos mecanismos de busca de cada página para cada palavra-chave. Figura 14 - Diagrama compacto do banco de dados da aplicação SEO Analytics Fonte: Autor 44 3.3 COLETA DE DADOS A maior parte dos dados coletados pela ferramenta SEO Analytics são obtidos através da API Site Intelligence. Essa API fornece dados do índice Web Linkscape, que tem por objetivo imitar um mecanismo de busca (OPEN SITE EXPLORER, 2009). A API está subdividida em outras quatro APIs: • URL Metrics: fornece indicadores para uma determinada URL passada como parâmetro • Links: fornece informações sobre os links recebidos por uma URL passada como parâmetro • Anchor Text: fornece informações sobre os textos-âncora dos links recebidos por uma URL passada como parâmetro • Top Content: fornece informações sobre as principais páginas do domínio de uma URL passada como parâmetro Outra parte dos dados, que fazem parte do módulo de resultados, são obtidos dos próprios mecanismos de busca. 3.4 PREPARAÇÃO PARA A VALIDAÇÃO Por ser uma ferramenta com aplicabilidade real, para validação optou-se por submetêla a especialistas e entusiastas de SEO, que foram convidados a validar o SEO Analytics através de grupo de discussão e fóruns sobre SEO, e de mídias sociais. Os convites em fóruns e mídias sociais tiveram caráter pessoal e informal, enquanto o convite ao grupo de discussão BrSEO (composto de 20 membros) foi feito através de um e-mail formal encaminhado a todos os integrantes (ver Apêndice 1 – Convite enviado aos integrantes do grupo de discussão BrSEO). 45 3.4.1 Submissão aos Avaliadores Após os contatos iniciais com os possíveis avaliadores, 19 deles retornaram demonstrando interesse em avaliar a ferramenta. Aos interessados em efetuar a validação, foi encaminhado um texto explicativo sobre a ferramenta, dados de acesso e questões para serem respondidas após a avaliação (ver Apêndice 2 – E-mail enviado aos avaliadores). Dos 19 avaliadores, quatro responderam às questões com sua análise. Embora o número pareça pequeno, envolveu quatro tipos distintos de profissionais, conforme apresentado a seguir. 3.4.2 Identificação dos Avaliadores Para fins de preservação, os avaliadores serão identificados pelo número e não por seus verdadeiros nomes. O avaliador 1 estuda SEO e está prestes a abrir uma empresa no ramo. O avaliador 2 é desenvolvedor de sites e iniciante em SEO. O avaliador 3 é escocês e trabalha para uma empresa de SEO. O avaliador 4 é sócio-diretor de uma empresa de marketing digital, com foco em SEO. 46 4 VALIDAÇÃO DA FERRAMENTA O processo de validação teve início no dia 8 de novembro de 2010, quando foram encaminhados os convites para avaliar o SEO Analytics através de grupos de discussão e fóruns sobre SEO, e de mídias sociais. Durante os seguintes cinco dias, foram recebidos por e-mail os contatos de interessados em efetuar a validação e os feedbacks dos que já haviam efetuado. A seguir será apresentada uma análise sobre a perceção dos avaliadores e, logo após, uma análise das avaliações realizadas. 4.1 PERCEPÇÃO DOS AVALIADORES Após o recebimento das avaliações, os dados foram analisados para verificar a percepção dos avaliadores. De uma forma geral, a ferramenta SEO Analytics foi bem aceita pelos avaliadores. As avaliações também indicaram alguns pontos de melhoria, que serão contemplados pelo autor em trabalhos futuros. Alguns problemas foram identificados e serão aprofundados a seguir juntamente com a análise das avaliações. A seguir serão apresentadas as avaliações efetuadas pelos avaliadores da ferramenta. Estas serão agrupadas em itens como interface; contribuições para SEO; gestão de SEO; substituição da ferramenta atual; e recomendação da ferramenta. 4.1.1 Interface A primeira pergunta enviada aos avaliadores questionava sobre a acessibilidade e organização das informações na interface. Os quatro avaliadores concordaram que as informações no SEO Analytics estão acessíveis e organizadas. Alguns problemas foram identificados, conforme a seguir. O avaliador 1 respondeu que 47 “As informações estão organizadas, o complicado é o cadastro das campanhas, poderia ser mais simples. Sinceramente não gostei do layout do tipo Google Analytics, deixa uma expectativa no visitante”. O avaliador 1 achou complicado o cadastro de campanhas na ferramenta, completando que poderia ser mais simples. Na mesma resposta também expressou uma opinião particular sobre certa expectativa que a interface, por ser semelhante à do site Google Analytics, deixaria no visitante. O avaliador 2 levantou um problema de inconsistência de informações no módulo de resultados. Embora isto não seja um problema de interface, é importante esclarecer que o problema se deve ao fato de que os resultados mostrados no SEO Analytics são provenientes do mecanismo de busca global Google.com e não de buscadores locais como Google.com.br (Brasil) e Google.co.jp (Japão). Esta limitação está contemplada nas delimitações do software. O avaliador 2 respondeu que: As informações são bem organizadas, porém precisam ser feitas correções, pois encontrei falhas no posicionamento de um link no mecanismo de busca (por exemplo, um link que se encontra na 4ª posição foi informado como 55ª posição no módulo de resultados). Os avaliadores 3 e 4 concordaram que as informações do SEO Analytics estão acessíveis e organizadas. 4.1.2 Contribuições para SEO Os avaliadores também foram questionados se o SEO Analytics contribuía para SEO. Todos os avaliadores concordaram que a ferramenta contribui para SEO. Os avaliadores 1 e 2 enaltecerem a qualidade da ferramenta de reduzir o tempo perdido com coleta de dados. Nesta questão, o avaliador 1 respondeu que “sim, ela contribui e muito, pois ela concentra várias informações nela, não precisa ficar garimpando na Internet. Isso adianta o serviço”. De forma similar, o avaliador 2 respondeu 48 “Com certeza a ferramenta disponibiliza informações necessárias que manualmente são difíceis de adquirir, pois precisam ser colhidas uma a uma, sendo assim recomendado o uso da ferramenta”. O avaliador 4 também escreveu que os dados demoram para ser atualizados. Isso ocorre porque a maior parte dos dados é proveniente do índice Linkscape, que embora seja indexado constantemente, tem seus dados atualizados apenas uma vez ao mês. Ele disse que: “Sim, os relatórios de link building, apesar de demorarem a atualizar (isso já é do SEOMoz), são bons e facilitam a vida separando os links follow e nofollow, além de organizar de acordo com as várias métricas existentes”. O avaliador 3 escreveu que que “a ferramenta pode ser muito boa para quem está iniciando na indústria”, 4.1.3 Gestão do SEO A terceira questão de avaliação perguntava se o SEO Analytics fornece informações em quantidade e qualidades suficientes para uma boa gestão de SEO. Neste ponto de avaliação, os avaliadores 1 e 3 concordaram que o SEO Analytics fornece informações em quantidade e qualidade suficientes para uma boa gestão de SEO. O avaliador 1 reforçou também a qualidade da ferramenta em permitir análise de concorrentes. “As informações que ele oferece são algumas das necessárias, muito legal a comparação que ela faz com os concorrentes, isso ilustra o mercado em que iremos embarcar. Bom para avaliar uma nova oportunidade”. O avaliador 2 disse achar que a ferramenta oferece quantidade média de informações, podendo fornecer mais no futuro: “as informações fornecidas contêm uma quantia média de 49 informações. Dá para posteriormente fornecer mais informações”. O avaliador 4 acha que a ferramenta não fornece informações suficientes para um mercado mais competitivo: “Depende do mercado analisado, se for um mercado muito competitivo, precisamos de mais informações, mas se for um mercado de competitividade média, fornece sim”. Infelizmente nenhum dos dois citou nas respostas que informações adicionais poderiam ser fornecidas. O avaliador 3 concordou que o SEO Analytics fornece informações em quantidade e qualidades suficientes para uma boa gestão de SEO. Já o avaliador 4 respondeu que 4.1.4 Substituição das Ferramentas Atuais A quarta pergunta questionou os avaliadores se eles trocariam as ferramentas que usam atualmente pelo SEO Analytics. O objetivo desta pergunta foi comparar o SEO Analytics com as ferramentas utilizadas pelos avaliadores. Apenas o avaliador 2 respondeu que trocaria as ferramentas que usa pelo SEO Analytics. O avaliador 1 respondeu que trocaria algumas ferramentas utilizadas “Eu trabalho hoje com as ferramentas da MestreSEO e SemRush, e algumas extensões do Firefox. Algumas ferramentas podem ser substituídas tranquilamente, outras já não”. Neste item, o avaliador 2 disse preferir ferramentas em língua portuguesa, mas diz também que mesmo sendo em inglês, a ferramenta é fácil de usar. “Particularmente prefiro ferramentas com nosso idioma o que é praticamente impossível no mercado, porém a ferramenta mesmo sendo em inglês é muito simples de ser entendida sendo assim a usaria no lugar de outras”. Já o avaliador 3 não trocaria as ferramentas atuais pelo SEO Analytics, mas a incluiria entre as ferramentas que usa. Escreveu que “infelizmente não trocaria outras ferramentas que uso por esta (porque eu uso as ferramentas da SEOmoz), mas definitivamente a adicionaria à lista de ferramentas que uso”. 50 O avaliador 4 respondeu que não substituiria porque, segundo ele, o SEO Analytics não tem nenhum diferencial em relação às ferramentas da empresa SEOmoz. Como é assinante da SEOmoz, não trocaria. “Se algum dia o SEO Analytics tiver algum diferencial em relação às ferramentas da SEOmoz, trocaria sim”. 4.1.5 Recomendação da Ferramenta Na última pergunta os avaliadores foram solicitados a escrever sobre o que acharam da ferramenta e se recomendariam a outros profissionais. Todos demonstraram aprovar a ferramenta e escreveram que recomendariam a ferramenta. O avaliador 1 respondeu “Eu utilizaria a ferramenta e acredito que ela seria muito útil na execução da alguns trabalhos e também no orçamento dos jobs então, sim, eu recomendaria para outras pessoas”. Os avaliadores 2 e 3 identificaram necessidade de ajustes na ferramenta, sem especificar quais são . O avaliador 2 respondeu que “a ferramenta é de boa qualidade precisa de alguns ajustes, mas recomendaria sim para outros profissionais experimentarem, pois não se arrependeriam”. Já o avaliador 3 respondeu: “Eu gostei da ferramenta, mas gostaria de criar uma campanha, um domínio e então cadastrar palavras-chave, ao invés de inserir as palavras-chave e depois um domínio. Eu recomendaria isso a outros. Eu acredito que precisa ainda de algum desenvolvimento, mas como um projeto acadêmico está ótimo!” Apesar da aprovação, o avaliador 3 recomendou que as palavras-chave fossem cadastradas após o cadastro das URLs. Encerrando as avaliações, o avaliador 4 sugeriu que os dados pudessem ser exportados para planilha eletrônica, o que deve ser contemplado futuramente pelo autor: 51 “Achei interessante, sugiro possibilitar a exportação dos relatórios para Excel. Recomendaria sim, dependendo do valor a ser pago. De forma geral utilizo a plataforma do SEOMoz e não avaliei se o que ele disponibiliza é grátis ou pago no site do SEOMoz, mas em geral a ferramenta é boa.” 52 5 CONCLUSÕES E TRABALHOS FUTUROS As buscas na Internet já fazem parte do cotidiano das pessoas. Usando os mecanismos de busca, as pessoas podem obter informações sobre qualquer assunto em poucos segundos, tarefa que há 20 anos levaria horas para ser executada. Esse poder dos mecanismos de busca de processar uma busca rapidamente e retornar resultados cada vez mais relevantes faz com que as pessoas os usem como porta de entrada para a Internet, além de torná-los mais populares a cada dia. Para um site que deseje obter quantidade significativa de visitantes, estar bem posicionado entre os resultados das buscas é essencial. Para tanto, a aplicação de estratégias de SEO é fundamental nesse ponto, porque elas trabalham diretamente com os fatores que influenciam os algoritmos de classificação dos mecanismos de busca. Embora existam pesquisas que estimem quais são esses fatores, há carência no mercado de ferramentas para medir e monitorar o trabalho sobre esses fatores. 5.1 IMPLICAÇÕES GERENCIAIS Atualmente, os maiores problemas entre webmasters e consultores de SEO são medir e monitorar os resultados de SEO de sites e concorrentes. Essa prática exige uma consulta a diversas ferramentas para coleta dados e o uso de outras para acompanhamento, sendo comum entre os profissionais de SEO o uso de planilhas de Excel para a segunda tarefa. Esse trabalho é multiplicado pelo número de concorrentes que se deseja acompanhar. O SEO Analytics, através da sua interface amigável e fácil de usar, consegue reduzir o desgaste desses profissionais, permitindo que eles gastem seu tempo na aplicação efetiva das estratégias de SEO, ao invés de perder tempo com coleta e armazenamento de dados. A ferramenta fornece dados sobre grande parte dos fatores de ranking estimados pela pesquisa Search Engine Ranking Factors 2009 (SEOMOZ, 2009), podendo ser um diferencial competitivo em favor de quem fizer seu uso. As avaliações da ferramenta efetuadas por brasileiros demonstraram que o SEO Analytics tem grande potencial para SEO no mercado nacional. A avaliação feita por um 53 escocês que trabalha no ramo há três anos demonstrou que o SEO Analytics é uma “ótima ferramenta” que precisa de um pouco mais de desenvolvimento. De uma forma geral, as avaliações aprovaram a ferramenta e esperam que algumas melhorias sejam implantadas. Essas sugestões serão contempladas futuramente pelo pesquisador. 5.2 IMPLICAÇÕES ACADÊMICAS Apesar dos benefícios que pode trazer, como aumento do lucro de uma empresa através do aumento do número de clientes em seu site, SEO ainda é um tema pouco abordado entre os acadêmicos. Espera-se que este trabalho possa servir como base e estímulo para que outros estudantes pesquisem sobre o assunto. Os trabalhos futuros a seguir trazem alguns temas que podem ser abordados nestas pesquisas. 5.3 TRABALHOS FUTUROS Como trabalhos futuros para o tema SEO, o pesquisador sugere: • Desenvolvimento de um índice Web capaz de funcionar de forma similar a um mecanismo de busca • Desenvolvimento de um sistema capaz de avaliar um site ou página em relação aos fatores de ranking e gerar um relatório e pontuação • Um estudo de caso de aplicação de técnicas de SEO em um site real (demonstrando crescimento no número de visitantes, no número de vendas etc.) • Um estudo sobre a viabilidade de uso de blogs da plataforma Wordpress como sites empresariais (considerando que, entre diversas vantagens, com poucos ajustes a plataforma está bem otimizada para os fatores de ranking on-page) • Um estudo sobre o emprego de técnicas de SEO pelas empresas em seus sites com o objetivo de descobrir por que as empresas que não empregam não o 54 fazem (desinteresse ou desconhecimento dos benefícios que podem ser obtidos) 55 REFERÊNCIAS COMSCORE comScore Releases July 2010 U.S. Search Engine Rankings. Disponível em: <http://www.comscore.com/Press_Events/Press_Releases/2010/8/comScore_Releases_July_2 010_U.S._Search_Engine_Rankings>. Acesso em: 15 set. 2010. ELLISLAB, Inc. CodeIgniter: an open source Web Application Framework that helps you write PHP programs. Disponível em: <http://codeigniter.com/>. Acesso em: 30 ago. 2010. ENGE, E.; SPENCER, S.; FISHKIN, R.; STRICCHIOLA, J. The Art of SEO: Mastering Search Engine Optimization. Primeira Edição. O'Reilly Media, Inc., 2009. 544 páginas. GYONGYI, Zoltán. Combating Web Spam with TrustRank. <http://www.vldb.org/conf/2004/RS15P3.PDF>. Acesso em: 4 nov. 2010. Disponível em: GOOGLE Webmaster Central. Keyword stuffing - Webmaster Tools Help. Disponível em: <http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=66358>. Acesso em 23 set. 2010 IPROSPECT. iProspect Search Engine User Behavior Study. Disponível em <http://www.iprospect.com/premiumPDFs/WhitePaper_2006_SearchEngineUserBehavior.pd f>. Acesso em 23 set. 2010 LEDFORD, J. SEO: Search Engine Optimization Bible. Edição Ilustrada. Wiley, 2007. 408 páginas. MARCEL, Frank. Glossário SEM e SEO | Mestre SEO. Disponível <http://www.mestreseo.com.br/seo/glossario-seo-e-sem>. Acesso em: 11 nov. 2010 em NET APPLICATIONS. Search Engine Market Share. Disponível em <http://www.netmarketshare.com/search-engine-market-share.aspx?qprid=4>. Acesso em: 15 set. 2010 OPEN FLASH CHART. Open Flash Chart - Home. Disponível <http://teethgrinder.co.uk/open-flash-chart-2/>. Acesso em: 11 nov. 2010. em: 56 RICOTTA, Fabio. Linkbuilding – O Poder do Texto Âncora | Mestre SEO. Disponível em <http://www.mestreseo.com.br/link-building/linkbuilding-o-poder-do-texto-ancora>. Acesso em: 4 nov. 2010 SENSEO. SenSEO Firefox Extension. Disponível em <https://addons.mozilla.org/enUS/firefox/addon/9403>. Acesso em 22 set. 2010 SEOMOZ. Search Engine Ranking Factors 2009. Disponível <http://www.seomoz.org/article/search-ranking-factors>. Acesso em: 21 jun. 2010. em: SEOMOZ. Site Intelligence API. Disponível em: <http://www.seomoz.org/api>. Acesso em: 30 ago. 2010. SEOMOZ. Open Site Explorer: Link Popularity & Backlink Analysis Tool. Disponível em: <http://www.opensiteexplorer.org>. Acesso em: 10 set. 2010. WIKIPEDIA: a enciclopédia livre. Classificação decimal de Dewey. Disponível em: <http://pt.wikipedia.org/wiki/Classificação_decimal_de_Dewey>. Acesso em: 8 nov. 2010. 57 ANEXO A – LISTA DE INDICADORES DE URL FORNECIDOS PELA API SITE INTELLIGENCE Os indicadores constantes no Quadro 1 - Indicadores de URL disponíveis no SEO Analytics Erro! Fonte de referência não encontrada., são disponibilizados pela API Site Intelligence e na ferramenta SEO Analytics para análise. A sigla que denomina cada indicador foi criada pela empresa SEOmoz.. Indicador Título Descrição ueid External Links The number of juice-passing external links to the url. feid Subdomain External Links The number of juice-passing external links to the subdomain of the url. peid Root Domain External Links The number of juice-passing external links to the root domain of the url. ujid Juice-Passing6 Links The number of juice-passing links (internal or external) to the url. uifq Subdomains Linking The number of subdomains with any pages linking to the url. uipl Root Domains Linking The number of root domains with any pages linking to the url. uid Links The number of links (juice-passing or not, internal or external) to the url. fid Subdomain Subdomains Linking The number of subdomains with any pages linking to the subdomain of the url. pid Root Domain Root Domains Linking The number of root domains with any pages linking to the root domain of the url. umrp mozRank7 The mozRank of the url. fmrp Subdomain mozRank The mozRank of the subdomain of the url. pmrp Root Domain mozRank The mozRank of the Root Domain of the url. utrp mozTrust8 The mozTrust of the url. ftrp Subdomain mozTrust The mozTrust of the subdomain of the url. 6 Juice-passing é uma expressão para definir links e redirecionamentos que passam poder de ranking. Alguns sites, em especial aqueles em que o conteúdo é gerado por usuários como comentários de blogs e fóruns, os links recebem o atributo rel=”nofollow”, o que remove o poder de ranking do link. Essa é uma prática comum para evitar spam. 7 mozRank é um índice que representa a popularidade de links de um site ou página. 8 mozTrust é um índice que representa a distância em links de um site ou página de sites confiáveis escolhidos manualmente. Quanto menor a distância, maior é o índice. O cálculo do índice é baseado no algoritmo TrustRank (GYÖNGYI, 2004) 58 Indicador Título Descrição ptrp Root Domain mozTrust The mozTrust of the root domain of the url. uemrp External mozRank The portion of the url's mozRank coming from external links. fejp Subdomain External Domain Juice The portion of the mozRank of all pages on the subdomain coming from external links. pejp Root Domain External Domain Juice The portion of the mozRank of all pages on the root domain coming from external links. fjp Subdomain Domain Juice The mozRank of all pages on the subdomain combined. pjp Root Domain Domain Juice The mozRank of all pages on the root domain combined. fuid Links to Subdomain Total links (including internal and nofollow links) to the subdomain of the url in question. puid Links to Root Domain Total links (including internal and nofollow links) to the root domain of the url in question. fipl Root Domains Linking to Subdomain The number of root domains with at least one link to the subdomain of the url in question. upa Page Authority A score out of 100-points representing the likelihood for arbitrary content to rank on this page pda Domain Authority A score out of 100-points representing the likelihood for arbitrary content to rank on this domain ued All external links page to page The number of external links from one page to another (included followed and nofollowed). ujfq Followed Domains Linking The number of unique domains with followed links Page to the target url. ujp Followed IPs Linking The number unique IPs with a followable link to a target url. uip IPs Linking The total number of unique IPs linking to a target url. ujpl Followed Domains to Page The number of unique domains with followed links to a given url. uib All Cblock Linking The total number unique cblocks linking to a page. ujb Followed CBLocks Linking The total number unique cblocks with followed links to a page. fjid Followed Subdomain Linking Domains A count of all unique subdomains with followed links to the target domain. fed Subdomain External Links The total number (followed and nofollowed) external links to the subdomain of the url. fjf Followed Subdomain The number of subdomains with followed links to 59 Indicador Título Descrição Subdomains Links the subdomain of the url. fjd Followed Domain Subdomains Links The number of unique domains with followed links to the subdomain of the url. pjid Followed Root Domain Links The total number of followed links (both internal and external) from a page to a domain. ped All Root Domain External Links The total number of external links (both followed and no-followed) from a page to a domain. pjd All Followed Root Domains The total number of followed root domains linking to Linking Domain the target's domain. pip IPs Linking to Domain The total number of unique IPs linking to the target's domain. pjip Followed IPs Linking to Domain The total number of unique IPs with followed links to the target's domain. pib All Cblock Linking Domain The number of unique cblocks with a link to a domain. pjb Followed Cblock Linking Domain The total number of cblock with followed links to a domain. Quadro 1 - Indicadores de URL disponíveis no SEO Analytics 60 APÊNDICE 1 – CONVITE ENVIADO AOS INTEGRANTES DO GRUPO DE DISCUSSÃO BRSEO Pessoal, Desenvolvi uma ferramenta excelente para análise de SEO e preciso de voluntários para testá-la. A ferramenta foi desenvolvida como meu trabalho de conclusão de curso, portanto a validação através de testes por profissionais de SEO é obrigatória. A ferramenta, que chamo de SEO Analytics, fornece dados importantes sobre um site e seus concorrentes. Além disso, ela permite que os dados tenham sua evolução com o passar dos meses comparada. Ela está dividida em cinco módulos: Métricas de URL: fornece 43 métricas sobre as URLs cadastradas na campanha (ex: número de backlinks, links internos, externos, autoridade de domínio, autoridade de página) Links: mostra os principais 50 links que as URLs cadastradas recebem, ordenados pela autoridade da página de origem Conteúdo: mostra as pricipais 50 páginas dos domínios das URLs cadastradas ordenadas pelo número de links externos que recebem Texto-âncora: mostra os pricipais 50 texto-âncoras que as URLs cadastradas recebem, ordenados pelo número de links externos que os usam Resultados: mostra graficamente a evolução das URLs cadastradas no Google para um conjunto de keywords fornecido Quem tiver interesse favor me mandar um e-mail para que eu possa gerar um usuário e senha e encaminhar algumas instruções. É importante conhecer SEO, especialmente os fatores que contribuem para ranking, do contrário, os dados fornecidos serão pouco úteis. Preciso disso com certa urgência porque preciso entregar o trabalho na próxima semana. Para terem uma idéia do que se trata, em anexo estão algumas screenshots da ferramenta. Um grande abraço a todos. Enéas Gesing 61 APÊNCIDE 2 – E-MAIL ENVIADO AOS AVALIADORES <Nome do Avaliador,> Obrigado pelo interesse. Seguem os dados para acesso: Endereço: http://www.webosfera.com.br/ferramentas/seoanalytics Usuário: nome de usuário Senha: senha de acesso Preciso que você responda às seguintes perguntas depois de usar com a ferramenta. As respostas não precisam ser apenas "sim" ou "não", pelo contrário, quanto mais completas forem, melhor. • Inicialmente descreva a sua relação com SEO. (escreva aqui uma pequena biografia, se você tem um site e/ou empresa sobre o assunto, se tem um ou mais sites em que aplica as técnicas de SEO ou se apenas se interessa pelo assunto) • As informações que são fornecidas pela ferramenta SEO Analytics estão acessíveis e organizadas? • A ferramenta contribui, de alguma forma, com quem trabalha com SEO? • O SEO Analytics fornece informações em quantidade e qualidade suficientes para uma boa gestão de SEO? • Você trocaria outras ferramentas de análise de SEO que existem no mercado pelo SEO Analytics? • De uma forma geral, o que você achou da ferramenta? Você recomendaria a outras pessoas que trabalham com SEO? Para iniciar o uso da ferramenta, basta seguir os seguintes passos: 62 • Efetuar login • Acessar o menu no topo"My Campaigns" • Clica em "Add new campaign" • Digita um nome para a campanha (exemplo: Imobiliárias de São Paulo) e clica em "Next" • Adiciona algumas palavras-chave para acompanhar na campanha (exemplo: “imoveis em são paulo”, “imobiliaria são paulo”) e clica em "Finish" (você pode adicionar quantas palavras quiser, mas peço a gentileza de não incluir mais que cinco por campanha nesse momento) • Seleciona a campanha • Clica em "Add new site / page to selected campaign" e adiciona um site ou página. Repete esses passos para o numero de sites que deseja acompanhar (recomendo que você cadastre seu site e de concorrentes) • Agora é só acessar cada um dos módulos e ver os indicadores e resultados. Os módulos URL Metrics e Results guardam os resultados uma vez ao mês para acompanhamento evolutivo. Esses são os módulos: Métricas de URL: fornece 43 métricas sobre as URLs cadastradas na campanha (ex: número de backlinks, links internos, externos, autoridade de domínio, autoridade de página) Links: mostra os principais 50 links que as URLs cadastradas recebem, ordenados pela autoridade da página de origem Conteúdo: mostra as principais 50 páginas dos domínios das URLs cadastradas ordenadas pelo número de links externos que recebem Texto-âncora: mostra os pricipais 50 texto-âncoras que as URLs cadastradas recebem, ordenados pelo número de links externos que os usam Resultados: mostra graficamente a evolução das URLs cadastradas no Google para um conjunto de keywords fornecido 63 Atenciosamente, Enéas Gesing