PageRank: é tão simples!

Li, com interesse, um post recente no AirDiogo acerca do PageRank, o sistema através do qual o Google organiza os resultados das pesquisas em função da relevância atribuída ao conteúdo da página ou site. A reflexão sobre a popularidade deste assunto e sobre as diferentes posturas de SEO – Search Engine Optimization que vão desde a explicação séria e simples dos parâmetros envolvidos até às lógicas obscurantistas e promessas milagoras, típicas de vendedores de banha da cobra é, parece-me, uma outra forma de atrair visitantes ao blog, aproveitando a onda gigantesca de pesquisas. No caso dele, como no meu, agora, ao escrever este post ou quando escrevi este outro, mais obsceno, ou na experiência recente do Nuno Saraiva, usando a orientação sexual da Brandie Carlile como chamariz de visitas, percebe-se que há um critério simples, superficial e fácil de manipular no sistema: se usarmos frases, palavras ou expressões muito populares e, especialmente, se lhes dermos valor semântico (num título é melhor que no corpo do artigo) e as repetirmos em vários contextos (as tags e índices são óptimas estratégias), podemos trepar a escala da relevância com facilidade. Mas é fácil de perceber que esta estratégia se usada de forma “maliciosa” gera visitas “enganadas”, o que não contribui nem para a reputação nem para a relevância global do site em causa. O artigo mais popular desde blog, por exemplo, chama-se “Pornografia, ou a arte de ser explícito“, mas duvido seriamente que as intenções duma parte significativa dos visitantes fosse ler a minha reflexão acerca das práticas de distribuição de publicidade no site do Correio da Manhã.

Mas, se percebermos este primeiro princípio, percebemos, de facto, que o segredo da relevância— por isso, o segredo do PageRank ou o segredo do SEO – Search Engine Optimization— é escrever de forma organizada e sistemática, com cuidados ao nível da marcação semântica dos conteúdos. Ou seja, é preciso cuidar dos conteúdos e pensar, pesquisar e analisar quais os termos e expressões de pesquisa mais usados pelos internautas que fazem parte do nosso público-alvo. E isso é simples, certo?

Um blog, um portal generalista ou outras experiências cujo único objectivo seja gerar visitas, sem preocupações de fidelizar públicos-leitores, pode dar-se ao luxo de seguir a onda dos acontecimentos, alternando entre referências aos últimos gadgets (o iPhone e o iPod são boas opções), escândalos sexuais, económicos ou políticos, fait-divers de vários tipos, ou alimentar as eternas flamewars de sistemas operativos (Windows vs. Mac vs. Linux) ou consolas de jogos (Playstation vs. Xbox vs. Wii), por exemplo. Esse comportamento gera visitas e aumenta a relevância / PageRank artigo-a-artigo, mas a inconsistência dum site que segue simplesmente hypes sucessivos, sofre com isso. Porquê? Porque se fosse apenas um problema de quantidade de keywords, não se justificava a investigação, o segredo ou até o registo de patentes à volta do “coração” do Google. Por um lado, referências avulsas a termos “populares” não chegam para enganar o sistema, já que todo o conteúdo é visado e são cruzadas referências para perceber se o artigo é ou não “genuíno”. É também aí que entra a importância da construção de links para o conteúdo. O número de sites que refere o nosso conteúdo, através dum link, é mais um sistema de validação da relevância dos conteúdos. E isso também é fácil de perceber: se eu for uma “autoridade” numa determinada área é natural que muitos sites dedicados ao mesmo assunto, ou artigos avulsos, se refiram e liguem a mim. E essa é uma medida socialmente aceitável, mesmo no mundo real do ensino, por exemplo. (Uso o termo “autoridade”, numa piscadela de olho ao sistema de Authority que o Technorati usa). Cá está outro parâmetro base de relevância: links dirigidos aos nosso conteúdo “provam” que ele é relevante. (Claro que as “roletas” de troca de links sugeridas por alguns “especialistas” e que ligam ad nauseam sites igualmente irrelevantes são identificados pelo sistema e pelos utilizadores, também. Isso e outras práticas semelhantes a vudu.) ;)

Mas, além disso, se o PageRank de cada página dum mesmo site for alto, mas responder a termos de pesquisa demasiado diversificados, não é possível determinar a relevância global do site, porque não existe um contexto temático em que ele se encaixe. Os links podem ajudar, mas não resolvem o problema de base. Por isso é que se fala muito da necessidade de “especialização”. Há até quem sugira que a melhor forma de garantir uma grande visibilidade é encontrar um “nicho” e explorá-lo até ao tutano garantindo que, à medida que o interesse cresce (e o interesse sobre qualquer coisa na Internet cresce sempre, é um problema básico de entropia), nos mantemos no topo da vaga.

Este é o tipo de coisas que os especialistas de SEO – Search Engine Optimization vão dizendo e vendendo, mas se um projecto estiver limitado tematicamente (que é o caso de quase todos os sites de empresas e organizações), não faz sentido falar de determinado tipo de manipulação de conteúdos ou da auscultação constante dos hypes gerais. Para um site “normal”, com objectivos pré-determinados e um posicionamento marginal às modas e tendências da web, o trabalho é, paradoxalmente, muito mais simples. Como é óbvio que a relevância absoluta do site será sempre condicionada pela popularidade do tema— uma sex-shop on-line não tem que trabalhar quase nada para garantir valores altos de relevância, enquanto um clube de leitura ou uma carpintaria terão que se contentar com um tecto baixo definido pelos hábitos de utilização e pela baixa densidade do “meio” específico onde estão—, o trabalho deve concentrar-se apenas na apresentação fluída e bem estruturada dos conteúdos e na adequação da escrita ao meio e aos hábitos (percebidos) dos internautas. Não é pouco trabalho, mas é simples:

  • escrever bem, sem ser nem prolixo nem telegráfico
  • identificar as palavras, expressões e frases em uso no “meio” e usá-las em quantidade, mas com critério, um pouco por todo o site (uma boa forma de fazer isto é usar os simuladores do Google AdWords que, a partir de uma expressão, nos dão as alternativas mais procuradas)
  • perceber que ninguém lê tudo, pelo que o que nos pode parecer redundante quando estamos a criar e/ou a rever conteúdos, pode ser perfeitamente aceitável para leituras na diagonal
  • usar as palavras e frases chave em títulos e sub-títulos, correctamente marcados semanticamente (<h1>, <h2>, etc)
  • não substituir por imagens conteúdo fundamental, a não ser que se usem criteriosamente as possibilidades de legendagem (tags alt e title) e/ou se adoptem técnicas de Image Replacement inteligentes
  • procurar os melhores locais on-line para se ser referenciado e tentar perceber como é que isso é possível (publicidade, troca de links, simples contacto?)

Não é magia, nem milagre ou prática mística, mas funciona. Sendo assim, porque é que se continua a falar destas coisas e há uma tão grande procura por estes assuntos? Porque as pessoas, empresas e organizações são preguiçosas e querem, no fundo, no fundo, descobrir a cura milagrosa que ponha o seu site no top dos tops, sem terem o trabalho de criarem, sistematizarem e organizarem conteúdos. Para os “preguiçosos” que podem, existe o Google AdWords, que, para quem puder pagar, permite colocar links patrocinados nas primeiras páginas de todas as pesquisas. Para os outros, é trabalho simples. Mais ou menos trabalho, mas simples e relativamente transparente. E o resultado final não é o mesmo: com o trabalho feito, o site aparecerá por mérito próprio e sem custos. Pela via imediata, o site só vai aparecer enquanto pagarmos e a eficácia provavelmente decresce com o tempo (um link patrocinado que não chega pelo próprio mérito às páginas principais causa desconfiança nos utilizadores).

E, com este artigo escrito, revejo e posso prever que, com tantas referências a hypes, ao Google e ao PageRank, a estratégias de SEO, a gadgets e a outros termos de pesquisa populares, vou ter outro pico de visitas. Justifica-se?