Um dos temas que me “fascina”, ultimamente, é a questão da visibilidade dos sites na net (a popularidade e outras métricas possíveis), não só por poder ser uma área séria e fundamental de intervenção por parte de quem, como eu, assume a responsabilidade de pôr coisas on-line— o pior que me podia acontecer era despejar inadvertidamente demasiados conteúdos para a “invisible web“—, mas porque é um sector de actividade onde acontecem as coisas mais estapafúrdias e onde os personagens mais execráveis tentam lucrar com as incertezas, ignorâncias e desespero de empresas, criadores de conteúdos pouco experientes e demais “curiosos”. Mecanismos de “ranking” surgem um pouco por toda a parte mas, mais do que isso, promessas de “curas milagrosas”
para a pobre performance de qualquer site em motores de busca e afins, inundam a web, à caça dos incautos.
E a julgar pelo panorama, não devem ser poucos os incautos…
A mim o que me interessa é perceber os mecanismos de classificação usados pelos diversos rankings, os processos usados para recolher a informação estatística relevante, a definição dos universos (a amostra) e o cruzamento desses diversos componentes… quando consigo juntar dados e comparar fico sempre surpreso. Uma das coisas mais surpreendentes é a escassez de informação acerca de tantos mecanismos de classificação e a quase omnipresente distorção regional/local. Com quase todos os mecanismos a actuarem (naturalmente) à escala global, a verdade é que os esforços de aproximação a realidades regionais ou locais (ou até sectoriais) trazem-nos resultados surpreendentes.
Estou a preparar uma espécie de estudo comparativo para tentar perceber primeiro, para depois explicar, o funcionamento profundo de alguns destes mecanismos, como o Google PageRank, o Alexa Rank, a Authority do Technorati e, mais do que truques e dicas para lhes tentar dar a volta, interessa-me perceber a relevância de cada mecanismo, cruzando a atribuição de “relevância”, “autoridade” e “popularidade” com o número real de visitas, que contínua a ser apenas acessível através dos relatórios (logs) registados em cada servidor, ou por intermédio de tracking externo, como o Google Analytics.
Para terem uma ideia da “distorção” introduzida por estes sistemas, comparo este meu blog com o site do Visões Úteis:
ESTATÍSTICAS |
www.visoesuteis.pt |
joaomartins.entropiadesign.org |
Nº de visitas por mês: |
4.917 |
1.318 |
Nº de páginas visitadas: |
6.154 |
1.907 |
Profundidade das visitas (page hits/visits): |
1,25 |
1,45 |
RANKING |
|
|
Google PageRank |
4/10 |
3/10 |
Alexa Rank |
2.661.423 |
929.063 |
fontes:
www.visoesuteis.pt – log do servidor, interpretado por Webalizer, dados
de Abril de 2007.
joaomartins.entropiadesign.org – Google Analytics, dados de 15 de Abril
a 15 de Maio.
Para consultar rapidamente os rankings, tenho o SearchStatus, uma extensão do Firefox.
Se numa análise rápida vos escapar o “drama”, esclareço que, em termos de Alexa Rank, quanto menor, melhor… percebem?
É um exemplo muito básico e incipiente, mas assim se percebe bem a existência de duas realidades paralelas: os dados concretos de número de visitantes deviam ser um dado determinante, mas como esses dados não são públicos, os sistemas de ranking só podem usar uma de duas alternativas:
Avaliar o comportamento num sistema externo, como é com o Google PageRank.
OU
Usar uma amostra necessariamente distorcida de utilizadores que permitem que o seu tráfego seja monitorizado, como é no caso do Alexa Rank.
Que fiabilidade têm estes sistemas? A primeira hipótese, tratando-se de um sistema como o Google, permite uma visão não demasiado distorcida e, apresentada como aquilo que é— a relevância no âmbito do Google— não engana ninguém. Já a segunda hipótese é de loucos. Aceito a utilidade destes rankings para profissionais do comércio electrónico (o Alexa é um sistema da Amazon, para apoiar a construção do programa de afiliados), mas no global, não podemos confiar nos dados, como a minha experiência demonstra. E, pelo que tenho visto, a distorção aumenta com as especificidades regionais (qual o nível de utilização da Alexa Toolbar ou semelhante pelos internautas portugueses? não se sabe…).