Web Ranking?

Um dos temas que me “fascina”, ultimamente, é a questão da visibilidade dos sites na net (a popularidade e outras métricas possíveis), não só por poder ser uma área séria e fundamental de intervenção por parte de quem, como eu, assume a responsabilidade de pôr coisas on-line— o pior que me podia acontecer era despejar inadvertidamente demasiados conteúdos para a “invisible web“—, mas porque é um sector de actividade onde acontecem as coisas mais estapafúrdias e onde os personagens mais execráveis tentam lucrar com as incertezas, ignorâncias e desespero de empresas, criadores de conteúdos pouco experientes e demais “curiosos”. Mecanismos de “ranking” surgem um pouco por toda a parte mas, mais do que isso, promessas de “curas milagrosas”
para a pobre performance de qualquer site em motores de busca e afins, inundam a web, à caça dos incautos.
E a julgar pelo panorama, não devem ser poucos os incautos…

A mim o que me interessa é perceber os mecanismos de classificação usados pelos diversos rankings, os processos usados para recolher a informação estatística relevante, a definição dos universos (a amostra) e o cruzamento desses diversos componentes… quando consigo juntar dados e comparar fico sempre surpreso. Uma das coisas mais surpreendentes é a escassez de informação acerca de tantos mecanismos de classificação e a quase omnipresente distorção regional/local. Com quase todos os mecanismos a actuarem (naturalmente) à escala global, a verdade é que os esforços de aproximação a realidades regionais ou locais (ou até sectoriais) trazem-nos resultados surpreendentes.

Estou a preparar uma espécie de estudo comparativo para tentar perceber primeiro, para depois explicar, o funcionamento profundo de alguns destes mecanismos, como o Google PageRank, o Alexa Rank, a Authority do Technorati e, mais do que truques e dicas para lhes tentar dar a volta, interessa-me perceber a relevância de cada mecanismo, cruzando a atribuição de “relevância”, “autoridade” e “popularidade” com o número real de visitas, que contínua a ser apenas acessível através dos relatórios (logs) registados em cada servidor, ou por intermédio de tracking externo, como o Google Analytics.

Para terem uma ideia da “distorção” introduzida por estes sistemas, comparo este meu blog com o site do Visões Úteis:

ESTATÍSTICAS www.visoesuteis.pt joaomartins.entropiadesign.org
Nº de visitas por mês: 4.917 1.318
Nº de páginas visitadas: 6.154 1.907
Profundidade das visitas (page hits/visits): 1,25 1,45
RANKING
Google PageRank 4/10 3/10
Alexa Rank 2.661.423 929.063

fontes:
www.visoesuteis.pt – log do servidor, interpretado por Webalizer, dados
de Abril de 2007.
joaomartins.entropiadesign.org – Google Analytics, dados de 15 de Abril
a 15 de Maio.
Para consultar rapidamente os rankings, tenho o SearchStatus, uma extensão do Firefox.

Se numa análise rápida vos escapar o “drama”, esclareço que, em termos de Alexa Rank, quanto menor, melhor… percebem?

É um exemplo muito básico e incipiente, mas assim se percebe bem a existência de duas realidades paralelas: os dados concretos de número de visitantes deviam ser um dado determinante, mas como esses dados não são públicos, os sistemas de ranking só podem usar uma de duas alternativas:
Avaliar o comportamento num sistema externo, como é com o Google PageRank.
OU
Usar uma amostra necessariamente distorcida de utilizadores que permitem que o seu tráfego seja monitorizado, como é no caso do Alexa Rank.

Que fiabilidade têm estes sistemas? A primeira hipótese, tratando-se de um sistema como o Google, permite uma visão não demasiado distorcida e, apresentada como aquilo que é— a relevância no âmbito do Google— não engana ninguém. Já a segunda hipótese é de loucos. Aceito a utilidade destes rankings para profissionais do comércio electrónico (o Alexa é um sistema da Amazon, para apoiar a construção do programa de afiliados), mas no global, não podemos confiar nos dados, como a minha experiência demonstra. E, pelo que tenho visto, a distorção aumenta com as especificidades regionais (qual o nível de utilização da Alexa Toolbar ou semelhante pelos internautas portugueses? não se sabe…).

2 pensamentos em “Web Ranking?

  1. Olá,

    As tuas questões são pertinentes, efectivamente em que dados devemos nos fiar.
    Como toda a gente conhece, os algoritmos do Google são guardados a sete chaves, isso para quê? Para que o “PageRank” faça algum sentido, caso contrário toda a gente saberia como enganar o algoritmo de forma a obter um “PageRank” elevado.

    O Google utiliza parâmetros tais como a quantidade de links externos que apontam para o site assim como o “PageRank” de cada link, a quantidade de links internos, pois o Google não dá um “PageRank” à totalidade do site mas sim a uma página, assim sendo, a página Home pode ter um “PageRank” de 3 e a página “Serviços” pode ter um “PageRank” de 4. O Google tem ainda em conta quantidade e qualidade do conteúdo que uma página tem e a forma como um site foi construido, todos estes elementos são variáveis que vão fazer com um site tenha um bom ou mau “PageRank”.

    Quanto ao Alexa… infelizmente não conheço muito bem quais os parâmetros para a indexação e o “PageRank” de uma página, no entanto é certo que eles são diferentes, da mesma forma que o algoritmo para o Yahoo ou o MSN são diferentes.

    No fundo o que importa é como é que um site é posicionado nos motores de pesquisa mais importantes, a saber o GOOGLE, o YAHOO, o MSN, o ASK e o AOL.

    O link abaixo tem um pequena esquema de como os sites são indexados e obtêm o “PageRank”
    http://www.howstuffworks.com/search-engine1.htm

  2. “Thank you for any other informative site. Where else could I am getting that kind of
    info written in such a perfect approach? I’ve a undertaking that I’m just
    now running on, and I have been on the glance out for such
    information.”

Deixar uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Pode usar estas etiquetas HTML e atributos: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>