Google, um ranking de probabilidades.

Estadão

15 Fevereiro 2010 | 21h07

Resolvi escrever este post depois de concluir um trabalho aqui no MBA sobre como funciona o modelo de rankeamento de páginas do Google (Alguns ainda acreditam em um modelo mais arcaico como o PomboRank). De forma geral as pessoas possuem uma vaga idéia, sabem do brilhantismo dos fundadores, mas nenhum detalhe adicional é comentado. Aqui vao alguns detalhes enriquecedores, vale a pena dar uma olhada na patente.

Basicamente o ranking do google oferece ao “surfista” da internet a possibilidade de encontrar primeiro a página que ele teria a maior probabilidade de encontrar após infinitas horas de navegaçao. Embora seja fácil de entender é bem difícil de calcular! O modelo matemático por detrás da ideia é conhecido como MARKOV CHAINS. Trata-se de uma matrix, chamada de matrix de transporte onde cada linha representa a probabilidade de ir de cada uma das webpages para uma outra webpage.

Muito fácil por enquanto, né? Pois bem, para chegar ao rankeamento algumas barreiras precisaram ser superadas, como por exemplo: o que fazer quando uma página nao tem nenhum link? Qual é a probabilidade de alguém chegar nela? Além disso, como fazer para calcular a probabilidade de milhoes de páginas? Bem, um pouco de pesquisa na internet pode providenciar detalhes técnicos sobre como fazer este novo mundo do Google possível.

Alguns dados curiosos. Em média uma webpage possui entre 7 e 10 links, existem mais de 7 bilhoes de links na internet, Cada vez que é calculado o ranking, chamado PageRank, demora dias de processamento com centenas de máquinas utilizadas. Páginas como portais possuem baixa relevância em virtude de alto número de links entrando e saindo.

Lembem-se que a internet 3.0 está a caminho e o que vemos hoje no Google será tao obsoleto quanto as pesquisas do ultrapassado Altavista (para os mais velhos). No futuro as probabilidades nao serao genéricas (para toda a web), mas serao probabilidades relacionadas a cada usuário, relacionadas ao real objetivo de busca, como se cada um tivesse uma internet própria e um buscador customizado para o que está acontencendo na vida dele naquele instante da busca. Fantástico.