Cursos de matematicas en linea

PageRank y las Cadenas de Markov

Cuando realizamos una búsqueda en Google sobre una cierta temática, lo normal es que obtengamos miles o incluso millones de resultados, los cuales si no estuvieran bien organizados, serían una locura a la hora de seleccionar las webs más interesantes.

Para ello nació el algoritmo de PageRank, que fue creado por Google, y que sirve para otorgar un valor numérico a cada página web y a partir de él, establecer el orden en el que aparecen tras una búsqueda.

Este algoritmo, utiliza una potente herramienta matemática denominada Cadenas de Markov, y cuya descripción puede resultar bastante intuitiva.

Andrei Markov

Andrei Markov

Las Cadenas de Markov son un proceso estocástico, que se aplica cuando existe una concatenación de sucesos, y la probabilidad de cada uno de esos sucesos depende de la probabilidad del evento inmediatamente anterior. Por eso decimos que es una cadena, porque todas esas probabilidades están unidas en cierto modo.

Estas cadenas, se pueden mostrar como grafos orientados (es decir, que es importante tomar un punto de partida y otro de llegada en cada arista). En el caso de PageRank, cada web que pertenece a los criterios de una búsqueda serían los vértices, y las aristas que los unen, serían los links o enlaces que hay en el vértice de salida y que acabarían en el de llegada.
Simplificando, si desde matematicasdigitales.com/ tenemos un link que enlaza con el blog de mi amiga Ana rcomiendotapas.wordpress.com, ambas webs serían vértices del grafo y el link que hay en nuestra web la arista. De hecho, la arista sería orientada, ya que mi web apunta a la de Ana.
Entonces, simplificando mucho, PageRank toma como web más influyente aquella que tiene más aristas de llegada (si la gente la recomienda es porque es influyente en esa temática).
Pero no todos esos enlaces valen igual. Para el algoritmo, el link de una web importante vale más que el de una web poco conocida.
Por lo tanto, la primera del ranking no tiene por qué ser la que tiene más recomendaciones, sino la que tiene las mejores recomendaciones.

Realizando los cálculos arriba descritos, y aplicando un algoritmo en que se le otorgan coeficientes respecto la “calidad” del enlace, obtenemos un resultado. No vamos a entrar en la descripción rigurosa de esos cálculos, dado que su dificultad no es la temática de este blog.

Grafo orientado

Grafo orientado, con sus respectivas probabilidades

A ese valor, se le aplica un cambio de variable mediante escala logarítmica, para que el resultado final sea un valor comprendido entre 0 y 10.

Para conocer el PageRank de tu web, es tan fácil como utilizar alguna de las múltiples herramientas que se pueden encontrar en internet, pero hemos visto que ese resultado que se muestra tiene un importante desarrollo matemático detrás.

@JcVirin

One Response

  1. Alberto 23 marzo, 2013

Add Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies