Promocion de paginas web PromocionarWeb.com

Promocion de paginas web en internet

Arquitectura de Google

Publicado: 09 de Marzo de 2004

Google es más duro de lo que parece

Nelson Minar, ingeniero de Google, participó el pasado miércoles 11 de febrero en la Conferencia Emerging Technology, organizada por la prestigiosa editorial O'Reilly.

Entre los puntos que se trataron en la conferencia caben destacar:

· Google indexa más de 3 mil millones de páginas web, aunque ofrecen más resultados gracias a los 'rastreos profundos'.

· Hay varios 'rastreadores': el general (una vez al mes), que busca en la mayoría de la WWW; el 'Fresh', que rastrea en las páginas que se actualizan frecuentemente; y el de noticias, que rastrea cada 10 minutos.

· El servidor web que utilizan es uno personalizado, llamado 'Google Web Server - GWS' [se sospecha que se trata del servidor Apache modificado]. Actualmente existe la versión 2.1.

· Google analiza más de 100 factores para determinar la relevancia de una página web. Entre ellos, destacan el texto del enlace (el 'anchor text'), el tamaño de la fuente y la proximidad.

· Para calcular el valor del PageRank , Google utiliza la teoría de grafos, mediante una matriz de 30 billones de nodos. Cada uno de estos nodos tiene 10 arcos (o aristas) diferentes.

· Hay 4 tipos de servidores en el clúster de Google, situados en paralelo del servidor web:

   1. Los servidores índice: están divididos en fragmentos (por ejemplo, uno apunta a todo lo que comienza con la letra 'a'), y devuelve al servidor web una lista con las id's de documentos donde aparece una determinada palabra.

   2. Los servidores de documentos: contienen las copias caché de las páginas web que se rastrean.

   3. Los servidores correctores de deletreo: son los que nos muestran el mensaje "Quiso decir: ...".

   4. Los servidores AdWords : nos muestran los enlaces patrocinados.

Noticia obtenida de google.dirson.com

Si quieres saber algo más sobre la arquitectura de Google, puedes consultar este documento PDF: "The Google Cluster Architecture".

 


Mapa del sitio | Contactar | ©2004 PromocionarWeb.com