¿Cómo funciona un motor de búsqueda?

Image related to code_review

Resumen

Básicamente, los motores de búsqueda (search engines, SE) son bases de datos gigantescas que contienen información sobre el contenido de los sitios web que integran la web.

El motor de búsqueda más popular, Google, contiene más de 30.000.000.000.000 sitios web. Cuando introduces una frase o palabra, el motor buscará en su base de datos y devolverá resultados en un orden que estará determinado por su propio algoritmo.

Así pues, ¿cómo consiguen al principio toda esa información?

Arañas (spiders)

Los motores de búsqueda emplean el uso de arañas para recopilar la información de los sitios web. Las arañas rastrean los sitios web recopilando datos y siguen los enlaces que hay en las páginas. Las arañas rastrean Internet casi continuamente, recolectando las páginas nuevas y actualizadas de la Web para mantener sus resultados al día.

Tratamiento de Datos

Los datos que las arañas extraen son tratados de forma diferente por los diversos motores de búsqueda. Los motores de búsqueda ponen el 'peso' en diferentes componentes de un sitio web y en cómo se integra en la Web. De esta manera determinan el orden en el que los sitios web deben aparecer en los resultados de una búsqueda (las páginas que contienen los resultados de la búsqueda son llamadas comúnmente SERPS- search engine result pages).

Entrando

La mayoría de los motores de búsqueda ponen al día sus bases de datos al menos una vez al mes con la información recopilada por sus arañas. Esto es importante saberlo cuando se tiene un sitio web relativamente nuevo - si pones tu sitio web por primera vez en la red al final de un 'rastreo' y las arañas no lo encuentran, tendrás que esperar hasta la actualización siguiente para entrar a formar parte de la base de datos. Una vez el sitio web entra la base de datos todavía llevará una o dos actualizaciones más antes de que el nuevo sitio web se estabilice en los resultados de las búsquedas.

Más FAQs

¿Que es el Cyberespacio? - Definición de Cyberespacio

Cyberespacio es un término acuñado por Guillermo Gibson en su novela Neuromancer, es el mundo digital construido por las... Continuar »

¿Qué significa VoIP? - Definición de VoIP

VoIP son las siglas de Voice over Internet Protocol (Voz sobre Protocolo de Internet o Telefonía IP), una categoría de... Continuar »

¿Qué significa optimizar un sitio web?

Entre los elementos que se deben considerar para la optimización están la accesibilidad, usabilidad, visibilidad por... Continuar »