¿Cómo funciona un motor de búsqueda?

Image related to code_review

Resumen

Básicamente, los motores de búsqueda (search engines, SE) son bases de datos gigantescas que contienen información sobre el contenido de los sitios web que integran la web.

El motor de búsqueda más popular, Google, contiene más de 30.000.000.000.000 sitios web. Cuando introduces una frase o palabra, el motor buscará en su base de datos y devolverá resultados en un orden que estará determinado por su propio algoritmo.

Así pues, ¿cómo consiguen al principio toda esa información?

Arañas (spiders)

Los motores de búsqueda emplean el uso de arañas para recopilar la información de los sitios web. Las arañas rastrean los sitios web recopilando datos y siguen los enlaces que hay en las páginas. Las arañas rastrean Internet casi continuamente, recolectando las páginas nuevas y actualizadas de la Web para mantener sus resultados al día.

Tratamiento de Datos

Los datos que las arañas extraen son tratados de forma diferente por los diversos motores de búsqueda. Los motores de búsqueda ponen el 'peso' en diferentes componentes de un sitio web y en cómo se integra en la Web. De esta manera determinan el orden en el que los sitios web deben aparecer en los resultados de una búsqueda (las páginas que contienen los resultados de la búsqueda son llamadas comúnmente SERPS- search engine result pages).

Entrando

La mayoría de los motores de búsqueda ponen al día sus bases de datos al menos una vez al mes con la información recopilada por sus arañas. Esto es importante saberlo cuando se tiene un sitio web relativamente nuevo - si pones tu sitio web por primera vez en la red al final de un 'rastreo' y las arañas no lo encuentran, tendrás que esperar hasta la actualización siguiente para entrar a formar parte de la base de datos. Una vez el sitio web entra la base de datos todavía llevará una o dos actualizaciones más antes de que el nuevo sitio web se estabilice en los resultados de las búsquedas.

Más FAQs

¿Qué es un PDA? - Definición de PDA

Un PDA (Personal Digital Assistant o Ayudante personal digital) es un dispositivo de pequeño tamaño que combina un ordenador,... Continuar »

Tengo un nuevo sitio web, ¿por qué no aparece en los motores de búsqueda todavía?

Los motores de búsqueda no saben automáticamente lo que hay en Internet . De forma simplificada, los motores de... Continuar »

¿Qué es un servidor? - Definición de servidor

En informática, un servidor es un tipo de software que realiza ciertas tareas en nombre de los usuarios. El término servidor... Continuar »