Glosario a
ARAÑA WEB
Es un programa que inspecciona las páginas de la web de manera mecánica. Uno de los usos más frecuentes que se les da consiste en crear una copia de todas las páginas web visitadas para su procesado posterior por un motor de búsqueda que indexa páginas proporcionando un sistema de búsqueda rápido. La operación más común es darle al programa un grupo de direcciones iniciales que la araña descarga para analizar las páginas y buscar enlaces a otras nuevas; a continuación, descarga las páginas nuevas, analiza sus enlaces y así sucesivamente. Las arañas web empiezan visitando una lista de URLs, y siguen identificando los hipervínculos y los añadiéndolos a dicha lista para visitarlos de acuerdo con un conjunto de reglas. El trabajo más común de ellas es:
- Crear el índice de una máquina de búsqueda.
- Analizar los enlaces de un sitio para hallar links rotos.
- Recoger información de un cierto tipo.