Glosario · Glosario
Rastreo
El rastreo es el proceso por el que los sistemas de búsqueda solicitan páginas, descubren enlaces e inspeccionan contenido.
Durante el rastreo, un crawler visita URLs, descarga recursos permitidos y extrae enlaces para descubrir más contenido. Es la entrada técnica al resto del sistema de búsqueda.
Por qué importa
El rastreo determina qué contenido puede ser evaluado. Una arquitectura con enlaces claros, respuestas rápidas y pocas URLs inútiles permite que las páginas importantes reciban atención.
Diferencia con conceptos cercanos
Rastreo es la solicitud de la página; indexación es decidir si se guarda para resultados; ranking es decidir cuándo y dónde aparece.
Ejemplo
Un crawler entra por la home, sigue un enlace a /glossary/seo/, encuentra enlaces a términos relacionados y añade esas URLs a su cola.
Cómo lo usan los equipos
Los equipos observan rutas de enlace, códigos de estado, logs y presupuesto de rastreo para detectar páginas aisladas, bucles de filtros o contenido importante demasiado profundo.
Malentendido común
Más URLs no significan mejor rastreo. Muchas URLs duplicadas o filtradas pueden distraer al crawler de las páginas que realmente importan.
Leer despues
Usa estas rutas para pasar de la definicion a conceptos cercanos, grupos tematicos y guias.