术语 · 术语

爬取

抓取是搜索系统请求页面、读取内容、发现链接并继续探索网站的过程。

更新 2026年6月3日 审阅 2026年6月3日 zh-cn

爬取让搜索系统知道网页存在。爬虫从已知 URL、内部链接、sitemap 或历史记录出发,请求页面、解析链接,并可能稍后再次抓取。

为什么重要

如果重要页面从未被爬取,它成为搜索结果或 AI 搜索支持来源的机会会很弱。爬取也是诊断发布路径是否断裂的第一步。

和相邻概念的区别

可爬取性是条件,爬取是动作,索引是后续存储和组织。排名又是另一个阶段。

示例

Glossary index
  -> /glossary/crawling/
       -> /glossary/crawlability/
       -> /glossary/indexing/

团队如何使用

团队通过清晰内部链接、有效 sitemap、稳定 URL、干净 redirect 和成功响应来支持爬取。

常见误解

被爬取不代表被索引、排名或引用。搜索系统仍会评估质量、重复、canonical 和页面指令。

继续阅读

从这个定义进入相邻概念、主题分组和下一步阅读路径。