谷歌文档又加了Markdown文件
行业新闻

谷歌llms.txt事件辟谣

最近,X上面有人发现谷歌官方文档里悄悄出现了llms.txt文件和Markdown下载选项,一时间AI搜索排名新信号的内容频出,为了清晰了解整件事的来龙去脉,小魏博客把事情的起因、反转告诉给大家:

事情的经过与时间线

第一次:谷歌自家网站悄悄挂上了llms.txt

谷歌自家网站悄悄挂上了llms.txt

很多SEO人员表示:“连谷歌自己都用llms.txt了!这一定是未来的搜索排名新信号/AI 搜索优化(GEO)的刚需!”

谷歌Search团队紧急辟谣

John Mueller很快在公开场合Bluesky表示

这不是官方背书: 谷歌Search团队根本不使用、也不承认llms.txt作为搜索和排名的信号。

这只是因为谷歌内部某些团队使用的网站内容管理系统(CMS)更新了自动生成该文件的功能,部分技术团队“顺手留着”或者“懒得删”罢了。

甚至,负责搜索文档的团队在发现后,第一时间就把自己网页底下的llms.txt给删除了。

llms.txt文件删除

第二次疑惑:谷歌文档又加了Markdown文件

就在最近,大家发现谷歌的Search开发者帮助文档里,每个页面的下拉菜单中都提供了一个直接下载 .md.txt(Markdown 格式)文件的选项。

谷歌文档又加了Markdown文件

SEO专家Lily Ray在Bluesky上公开对@John Mueller提问:为什么谷歌既然口口声声说搜索用不上这些,自己却在文档里又是搞llms.txt又是搞Markdown下载?

谷歌搜索团队的John Mueller在Bluesky上明确表示

“目前没有任何AI系统(指谷歌搜索)在使用llms.txt。” —— John Mueller

他甚至把llms.txt比作十几年前就被淘汰的 “Keywords Meta Tag”。

John Mueller提出了一个非常经典的框架:发现 (Discovery) vs 功能性 (Functionality)。

•发现 (SEO): 让搜索引擎找到你。

•功能性 (用户体验): 帮助用户完成任务。

谷歌加Markdown纯粹是为了功能性。

现在的程序员都在用Cursor或GitHub Copilot。这些AI助手读取复杂的HTML会产生大量“噪音”(广告、侧边栏、脚本),消耗Token且容易出错。

Markdown的优势

•零噪音: 纯净的结构化文本。

•极速解析: AI助手能以100%的准确率瞬间读懂API规范。

•离线友好: 方便开发者导入Obsidian或Notion建立个人知识库。

为什么谷歌不买账llms.txt?

1.信任危机: 谷歌从不信任站长自己写的“摘要”。如果llms.txt能决定排名,黑帽SEO会瞬间让它充满垃圾信息。

2.渲染能力: 谷歌拥有全球最强的渲染引擎。它看你的HTML网页就像真人一样,根本不需要你喂它吃“面包屑”。

3.数据证伪: 根据OtterlyAI的日志分析,AI爬虫访问llms.txt的比例仅为 0.1%。它在服务器里冷清得像个被遗忘的角落。

GEO(生成式引擎优化)的崛起

虽然谷歌不看llms.txt,但Perplexity、ChatGPT 和Claude却非常喜欢它。

这就是我们常说的GEO (Generative Engine Optimization)。

为什么其他AI搜索引擎需要它?

与谷歌的“异步搜索”不同,AI搜索往往是“实时抓取”。

1.节省算力: HTML源码可能100KB,而Markdown只有 5KB。对AI来说,这就是省钱。

2.精准引用: 因为Markdown结构清晰,AI能轻松定位段落,并把你的链接作为 Citations(引用)挂出来。

如果你运营的是技术博客或开源项目,提供Markdown通道能显著提升你在AI搜索中的曝光率。

SEO人员该怎么看待这件事?

不要把llms.txt误神话为“AI 时代的排名作弊器”,但也绝不要听信“它完全没用”的极端言论。

了解清楚三件事

这不是Google的排名信号

谷歌搜索(包括 AI Overviews)明确表示不用它,因为谷歌底层的网页渲染能力太强了。

但是,在Google Chrome团队最新推出的 Lighthouse 13.3 版本中,已经悄悄上线了“智能体浏览器就绪度(Agentic Browsing Readiness)”的实验性审查,专门检查网站是否有llms.txt。

这说明谷歌内部不同团队对它的定位是:它不是为了SEO排名,而是为了未来“AI 智能体(Agents)”能像人类一样顺畅地逛你的网站。

AI搜索时代的流量逻辑变了

传统的SEO是B2H(Business to Human),你做网站是给人类看的。现在的趋势正在向 B2A(Business to AI/Agent) 演进。

Perplexity、ChatGPT Search在回答实时问题时,依然在拼命抓取、清洗网页。

Markdown格式提供一个机器极其好读的接口,能显著降低AI系统的抓取成本和延迟(Latency)。

“网站的功能性”正在变成SEO的“隐形翅膀”

正如John Mueller所说,提供Markdown文件是为了提升使用AI工具(如 Cursor 编程、Obsidian 笔记)的用户的体验。

这些用户在被你的Markdown喂饱后,会产生大量的站外品牌提及、社交媒体讨论(Co-citation),而这些全网的“共识信号”,恰恰是 Perplexity、ChatGPT 以及Google评估你品牌权威度(E-E-A-T)的核心依据。

2026年站长的最佳落地实践

1.部署 llms.txt

既然成本极低,那就做一个。

策略: 在网站根目录下建立一个文件llms.txt。

原理精简、有主见(Editorial Choice)。不要把全站成千上万个页面都塞进去,AI 会迷失。只挑出 20-50 个最核心的 canonical 页面(如:核心产品页、价格页、最能代表你专业度的行业深度评测/指南、FAQ 汇总页)。

格式规范(严格按照 Markdown):
Markdown
# 你的品牌/网站名称(拒绝广告词)
> 用 2-3 句话简明扼要地介绍你的业务和核心优势(让 AI 智能体一秒读懂你是谁)。
## 核心服务与产品
- [网站页面布局](https://blog.topsucai.com/wang-zhan-ye-mian-bu-ju/): 网站页面布局:兼顾SEO优化与用户体验的布局指南。
- [SEO URL](https://blog.topsucai.com/seo-url/): 2026年SEO URL规范设计完全指南。

目的: 给那些开源AI Agents抓取。

2.采用BLUF架构

这是在ChatGPT搜索里刷引用率最有效的”手段”。

操作: 在每一篇 SEO 文章的 H1 标题下方,或者核心 H2 标题(最好是问题格式,如“XX平台的动态风控机制是什么?”)的正下方,用 50-80 个字的大白话、加粗直接给出核心答案

原理: AI爬虫在急迫抓取时,会优先提取这段话作为回答摘要。

3.堆砌Schema JSON-LD

AI引擎不信任你的Markdown,但它们100%信任结构化数据代码。

重点: 部署FAQPage、Product 和 Article 标签。这才是机器最爱的“标准语言”。但不要制造垃圾内容。

4. 用“独家数据”建立壁垒

AI讨厌千篇一律的通稿,内容要具体,不要太范

操作: 少说“速度很快”,多说“经实测延迟为 140ms”。

效果: AI为了证明自己的权威性,会本能地引用带有具体数据和案例研究 (Case Studies) 的网站。

5.调整你的 SEO 关键绩效指标(KPIs)

别再只盯着 Google Search Console 的点击量了。在日常周报/月报中,开始关注并记录:

AI 推荐流量: 监控来自 utm_source=chatgpt.com 以及 perplexity.ai 的引流和辅助转化率(Assisted Conversions)。

手动埋点测试: 挑出你核心出单的 5 个长尾问题,每周在 ChatGPT Search 和 Perplexity 上搜一次,看看自己的品牌是否在 AI 吐出的“引用蓝色小标”里。如果在,记录下被引用的页面结构是怎样的。

总结

维度传统 Google SEOAI 搜索 (GEO)
核心文件robots.txt / sitemap.xmlllms.txt / Markdown
关键技术Schema JSON-LDBLUF (结论先行) 架构
内容偏好E-E-A-T (权威性)独家数据 & 机器可读性
最终目标关键词排名第一成为 AI 回答的首选引用源

继续用规范的HTML拿谷歌流量;顺便做个llms.txt给AI智能体抓取。

小魏博客
我的简称叫做小魏,从2013年开始从事SEO工作至今13年时间,成长轨迹从文章编辑➞发外链➞友链交换➞SEO人员➞SEO主管➞运营主管。 都有哪些技能? 百度SEO做了11年(中间当了一年半的运营主管+品牌宣传维护),谷歌seo做了两年,GEO优化一年多,自学网站建设(主要是织梦+帝国+WordPress+易优cms这些CMS),懂些前端的Html+CSS+JS,火车头数据采集,PS软件,剪辑软件等,可谓是五花八门,主要擅长还是SEO优化。

谷歌下线FAQ富媒体

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注