你现在要的不是“再学一遍SEO”,你要的是:别再被收录和排名折磨。文章发出去,像丢进黑洞——今天“已发现未编入索引”,明天“重复网页”,后天好不容易收了,核心词还是死在后排;更离谱的是,排名隔三差五抖一下,抖得你怀疑人生。
赚客出海做站这些年见过太多站长卡在这一步,问题不是“你不会优化”,而是你优化的顺序错了:一上来就合并压缩、上缓存、搞提速——听起来很努力,但索引池本身是脏的。URL 不统一、canonical 指错、sitemap 里塞满低价值页、robots/noindex 误伤主内容……你是在给蜘蛛发路标,但路标全是假的,它只能迷路。
SEO 代码优化,先解决“更清楚”,再解决“更快”。更清楚是什么?就是让搜索引擎一眼认出:这页是谁(规范URL/canonical)、该不该收(robots/noindex/sitemap)、重点在哪(H结构/语义/Schema)。这三件事不顺,你再快也白搭。
接下来会按实际排查顺序拆开:先体检找症状,再优先把索引相关的问题一次清掉,然后再做页面结构与展示的补强,最后才去稳体验分和 JS 渲染。每一段都给你怎么改 + 怎么验 + 翻车点,照着做就行。
本文目录
- 1 先对号入座:你现在卡在哪一种症状?
- 2 一、动代码前的 10 分钟体检:不体检就改 = 盲修
- 3 二、优先级 P0:索引与规范化(先保证“能收录且不乱收录”)
- 4 三、优先级 P1:Head 三要素(让相关性和点击率先起来)
- 5 四、优先级 P2:语义结构 + Schema(让蜘蛛读懂页面,让展示更像样)
- 6 五、图片 alt + 外链 rel:小细节,大流量(别写了等于没写)
- 7 六、优先级 P4:Core Web Vitals(把“合并压缩”升级成“指标→改法”)
- 8 七、优先级 P5:JS SEO 专项(现代站点最痛的坑)
- 9 八、行动清单:按这个顺序做,别瞎折腾
- 10 九、FAQ:SEO 代码优化高频问题
- 11 FAQPage
先对号入座:你现在卡在哪一种症状?
- 症状A:不收录/收录慢 —— 先查 canonical、robots、sitemap、重复 URL(别急着谈性能)
- 症状B:收录了但不排名 —— 先查 Title/Description、H 标签层级、语义结构、内链走向
- 症状C:排名波动大 —— 先查 Core Web Vitals + 重复索引 + 渲染差异
- 症状D:前端重/JS 多 —— 先查“原始 HTML 有没有正文”,再谈其它
先补一条“站长式证据动作”:我一般不会上来就全站大改,而是先抽 10 个核心 URL 做体检(首页/核心栏目/3篇文章/2个产品页/2个转化页),把 canonical、规范网址、是否被 robots/noindex 误伤、以及渲染后 DOM 是否有正文这几项跑一遍,再决定动哪块。你也照这个顺序来,最省命。
如果你连“蜘蛛到底来没来、抓了啥”都没证据,先别急着改一堆标签。建议先把抓取链路看清楚:网站日志分析工具与排查思路。很多“看起来像 SEO 的问题”,其实是抓取压根没跑通。
一、动代码前的 10 分钟体检:不体检就改 = 盲修
1)Search Console:先盯这 3 个地方
- 页面索引:重点看“已发现未编入索引 / 已抓取未编入索引 / 重复网页 / 规范网页”。
- 站点地图:提交是否成功?是否大量 URL 被忽略?
- 增强报告:结构化数据有没有报错(后面会讲 Breadcrumb/FAQPage)。
操作建议:先把“抽检样本”这 10 个 URL 的状态记下来(别靠记忆),你每次只改一类问题,然后回到这三块看变化。别一把梭全站大改,最后你都不知道“到底是哪一刀起了作用”。
2)抓取渲染:对比“原始 HTML vs 渲染后 DOM”
这一步专治“我明明写了很多内容,蜘蛛怎么像瞎了一样”。如果 View Source 里只有一个空壳 div,正文靠接口渲染——你再怎么折腾标题、H 标签,也像在空房子里贴对联。
- 原始 HTML 有正文 + 关键内链:更稳(蜘蛛一抓就能读)。
- 原始 HTML 没正文,渲染后才有:高风险(需要 SSR/预渲染/静态输出)。
3)Lighthouse/PSI:只盯 3 个指标(别被总分带偏)
- LCP:首屏最大内容出现时间(通常是首屏图/首屏大区块)。
- INP:交互响应(脚本重、主线程堵,就会炸)。
- CLS:布局抖动(图片没尺寸、字体策略不对、广告位没占位)。
二、优先级 P0:索引与规范化(先保证“能收录且不乱收录”)
2.1 canonical 标签怎么写才不翻车?
一句话记住:canonical 是“我希望被当作主版本的 URL”。它不是装饰品,更不是“全站统一指首页”。
标准写法示例:
<link rel="canonical" href="https://example.com/your-page/" />
- 文章/产品详情页:canonical 指向自身的规范 URL(协议/域名/尾斜杠统一)。
- 分页页(/page/2/3):建议“各页自指 + 有清晰分页链接”,别一刀切全指第 1 页。
- 参数筛选页(?color=xx):多数内容站建议不索引(noindex),或 canonical 回主列表页(除非你明确要做筛选长尾)。
怎么验:看页面源代码是否输出正确 canonical;再去 Search Console 的 URL 检查,看“规范网址”是不是你想要的版本。你如果还没统一 HTTPS,先把这两篇补上:HTTP 和 HTTPS 的区别、HTTPS 设置与常见坑。
2.2 robots.txt:别把自己站“关门谢客”
robots.txt 是“进门告示”,不是“封城令”。最常见的低级错误就是把 CSS/JS 一起挡了,蜘蛛渲染不了页面,移动端友好度直接红一片。
User-agent: *
Disallow: /wp-admin/
Disallow: /?s=
Disallow: /search/
Allow: /wp-admin/admin-ajax.php
Sitemap: https://example.com/sitemap.xml
想把 robots 写明白、写稳,不走弯路的话,直接看这篇:robots 协议是什么?怎么写才不误伤。
2.3 meta robots:哪些页面必须 noindex?
robots.txt 是“别抓”,noindex 是“别收”。站内搜索页/过滤页/登录页这类低价值页面,放进索引池就是在消耗抓取预算,还制造重复内容。
<meta name="robots" content="noindex,follow" />
- 建议 noindex:站内搜索结果页、登录/注册页、购物车/结算页(按站型)。
- 慎重处理:参数筛选页(除非你明确要做筛选长尾)。
- 分页页:不要一刀切 noindex,关键是别让分页变成“薄内容重复页”。
怎么验:URL 检查 → 看索引状态;抓取测试 → 确认 meta robots 输出正确。
2.4 URL 统一 + 状态码:不统一就是自己制造重复网页
- http → https 全站 301(SSL 没装好先去:SSL 免费证书申请与续期)
- www/非 www 二选一,全站 301
- 尾斜杠统一(/post/ vs /post)
- 大小写统一(/Post/ vs /post/)
状态码这块别靠感觉,建议对照这篇查:HTTP 状态码大全(301/302/404/410/5xx)。尤其是“该 410 的你还 404”“该 301 的你用 302”,会让收录节奏很难看。
2.5 sitemap.xml:网站地图不是垃圾桶
很多站长把 sitemap 当“我所有 URL 的大合集”,结果里面塞满分页、参数页、404,搜索引擎直接忽略,等于白提交。正确思路是:sitemap 只放你最希望被搜到的“干货”。
- 必须进:原创文章页、核心栏目页、产品详情页(无重复、能正常访问)。
- 谨慎进:标签页/作者页(有运营价值才放,空壳就踢掉)。
- 不建议进:站内搜索页、低价值参数页、第 2+ 分页页。
怎么验:Search Console → 站点地图 → 状态“成功”,再点进去看“已提交 vs 已编入索引”的差值是否离谱。你要做更系统的内链和结构梳理,也可以顺手看:网站内链怎么做。
三、优先级 P1:Head 三要素(让相关性和点击率先起来)
3.1 Title:按页面类型拆模板(别全站一个模板)
最省事的写法就是“填空题”:主关键词 + 场景/结果 + 差异点(2026/清单/避坑/可验证)。
- 首页:品牌/业务 + 价值点(短、清楚)。
- 列表页:分类名 + 意图词(教程/避坑/清单)。
- 文章页:文章标题 + 品牌词(必要时加年份/版本)。
- 产品页:核心卖点 + 规格/型号(别写空)。
3.2 Description:别堆关键词,写“承诺”
推荐公式:痛点 + 方法 + 结果 + 适用对象。你写的是“我能帮你解决什么”,而不是“我能塞多少关键词”。
3.3 meta keywords:放到“可选项/误区”
别把精力砸在 keywords 上。把时间花在索引治理(canonical/robots/sitemap)+ 结构化数据 + 体验指标,性价比更高。
四、优先级 P2:语义结构 + Schema(让蜘蛛读懂页面,让展示更像样)
4.1 H1/H2/H3:像目录,不像“关键词加粗器”
- 一个页面一个 H1(通常就是主标题)。
- H2 做章节,H3 做场景/步骤/对比。
- 别跳级、别为了塞词乱套结构。
4.2 HTML5 语义标签:用对地方才有效
- <main>:主内容区(正文核心)。
- <article>:独立内容实体(文章/产品详情)。
- <aside>:辅助信息(目录/作者卡/推荐)。
4.3 Breadcrumb(BreadcrumbList):面包屑不只是“给人看”
只要你有清晰层级(首页→栏目→详情),面包屑就是“结构证据”。而且它和内链是天然搭档:面包屑做对了,蜘蛛更容易沿着路径爬。
面包屑怎么做更稳、更适配内容站结构,参考这篇:面包屑导航怎么做(含适用场景)。
怎么验:富媒体测试工具 + Search Console 增强报告(看错误是否收敛)。
4.4 FAQPage:能上,但别硬造“SEO 味问答”
- 前提:页面里确实有问答区块(不是为了 Schema 临时拼的)。
- 写法:短问短答,问题来自真实搜索意图(分页/noindex/参数页)。
- 数量:宁可 5 个高质量,也别 20 个水问答。
怎么验:同样用富媒体测试工具 + 增强报告。
五、图片 alt + 外链 rel:小细节,大流量(别写了等于没写)
5.1 图片 alt:按“描述 + 场景”写(别堆词)
模板:这是什么 + 场景/用途(必要时自然带 1 个关键词)。
- 别写:alt="seo 代码优化 seo 代码优化"
- 可写:alt="Search Console 页面索引报告示例(已发现未编入索引)"
5.2 CLS 的一半问题,都来自“图片没尺寸/广告没占位”
- 图片写 width/height 或用比例盒。
- 首屏图别乱懒加载(首屏越懒,LCP 越慢)。
- 广告位提前留坑,不然 CLS 直接起飞。
5.3 外链 rel:nofollow / sponsored / ugc 怎么选
<a href="https://example.com" target="_blank" rel="nofollow sponsored noopener">工具官网</a>
联盟/推广性质链接建议用 sponsored;用户评论区链接用 ugc。内部链接不用 nofollow(你自己的网站别自己拆权重)。
六、优先级 P4:Core Web Vitals(把“合并压缩”升级成“指标→改法”)
6.1 LCP:从首屏最大内容下手(别先去折腾小图标)
- 首屏图:WebP/AVIF + 控尺寸(别 4000px 还当 Banner)。
- 关键 CSS:减少阻塞(首屏先渲出来再说)。
- TTFB:缓存/CDN/回源(别把锅全甩给前端)。
如果你是“HTTPS 后变慢”“海外访问慢”,LCP 往往一起被拖下水,这篇可以配套:HTTPS 网站打开慢怎么提速。
6.2 INP:别让脚本霸占主线程
- 能砍的第三方脚本先砍(统计/弹窗/花里胡哨特效)。
- 非关键脚本用 defer/async(按场景用,别乱套)。
- 重交互组件拆小,避免一次性大计算。
6.3 CLS:占位、占位、还是占位
- 图片必须占位(width/height)。
- 字体策略合理设置(font-display)。
- 广告/推荐模块固定高度,不要“蹦出来把正文推走”。
七、优先级 P5:JS SEO 专项(现代站点最痛的坑)
坑 1:正文靠接口渲染,原始 HTML 没内容
- 解决路线:SSR / 预渲染 / 静态化(按成本从低到高选)。
- 怎么验:抓取测试看“原始 HTML 是否含正文与关键内链”。
坑 2:无限滚动/懒加载,重要内容和链接抓不到
- 解决路线:提供可抓取分页 URL;关键内容别只存在滚动后。
- 怎么验:渲染后 DOM 里是否有下一页链接与正文区块。
坑 3:路由切换了,title/canonical 没同步
- 解决路线:每个路由独立输出 title/description/canonical。
- 怎么验:抽样多路由看源码 Head 输出是否不同且正确。
你如果用静态站/框架站上线,这类问题更容易踩,可以顺手看看这篇:HTML 静态网站部署全攻略。
八、行动清单:按这个顺序做,别瞎折腾
第 1 轮:30 分钟先止血(收录与索引)
- URL 统一(https、www、尾斜杠、大小写)。
- canonical 抽查(尤其分页/参数页)。
- 站内搜索页/低价值参数页 noindex。
- sitemap 清掉低价值 URL,保证 200 + 规范页。
第 2 轮:1 小时提相关(结构与可读)
- Title/Description 拆模板,杜绝全站重复。
- H 结构像目录一样分层(一个 H1)。
- 主内容区语义清晰(main/article)。
- 面包屑 + 内链模块跑通(读者能跳,蜘蛛也能爬)。
第 3 轮:2 小时稳体验(CWV)
- LCP:首屏图 + 关键 CSS + TTFB。
- INP:脚本减负 + 延迟非关键脚本。
- CLS:图片/广告占位 + 字体策略。
最后提醒一句:动代码之前,先把“能回滚”准备好,别把站改崩了还没备份。数据库备份这块可以照这篇做:数据库备份方式有哪些。
九、FAQ:SEO 代码优化高频问题
1)只做合并压缩/GZIP,排名会提升吗?
它属于“体验分基础项”,能加分但很难解决“不收录/不排名”的根因。先把 canonical/robots/sitemap/URL 统一干净,再用 CWV 把排名稳住。
2)分页页要不要 noindex?
别一刀切。分页承载真实内容与内链入口时,通常不建议全 noindex。关键是避免分页变成“薄内容重复页”,同时保证分页链接可抓取。
3)参数筛选页要不要收录?
除非你明确要做“筛选长尾流量”,否则优先 noindex 或 canonical 回主列表页,避免索引池膨胀。
4)meta keywords 还重要吗?
可选项。把精力放在索引治理、结构化数据、CWV 指标上更划算。
5)怎么确认搜索引擎真的“看到了正文”?
抓取测试对比“原始 HTML”和“渲染后 DOM”。原始 HTML 没正文、全靠 JS 渲染的页面,最容易出现收录慢或理解偏差。
FAQPage
最后一句:别再把“SEO 代码优化”当成堆技巧——按 P0 → P1 → P4/P5 的顺序做,先把索引池洗干净,再谈排名与体验。你今天就从“抽检 10 个核心页面”开始,别拖。
发表评论