一站式网站建设专家

十五年定制化网站建设经验.我们只做有价值的网站

互联网经验

15+

服务客户

2600+

专业团队

30+

网站搬迁全过程以及搬迁常见问题【详细】

发布时间:2018-03-08 14:24 发布作者:admin 阅读:79

 网站搬迁过程

  网站搬迁过程可以分为六个主要的基本阶段。它们都同样重要,跳过下面的任务可能会阻碍移民在不同程度上的成功。

 阶段1:范围和计划

  制定项目范围

  无论网站迁移项目背后的原因如何,您都需要从一开始就明确目标,因为这些目标有助于设定和管理期望值。将网站从HTTP转移到HTTPS与完成网站大修完全不同,因此两者应有不同的目标。首先,目标应该是保留该网站的流量水平,而在第二个目标中,您可能会寻求增长。

  网站迁移是解决遗留问题的好机会。在项目范围内尽可能多地包括这些应该是非常具有成本效益的,因为在启动后解决这些问题将需要更多的资源。

  但是,在任何情况下,都要确定项目取得成功的最关键方面。确定可能对网站可见性产生负面影响的所有风险,并考虑采取哪些预防措施。理想情况下,根据不同的风险和增长机会准备一些预测方案。不用说,预测情景应该由经验丰富的网站移民顾问准备。

  在尽早的阶段包括尽可能多的利益相关者将帮助您更深入地了解各部门面临的最大挑战和机遇。要求您的内容,SEO,UX和Google Analytics团队提供反馈,并列出最重要的问题和机会。然后你需要计算出解决这些问题的潜在ROI是什么。最后,根据您的目标和可用资源选择可用选项之一,这将形成您的网站迁移策略。

  如果实施,您应该留下一份预期具有正面投资回报率的优先活动清单。然后应该与所有利益相关者进行沟通和讨论,从而设定切合实际的目标,就项目达成一致,确定范围,并从一开始就设定正确的预期。

  准备项目计划

  规划同样重要,因为网站迁移往往是非常复杂的项目,可以轻松跨越数月。在规划阶段,每项任务都需要一个所有者(即SEO顾问,UX顾问,内容编辑,Web开发人员)和预计交付日期。任何依赖项都应该被识别并包含在项目计划中,这样每个人都会意识到由于依赖他人而无法实现的任何活动。例如,重定向不能被测试,除非重定向映射已经完成并且重定向已经在分段上实现。

  项目计划应尽早与所有参与者分享,以便有足够的时间进行讨论和澄清。每个活动都需要详细描述,以便利益相关者意识到每项任务会带来什么。毫无疑问,完美的项目管理是必要的,以便按照时间表组织和执行所需的活动。

  项目计划的一个关键部分是让预期的发布日期正确。理想情况下,新网站应在流量较低时启动。同样,避免在高峰期之前或高峰期期间发射,因为如果事情不如预期的那样,后果可能是毁灭性的。有一点需要记住的是,由于网站迁移从未完全按计划进行,因此需要一定程度的灵活性。

  阶段2:发射前准备

  这些包括在新网站仍在开发过程中需要执行的任何活动。到此为止,新网站的SEO要求应该已经被捕获。您应该与设计师和信息架构师联系,在新站点在临时环境中可用之前就提供原型和线框的反馈。

  线框审查

  在开发开始之前查看新网站的原型或线框。审查新网站的主要模板可以帮助您在早期阶段识别SEO和UX问题。例如,您可能会发现大部分内容已从类别页面中删除,应立即标记。或者您可能会发现一些高流量驾驶页面不再出现在主导航栏中。对于潜在的搜索引擎优化问题,应对设计或页面副本的任何根本性变化进行彻底审查。

  准备技术SEO规范

  一旦原型和线框已被审查,准备一个详细的技术SEO规范。这个重要文件的目标是捕捉开发人员在确定项目范围和工作成本之前需要了解的所有关键搜索引擎优化要求。在这个阶段,预算已经签署; 如果不包括搜索引擎优化要求,那么可能不可能将它们包括在后面。

  技术搜索引擎优化规范需要非常详细,但编写的方式使开发人员可以轻松地将需求转化为行动。这不是解释为什么需要实施的文件,但它应该如何实施。

  确保包含至少涵盖以下领域的特定要求:

  网址结构

  元数据(包括动态生成的默认值)

  结构化数据

  规范和元机器人指令

  复制和标题

  主要和次要导航

  内部链接(以任何形式)

  分页

  XML站点地图(s)

  HTML网站地图

  Hreflang(如果有国际网站)

  移动设置(包括应用,AMP或PWA网站)

  重定向

  自定义404页面

  JavaScript,CSS和图像文件

  页面加载时间(桌面和手机)

  规范还应包括CMS功能的一些领域,使用户能够:

  指定自定义网址并覆盖默认网址

  更新页面标题

  更新元描述

  更新任何h1-h6标题

  添加或修改默认的规范标签

  将meta robots属性设置为index / noindex / follow / nofollow

  添加或编辑每个图像的替代文字

  包含描述,网址,图片,类型,网站名称的打开图表字段

  包括卡片,网址,标题,描述,图片的Twitter开放图表字段

  批量上传或修改重定向

  更新robots.txt文件

  确保在更新特定属性(例如h1)时,其他元素不受影响(即页面标题或任何导航菜单)也很重要。

  识别优先页面

  网站迁移最大的挑战之一是成功将主要取决于已迁移页面的数量和质量。因此,确保您专注于真正重要的网页非常重要。这些网页已经吸引了传统网站的流量,包含累计链接的网页,转换良好的网页等。

  为了做到这一点,你需要:

  抓取遗留网站

  识别所有可索引页面

  确定表现最佳的页面

  如何抓取遗留网站

  抓取旧网站,以便获得所有网址,页面标题,元数据,标题,重定向,断开链接等的副本。无论选择哪种抓取工具应用程序(请参阅附录),都要确保抓取不过于严格。在抓取遗留网站之前,请密切关注抓取工具的设置,并考虑是否应该:

  忽略robots.txt(万一任何关键部分被意外阻止)

  遵循内部的“nofollow”链接(这样爬虫可以访问更多页面)

  抓取所有子域(取决于范围)

  在开始文件夹外部爬网(取决于范围)

  将用户代理更改为Googlebot(桌面)

  将用户代理更改为Googlebot(智能手机)

  专业提示:在迁移完成后的几个月内,保留旧网站的爬网数据(在文件或云中)的副本,以防万一在新网站上线后需要任何旧网站的数据。

  如何识别可索引页面

  爬网完成后,请确定遗留网站的索引页面。这些是具有以下特征的任何HTML页面:

  返回200服务器响应

  要么没有规范标签,要么有自我引用的规范URL

  没有元机器人noindex

  不会从robots.txt文件中排除

  从其他页面(非孤立页面)内部链接

  可转位页面是唯一有可能吸引流量进入网站的页面,因此需要优先考虑网站迁移的目的。这些页面值得优化(如果它们将存在于新网站上)或重定向(如果它们不存在于新网站上)。

  如何识别效果最好的页面

  一旦确定了所有可索引页面,就可能需要进行更多的工作,特别是如果遗留站点包含大量页面,并且由于时间,资源或技术限制而无法优化或重定向所有这些页面。

  如果是这种情况,您应该确定旧版网站的效果最好的网页。这将有助于页面的优先级在后期阶段专注于。

  建议准备一个包含以下字段的电子表格:

  旧版网址(仅包含抓取数据中的可索引网址)

  过去12个月的有机访问(Analytics)

  过去12个月的收入,转化率和转换率(Analytics)

  过去12个月的综合浏览量(Analytics)

  过去90天内的点击次数(Search Console)

  热门网页(Majestic SEO / Ahrefs)

  通过将上述信息集中在一个地方,现在可以更轻松地识别您的最重要的网页:那些能够生成有机访问,良好转换,有助于收入,拥有大量链接到它们的引荐网域的页面等。这些网页您必须专注于成功的网站迁移。

  理想情况下,新网站上也应该存在效果最好的网页。如果由于任何原因他们不应该,他们应该被重定向到最相关的页面,以便请求他们的用户不会登陆404页面,并且他们以前拥有的链接权益仍然在网站上。如果这些网页中的任何一个不存在并且没有正确重定向,则您的网站的排名和流量将受到负面影响。

  标杆

  一旦新网站的推出日益临近,您应该对遗留网站的性能进行基准测试。标杆管理至关重要,不仅可以将新网站的表现与前一个网站的表现进行比较,还可以帮助诊断新网站上哪些领域表现不佳,并快速解决问题。

  关键词排名跟踪

  如果您不经常跟踪网站的排名,那么您应该在新网站上线之前这样做。否则,你将在以后努力弄清迁移是否顺利或者哪里出错。不要把它留到最后一刻,以防出现问题 - 提前一周是理想的时间。

  花点时间研究哪些关键字最能代表该网站的自然搜索可见性,并在桌面和移动设备上进行跟踪。由于监控数以千计的头部,中长和尾部关键字组合通常是不切实际的,因此您应该监控的最低限度的关键字是推动网站访问量的关键字(关键字排名在第一页),并具有不错的搜索量(head / mid尾巴焦点)

  如果您确实从品牌关键字和非品牌关键字获得流量,则还应该从跟踪POV中决定哪些类型的关键字更专注于哪些关键字。一般而言,非品牌关键词往往更具竞争力和不稳定性。对于大多数网站来说,将重点放在这些上是有意义的。

  不要忘记跟踪桌面和手机的排名。如果在一种设备类型上存在性能问题,这将使启动后诊断问题变得更容易。如果您收到来自多个国家/地区的大量流量,请考虑其他市场中的排名跟踪关键字,因为各个国家/地区的可见度和排名可能会有很大差异。

  网站性能

  新网站的页面加载时间可能会对流量和销售产生巨大影响。一些研究表明,页面加载时间越长,跳出率越高。除非旧网站的网页加载时间和网站性能分数已经记录,否则一旦新网站上线,将很难将任何流量或收入损失归因于与网站性能相关的问题。

  建议您使用Google的PageSpeed Insights和Lighthouse工具查看所有主要页面类型。您可以使用下面的摘要表格来对某些最重要的性能指标进行基准测试,这些指标在新网站上线后可用于比较。

  移动速度FCPDCL优化优化分数

  主页快速0.7秒1.4S好81/100

  分类页面慢1.8秒5.1s中78/100

  子类别页面平均0.9S2.4S中69/100

  产品页面慢1.9s5.5s好83/100

  桌面速度FCPDCL优化优化分数

  主页好0.7秒1.4S平均81/100

  分类页面快速0.6秒1.2S中78/100

  子类别页面快速0.6秒1.3s中78/100

  产品页面好0.8S1.3s好83/100

  旧网站抓取数据

  在新网站取代旧网站前几天,对旧网站进行最终抓取。如果在新网站上有任何优化问题,那么以后可能会证明这是非常宝贵的。最终的抓取将允许您保存有关旧网站页面标题,元描述,h1-h6标题,服务器状态,规范标签,noindex / nofollow页面,链接/链接,级别等重要信息。获取所有这些信息后,如果新网站没有得到很好的优化或者存在技术配置不当的问题,那么节省很多麻烦。如果您稍后需要,也可以保存旧网站的robots.txt和XML站点地图的副本。

  Search Console数据

  还要考虑尽可能多地导出旧网站的Search Console数据。这些服务仅适用于90天,并且很可能一旦新网站上线,旧网站的Search Console数据迟早会消失。值得出口的数据包括:

  搜索分析查询和网页

  抓取错误

  资源被阻止

  移动可用性问题

  网址参数

  结构化数据错误

  链接到您的网站

  内部链接

  索引状态

  重定向准备

  重定向实施是网站迁移过程中最重要的活动之一。如果遗留网站的网址不存在,并且没有正确重定向,那么网站的排名和知名度将会一蹴而就。

  为什么重定向在网站迁移中很重要?

  重定向非常重要,因为它们帮助搜索引擎和用户找到可能不再存在,已被重命名或移动到其他位置的页面。从搜索引擎优化的角度来看,重定向帮助搜索引擎更快地发现和索引网站的新网址,同时也了解旧网站的网页如何与新网站的网页相关联。这种关联将允许排名信号从旧页面传递到新页面,所以排名保持不受负面影响。

  重定向未正确实施时会发生什么?

  当重定向执行不力时,后果可能是灾难性的。用户将登录到未找到页面(404)或不符合用户意图的不相关页面。无论哪种情况,网站的反弹率和转化率都会受到负面影响。搜索引擎的后果同样可能是灾难性的:如果网址不相同,他们将无法将旧网站的网页与新网站上的网页相关联。排名信号不会从旧网站传递到新网站,这会导致排名下降和自然搜索可见性损失。此外,搜索引擎需要更长的时间来发现和索引新网站的页面。

  301,302,JavaScript重定向或元刷新?

  当网站的旧版本和新版本之间的URL不同时,请使用301(永久)重定向。这些将告诉搜索引擎索引新的URL,并将旧的URL中的任何排名信号转发给新的URL。因此,如果您的站点移至其他域/子域/从另一个域/子域移动,则您必须使用301重定向;如果您从HTTP切换到HTTPS,或者该站点或其部分已重新构建,则必须使用301重定向。尽管Google声称302重定向传递PageRank,但索引新网址的速度会更慢,排名信号可能需要更长时间才能从旧网页传递到新网页。

  302(临时)重定向只能在重定向不需要永久生存的情况下使用,因此对新URL进行索引不是优先事项。使用302重定向,搜索引擎最初将不愿意为重定向目标网址的内容编制索引,并将任何排名信号传递给它。但是,如果临时重定向在很长一段时间内没有被移除或更新,它们的行为可能会与永久(301)重定向类似。重定向可能需要在不久的将来进行更新或删除,以及任何国家,语言或设备特定的重定向时,请使用302重定向。

  应该避免元刷新和JavaScript重定向。尽管Google在抓取JavaScript方面越来越好,但不能保证这些数据会被发现或将排名信号传递给新页面。

  如果您想详细了解Google如何处理不同类型的重定向,请参阅John Mueller的帖子。

  重定向映射过程

  如果您足够幸运能够进行不涉及URL更改的迁移,则可以跳过本节。否则,请继续阅读,以了解为什么迁移后在同一个URL上无法使用的旧页面应该重定向。

  重定向映射文件是一个包含以下两列的电子表格:

  旧版网站网址 - >旧网站上的网页网址。

  新网站网址 - >新网站上的网页网址。

  将旧页面映射(重定向)到新网站时,请始终尝试将其映射到最相关的相应页面。如果相关页面不存在,请避免将页面重定向到主页。首先,将用户重定向到不相关的页面会导致非常差的用户体验。谷歌已经表示,将页面“大量”重定向到不相关的页面将被视为软404,因此不会传递任何SEO价值。如果您无法在新网站上找到相应的页面,请尝试将其映射到其父类别页面。

  一旦映射完成,文件将需要发送给开发团队以创建重定向,以便在启动新网站之前对其进行测试。重定向的实施是网站迁移周期中的另一部分,在这个过程中,事情往往会出错。

  在重定向映射过程中提高效率

  重定向需要高度重视细节,需要由有经验的SEO来执行。小型站点上的URL映射理论上可以通过手动将旧站点的每个URL映射到新站点上的URL来完成。但是在包含数千甚至数十万个页面的大型网站上,手动映射每个URL几乎是不可能的,并且需要引入自动化。依靠传统网站和新网站之间的某些共同属性可以节省大量时间。这些属性可能包括页面标题,H1标题或其他唯一页面标识符,例如产品代码,SKU等。确保您重定向映射所依赖的属性是唯一的,并且不会在多个页面之间重复; 否则,你最终会得到不正确的映射。

  专业提示:在开始处理重定向映射之前,请确保新站点的URL结构在登台时已完成100%。没有比在新网站上线之前更新网址的风险更高的了。在重定向映射完成后更新URL时,您可能需要在启动时处理不希望的情况,例如重定向链路断开,重定向链路和重定向循环。内容冻结应在迁移日期之前尽早放置在旧网站上,因此在旧网站上发布新内容的切入点是必要的。这将确保重定向映射不会丢失任何页面,并确保旧网站上的所有页面都被重定向。

  不要忘记传统的重定向!

  您应该掌握旧网站的现有重定向,以确保在为新网站准备重定向映射时考虑这些重定向。除非您这样做,否则网站当前的重定向文件很可能会在发布日期被新文件覆盖。如果发生这种情况,之前所有的传统重定向将不复存在,并且该网站可能会失去相当数量的链接权益,其程度主要取决于网站的传统重定向量。例如,过去经历过一些迁移的网站应该有大量的遗留重定向,以避免迷路。

  理想情况下,保留尽可能多的传统重定向,确保这些重定向与新网站的重定向结合使用时不会造成任何问题。强烈建议您在早期阶段消除任何潜在的重定向链,这可以通过检查重定向映射电子表格中是否同时出现“传统网址”和“新网站网址”来完成。如果是这种情况,则需要相应地更新“新网站URL”。

  例:

  URL A重定向到URL B(传统重定向)

  网址B重定向到URL C(新重定向)

  这导致以下重定向链:

  URL A - > URL B - > URL C

  为了消除这种情况,请修改现有的旧式重定向并创建一个新的旧重定向,以便:

  URL A重定向到URL C(修改后的传统重定向)

  网址B重定向到URL C(新重定向)

  专业提示:检查您的重定向映射电子表格中的重定向循环。当“传统网址”与“新网站网址”相同时,就会发生这种情况。重定向循环需要删除,因为它们导致无限加载用户和搜索引擎无法访问的网页。重定向循环必须被消除,因为它们是即时流量,转换和排名杀手!

  实施一揽子重定向规则以避免重复的内容

  强烈建议尝试制定覆盖尽可能多URL请求的重定向规则。在Web服务器上实现重定向规则比依靠众多的一对一重定向要高效得多。如果您的重定向映射文档包含大量需要实施为一对一重定向规则的重定向,则网站性能可能会受到负面影响。在任何情况下,请仔细检查开发团队Web服务器可以处理的最大重定向数量。

  无论如何,应该有一些标准的重定向规则以避免产生重复的内容问题:

  网址案例:所有包含大写字符的网址都应该301重定向到所有小写字母的网址,例如https://www.website.com/Page/应自动重定向到https://www.website.com/page /

  主持人:例如,所有非www网址都应301重定向到他们的www等效网页,例如https://website.com/page/应该重定向到https://www.website.com/page/

  协议:在安全的网站上,HTTP URL的请求应重定向到相应的HTTPS URL,例如http://www.website.com/page/应自动重定向到https://www.website.com/page/

  尾部斜线:例如,任何不包含尾部斜线的URL都应该重定向到尾部斜线的版本,例如http://www.website.com/page应该重定向到http://www.website.com/page/

  即使遗留网站上存在一些标准重定向规则,但不要以为它们必须存在于新网站上,除非它们被明确要求。

  避免内部重定向

  尝试更新网站的内部链接,使其不会触发内部重定向。尽管搜索引擎可以遵循内部重定向,但不推荐这些重定向,因为它们会增加页面加载时间的额外延迟,并且还可能对搜索引擎抓取时间产生负面影响。

  不要忘记你的图像文件

  如果网站的图片已移至新位置,Google建议您将旧图片网址重新定向到新图片网址,以帮助Google更快地发现新图片并为其编制索引。如果重定向所有图片并不容易,那么至少应该重定向那些具有累积反向链接的图片网址。

  阶段3:预发布测试

  越早开始测试,效果越好。某些事情需要完全实施才能进行测试,但有些则没有。例如,用户旅程问题可以从原型或线框设计开始就被识别出来。旧网站和新网站之间的内容相关问题或内容不一致(例如桌面和移动网站之间)也可以在早期阶段识别。但是技术性较强的组件只能在完全实施后才能进行测试 - 例如重定向,规范标记或XML站点地图。之前的问题得到确认,它们在启动新网站之前就会解决的可能性就越大。在后期确定某些类型的问题不具有成本效益,需要更多资源,并造成重大延误。

  确保搜索引擎不能访问分段/测试站点

  在分段/测试环境中提供新站点之前,请采取一些预防措施,即搜索引擎不会将其编入索引。有几种不同的方式可以做到这一点,每种方式都有不同的优缺点。

  网站可用于特定的IP (最推荐)

  使测试站点仅可用于特定(列入白名单的)IP地址是防止搜索引擎抓取它的一种非常有效的方法。试图访问测试网站URL的任何人都将无法看到任何内容,除非他们的IP已被列入白名单。主要优势在于,列入白名单的用户可以轻松访问和抓取网站,而不会出现任何问题。唯一的缺点是由于IP限制,无法使用第三方基于网络的工具(如Google的工具)。

  密码保护

  保护登台/测试网站的密码是阻止搜索引擎爬虫的另一种方式,但这种解决方案有两个主要缺点。根据实施情况,如果抓取工具应用程序未超过登录屏幕,则可能无法抓取和测试受密码保护的网站。另一个缺点是:使用表单进行身份验证的受密码保护的网站可以使用第三方应用程序进行爬网,但存在导致严重和意外问题的风险。这是因为抓取工具点击了网页上的每个链接(当您登录时),并且很容易最终点击创建或移除页面的链接,安装/卸载插件等。

  Robots.txt阻止

  将以下代码行添加到测试网站的robots.txt文件中将会阻止搜索引擎抓取测试网站的网页。

  用户代理: *

  不允许: /

  此方法的一个缺点是,尽管测试服务器上显示的内容不会被索引,但不允许的URL可能会显示在Google的搜索结果中。另一个缺点是,如果上面的robots.txt文件移动到活动站点,它将导致严重的索引问题。这是我遇到过无数次的,因此我不建议使用这种方法来阻止搜索引擎。

  用户旅程审查

  如果网站进行了重新设计或重组,那么用户旅程可能会在一定程度上受到影响。由于缺少用户数据,因此在新站点启动之前尽早检查用户旅程是困难的。但是,有经验的UX专业人士可以举出任何可能对网站转换率产生负面影响的担忧。由于现阶段的A / B测试几乎不可能,所以可能需要进行一些用户测试,并尝试从真实用户那里获得一些反馈。不幸的是,用户体验问题可能是一些难以解决的问题,因为它们可能需要花费大量时间和精力进行全网改变。

  在全面的现场大修中,并不是所有的用户体验决策都可以通过数据进行备份,许多决策必须基于最佳实践,过去的经验和“直觉”,因此尽早让用户体验/ CRO专家能够支付稍后分红。

  网站架构审查

  网站迁移通常是改善网站架构的绝佳机会。换句话说,您有很好的机会重新组织您的关键字定位内容并最大限度地发挥其搜索流量的潜力。进行广泛的关键字研究将有助于确定最佳类别和子类别页面,以便用户和搜索引擎可以在几次点击后访问网站上的任何页面 - 越少越好,因此您不会得到非常深的分类。

  识别具有良好流量潜力的新关键字并将它们映射到新的着陆页可以对网站的有机流量水平产生重大影响。另一方面,加强网站架构需要谨慎完成。如果重要的页面深入到新的站点体系结构中,或者存在太多针对相同关键字优化的类似页面,则它可能会导致问题。一些最成功的网站迁移是分配大量资源来增强网站架构的迁移。

  元数据和复制审查

  确保网站的页面标题,元描述,标题和副本已经从旧网站转移到新网站,没有问题。如果您创建了任何新页面,请确保这些页面已经过优化,并且不要定位已被其他页面定位的关键字。如果您正在重新平台化,请注意,新平台在创建新页面时可能具有不同的默认值。没有经过适当优化的页面标题或任何类型的缺失副本,启动新网站将对您的网站的排名和流量产生直接的负面影响。不要忘记检查用户生成的内容(即用户评论,评论)是否也已上传。

  内部链接审查

  内部链接是网站的支柱。无论网站的副本的优化和结构有多好,除非有完美的内部链接方案支持,否则就不足以成功。内部链接必须在整个网站上进行审查,包括以下链接中的链接:

  主要和次要导航

  页眉和页脚链接

  正文内容链接

  分页链接

  横向链接(相关文章,类似产品等)

  垂直链接(例如面包屑导航)

  跨站点链接(例如跨国际站点的链接)

  技术检查

  必须进行一系列技术检查,以确保新站点的技术设置完善,并避免新站点上线后出现重大技术故障。

  Robots.txt文件审查

  在暂存环境中准备新网站的robots.txt文件。通过这种方式,您可以对错误或遗漏进行测试,并避免在新网站上线时遇到搜索引擎抓取问题。网站迁移中的一个典型错误是robots.txt文件使用以下指令阻止搜索引擎访问:

  不允许: /

  如果这个意外传播到现场(通常是这样),它将阻止搜索引擎抓取该网站。并且,当搜索引擎无法抓取索引页面时,与该页面关联的关键字将在搜索结果中降级,最终该页面将被删除索引。

  但是,如果分段中的robots.txt文件使用新网站的robots.txt指令填充,则可以避免此类事故。

  准备新网站的robots.txt文件时,请确保:

  它不会阻止搜索引擎访问旨在获取索引的页面。

  它不会阻止任何JavaScript或CSS资源搜索引擎呈现页面内容。

  遗留网站的robots.txt文件内容已经过审查并在必要时结转。

  它引用了新的XML站点地图,而不是任何遗留的站点地图。

  Canonical标签审查

  查看网站的标准标签。查找没有规范标签或者有指向另一个URL的规范标签的页面,并询问这是否是有意的。不要忘记抓取规范标签,以确定它们是否返回200服务器响应。如果他们不这样做,则需要更新它们以消除任何3xx,4xx或5xx服务器响应。您还应该查找具有指向另一个URL并带有noindex指令的规范标签的页面,因为这两个信号是相互冲突的信号,因此您需要消除其中的一个。

  元机器人审查

  抓取暂存站点后,查找meta robots属性设置为“noindex”或“nofollow”的页面。如果是这种情况,请检查其中的每一个以确保这是有意的,并删除“noindex”或“nofollow”指令(如果不是)。

  XML站点地图审查

  准备两种不同类型的站点地图:一个包含所有新站点的可索引页面,另一个包含所有旧站点的可索引页面。前者将帮助Google了解新网站的可索引网址。后者将帮助Google了解现有的重定向以及部分已编入索引的URL已移至新位置的事实,以便它可以发现它们并更快地更新搜索结果。

  您应该检查每个XML站点地图以确保:

  它验证没有问题

  它被编码为UTF-8

  它不包含超过50,000行

  未压缩时其大小不超过50MB

  如果行数超过50K或文件大小超过50MB,则必须将站点地图分解为较小的站点地图。这可以防止Google过分频繁地请求站点地图时服务器过载。

  另外,您必须对每个XML站点地图进行爬网,以确保其仅包含可索引的URL。任何不可索引的URL都应该从XML站点地图中排除,例如:

  3xx,4xx和5xx页面(例如重定向,未找到页面,错误请求等)

  软404s。这些页面没有内容返回200服务器响应,而不是404。

  规范化页面(除了自我引用规范URL)

  带有元机器人noindex指令的页面

  (......)

  (...)

  在HTTP标题中带有noindex X-Robots-Tag的页面

  HTTP / 1.1 200 OK

  日期:2017年11月10日星期二17:12:43 GMT

  (......)

  X-Robots-Tag:noindex

  (......)

  从robots.txt文件中阻止的页面

  构建干净的XML站点地图可帮助监控新站点上线后的真正索引级别。如果你不这样做,就很难发现任何索引问题。

  专业提示:在Excel中下载并打开每个XML站点地图,以获取其他属性的详细概述,如hreflang或图像属性。

  

 

  HTML站点地图审查

  根据正在迁移的网站的大小和类型,在某些情况下使用HTML网站地图可能会有所帮助。由网站主导航未链接的URL组成的HTML网站地图可显着提升页面发现和索引。但是,请避免生成包含太多URL的HTML站点地图。如果您确实需要包含数千个网址,请考虑构建一个分段的HTML网站地图。

  嵌套站点地图的数量以及您应该在每个站点地图中包含的最大URL数取决于站点的权限。越权威的网站,嵌套站点地图和网址的数量越高。

  例如,NYTimes.com HTML站点地图由三个级别组成,每个站点地图包含超过1,000个URL。这些嵌套的HTML站点地图帮助搜索引擎爬虫发现自1851年以来发布的文章,否则将很难发现和索引,因为并非所有文章都会在内部链接。

 

  结构化数据审查

  需要尽早识别结构化数据标记中的错误,以便在新网站上线之前有时间修复它们。理想情况下,您应该使用Google的结构化数据测试工具测试每个页面模板(而不是每个页面)。

  一定要检查桌面和移动网页上的标记,特别是如果移动网站没有响应。

  该工具将只报告任何现有的错误,但不是遗漏。例如,如果您的产品页面模板不包含产品结构化数据模式,则该工具不会报告任何错误。因此,除了检查错误之外,还应确保每个页面模板都包含适合其内容类型的结构化数据标记。

  有关结构化数据实施和支持的内容类型的最新详细信息,请参阅Google的文档。

  JavaScript抓取评论

  您必须测试新网站的每个页面模板,以确保Google能够抓取需要JavaScript解析的内容。如果您可以在暂存网站上使用Google的“提取和呈现”工具,则应该确实这样做。否则,按照Justin Brigg的建议进行一些手动测试。

  

 

  正如BartoszGóralewicz的测试所证明的那样,即使Google能够抓取并索引JavaScript生成的内容,但这并不意味着它能够跨所有主流JavaScript框架抓取JavaScript内容。下表总结了Bartosz的发现,表明一些JavaScript框架不适合搜索引擎优化,而AngularJS目前是所有问题中最成问题的。

  

 

  Bartosz还发现其他搜索引擎(比如Bing,Yandex和百度)真的在索引JavaScript生成的内容方面很困难,这对了解您的网站的流量是否依赖任何这些搜索引擎很重要。

  

 

  希望这种情况随着时间的推移会得到改善,但随着JavaScript框架在Web开发中的越来越流行,这一点在你的清单上应该是很高的。

  最后,你应该检查是否有任何外部资源被阻止。不幸的是,这不是你可以控制100%的东西,因为许多资源(如JavaScript和CSS文件)由第三方网站托管,这些网站可能通过自己的robots.txt文件阻止它们!

  

 

 

  同样,取回和渲染工具可以帮助诊断这种类型的问题,如果不解决问题,可能会产生严重的负面影响。

  移动网站SEO审查

  资产阻止审查

  首先,确保robots.txt文件不会意外阻止任何对移动网站内容呈现至关重要的JavaScript,CSS或图像文件。这可能会对搜索引擎如何呈现和索引移动网站的网页内容产生负面影响,进而可能会对移动网站的搜索可见性和性能产生负面影响。

  

 

  移动优先索引审查

  为了避免与Google的移动优先索引相关的任何问题,请彻底审查移动网站,并在以下方面确保桌面和移动网站之间不存在任何不一致:

  页面标题

  元描述

  标题

  复制

  Canonical标签

  Meta机器人属性(即noindex,nofollow)

  内部链接

  结构化数据

  一个响应式网站应该在不同设备上提供相同的内容,链接和标记,而且上述SEO属性在桌面和移动网站上应该是相同的。

  除上述之外,您还必须根据移动网站的设置进行一些进一步的技术检查。

  响应式网站审查

  响应式网站必须为所有设备提供相同的HTML代码,根据屏幕大小调整(通过使用CSS)。

  

 

  只要Googlebot允许抓取网页及其资产,Googlebot就能够自动检测到此移动设置。因此,确保Googlebot可以访问所有重要资产(如图像,JavaScript和CSS文件)非常重要。

  为了向浏览器指示页面响应,meta =“viewport”标签应该位于每个HTML页面的内。

  如果缺少元视口标记,字体大小可能会以不一致的方式显示,这可能会导致Google将该页面视为不适合移动设备。

  

 

  单独的移动URL审查

  如果移动网站使用桌面上的单独URL,请确保:

  每个桌面页面都有一个指向相应移动URL的标签。

  每个移动网页都有一个指向相应桌面网址的rel =“canonical”标记。

  当在移动设备上请求桌面网址时,它们会重定向到相应的移动网址。

  重定向可在所有移动设备上工作,包括Android,iPhone和Windows手机。

  桌面版和移动版网页之间没有任何不相关的交叉链接。这意味着在桌面页面上找到的内部链接应该只链接到桌面页面,而在移动页面上找到的链接只能链接到其他移动页面。

  移动网址返回200服务器响应。

  

  动态服务审查

  动态服务网站为每个设备提供不同的代码,但在同一个网址上。

  

  在动态服务网站上,查看是否正确设置了不同的HTTP标头。这是非常必要的,因为动态服务网站会更改移动用户代理的HTML,而且各种HTTP标头可帮助Googlebot发现移动内容。

  移动友好评论

  无论移动网站设置如何(响应式,单独的网址或动态服务),请使用移动用户代理查看网页,并确保:

  视口已正确设置。跨设备使用固定宽度的视口会导致移动可用性问题。

  字体大小不是太小。

  触摸元素(即按钮,链接)不太靠近。

  没有任何插入式插页式广告,例如广告,邮件列表注册表单,App下载弹出窗口等。为避免任何问题,您应该使用小型HTML或图像横幅。

  移动页面加载速度不会太慢(请参阅下一节)。

  Google的移动友好测试工具可以帮助诊断大部分上述问题:

  

 

 

  Google的移动友好型测试工具正在运行

  AMP网站审查

  如果有AMP网站并且该网站的桌面版本可用,请确保:

  每个非AMP页面(即桌面,移动设备)都有一个指向相应AMP网址的标签。

  每个AMP页面都有一个指向相应桌面页面的rel =“canonical”标签。

  任何没有相应桌面网址的AMP页面都有一个自我引用的规范标签。

  您还应该确保AMPs是有效的。这可以使用Google的AMP测试工具进行测试。

  混合内容错误

  Google努力使网站充分安全,Chrome成为第一个将HTTP页面标记为不安全的浏览器,旨在通过HTTPS启动新网站,确保通过安全的HTTPS请求所有资源(如图像,CSS和JavaScript文件)。这对于避免混合内容问题至关重要。

  当通过安全HTTPS连接加载的页面通过不安全的HTTP连接请求资产时,会发生混合内容。大多数浏览器要么阻止危险的HTTP请求,要么只是显示妨碍用户体验的警告。

  

 

  Chrome的JavaScript控制台中出现混合内容错误

  有很多方法可以识别混合内容错误,包括使用爬虫应用程序,谷歌的灯塔等。

  图像资产审查

  Google比HTML网页更频繁地抓取图片。如果将站点的图像从一个位置迁移到另一个位置(例如从您的域名到CDN),可以通过多种方法帮助Google更快地发现迁移后的图像。构建图像XML站点地图将有所帮助,但您还需要确保Googlebot在抓取站点时可以访问站点的图像。图像索引的棘手部分是图像出现的网页以及图像文件本身都必须进行索引。

  网站性能评估

  最后但并非最不重要的一点是,测量旧网站的网页加载时间,并查看这些网站在分期中可用时与新网站的比较情况。在此阶段,重点关注与网络无关的性能方面,如使用外部资源(图像,JavaScript和CSS),HTML代码和Web服务器的配置。关于如何做到这一点的更多信息可以进一步下载。

  Google Analytics跟踪审核

  确保分析跟踪已正确设置。理想情况下,审查应由专业分析顾问执行,他们将超越实施的跟踪代码。确保目标和事件设置正确,实施电子商务跟踪,启用增强型电子商务跟踪等。没有什么比启动新网站后没有任何分析数据更令人沮丧的了。

  重定向测试

  在新网站上线之前测试重定向非常重要,以后可以为您节省很多麻烦。有很多方法可以检查登台/测试服务器上的重定向,但最重要的是,如果没有测试重定向,就不应该启动新网站。

  一旦重定向在分段/测试环境中可用,请抓取整个重定向列表并检查以下问题:

  重定向循环(无限重定向到自身的URL)

  用4xx或5xx服务器响应重定向。

  重定向链(重定向到另一个URL,然后重定向到另一个URL等)。

  返回4xx或5xx服务器响应的规范URL。

  规范循环(页面A具有指向页面B的规范指向,其规范指向页面A)。

  规范链(指向指向另一个页面的规范指向另一个页面的规范)等。

  协议/主机不一致性(例如,URL被重定向到HTTP和HTTPS URL或www和非www URL)。

  前/后空白字符。在Excel中使用trim()来消除它们。

  网址中的字符无效。

  专业提示:确保旧网站的某个网址重定向到新网站上的正确网址。在此阶段,由于新网站尚不存在,因此您只能测试重定向目标网址是否为预定网址,但绝对值得。URL重定向并不意味着它会重定向到正确的页面。

  阶段4:启动日活动

  当该网站关闭时

  虽然新网站正在取代旧网站,但现场网站将暂时停止运营。停机时间应该保持在最低限度,但在发生这种情况时,Web服务器应该响应任何带有503(服务不可用)服务器响应的URL请求。这将告诉搜索引擎抓取工具,该网站暂时关闭进行维护,以便他们稍后再回来抓取该网站。

  如果网站在服务器不响应503服务器响应并且搜索引擎抓取该网站的情况下停机太久,则自动搜索可见性将受到负面影响,并且一旦该站点备份,恢复就不会立即恢复。此外,在网站暂时停用的同时,它也应该提供一个信息丰富的页面,通知用户该网站暂时停机维护。

  技术抽查

  一旦新网站上线,请快速浏览一下:

  robots.txt文件确保搜索引擎不被阻止抓取

  首页重定向(例如请求旧网站的首页重定向正确?)

  首页规范标签

  首页服务器响应

  Noindex / nofollow指令,如果它们是无意的

  除非站点完全响应,否则需要在移动站点和桌面站点上进行抽查。

  Search Console的操作

  新网站上线后,应立即开展以下活动:

  测试并上传XML站点地图(s)

  设置域的首选位置(www或非www)

  设置国际定位(如果适用)

  配置URL参数以尽早处理任何潜在的重复内容问题。

  上传拒绝文件(如果适用)

  使用更改地址工具(如果切换域)

  专业提示:为每种不同类型的页面(例如主页,类别,子类别,产品页面)使用“Google抓取方式”功能,以确保Googlebot可以毫无问题地呈现网页。查看任何已报告的被阻止的资源,并且不要忘记对桌面和移动设备使用提取和渲染,尤其是在移动网站无法响应的情况下。

  

 

  被阻止的资源会阻止Googlebot呈现该网页的内容

  阶段5:发布后评论

  新网站上线后,应进行新一轮的深入检查。这些与“第3阶段:启动前测试”部分中提到的基本相同。

  但是,这个阶段的主要区别是您现在可以访问更多的数据和工具。不要低估您在此阶段需要付出的努力量,因为您现在遇到的任何问题都会直接影响网站在SERP中的表现。另一方面,问题越早确定,问题就越快解决。

  除了重复第3阶段中列出的相同测试任务外,在某些方面,还可以更全面,准确和更详细地测试。您现在可以充分利用Search Console功能。

  检查爬网统计信息和服务器日志

  请关注Search Console中的抓取统计信息,确保Google抓取新网站的网页。一般来说,当Googlebot遇到新网页时,它往往会加快它每天搜索的平均页数。但是,如果在发布日期之前无法发现高峰,则可能会对Googlebot抓取该网站的能力产生负面影响。

  

 

  在Google Search Console上检索统计信息

  查看服务器日志文件是发现任何爬网问题或效率低下的最有效方法。像Botify和On Crawl这样的工具可能非常有用,因为它们将抓取与服务器日志数据结合在一起,可以突出显示搜索引擎不抓取的页面,未链接到内部页面(孤立页面)的页面,内部链接严重的低值页面,还有更多。

  审查定期抓取错误

  请关注报告的抓取错误,理想情况是在前几周内每天抓取。每天下载这些错误,抓取报告的URL并采取必要的措施(例如实施额外的301重定向,修复软404错误)将有助于更快地恢复。这是非常不可能的,你将需要重新定向每个报告的404,但是你应该为最重要的404添加重定向。

  

 

  专业提示:在Google Analytics中,您可以轻松找出哪些是最常用的404网址,并先解决这些问题!

  

 

  其他有用的Search Console功能

  其他值得检查的Search Console功能包括阻止的资源,结构化数据错误,移动可用性错误,HTML改进和国际定位(检查hreflang报告的错误)。

  专业提示:密切关注URL参数,以防万一导致重复的内容问题。如果是这种情况,请考虑采取紧急补救措施。

  

 

  

相关资讯