深圳推广公司详解5个附加的数据混合示例,用于更智能的SEO洞察
当您开始将您的搜索引擎优化工作转移到更多数据驱动时,您自然会查看您手中的所有数据源,并且可能会发现提出新的数据混合想法具有挑战性。这是一个我经常使用的简单快捷方式:我不是从我拥有的数据源开始(自下而上),而是我需要回答的问题,然后编译我需要的数据(上下)。
在本文中,我们将探讨我们可以通过数据混合解决的5个额外的SEO问题,但在我们深入研究之前,我想解决在将这种技术付诸实践时将面临的一些挑战。
托尼麦克雷斯提出了一个非常重要的挫败感,你可以在数据混合时体验到:
像这样将数据拉到一起可能很有趣,有时令人沮丧。
当您连接单独的数据集时,需要以相同的方式格式化公共列以使此技术起作用。然而,情况并非如此。您经常需要在连接操作之前预先处理列。
以下是您经常会看到的一些最常见的预处理问题以及如何在Python中解决这些问题。
网址
绝对的或相对的。您经常会找到绝对和相对URL。例如,谷歌分析学网址是相对的,而来自SEO蜘蛛网抓取的网址是绝对的。您可以将两者都转换为相对或绝对。
以下是如何将相对URL转换为绝对URL:
以下是如何将绝对URL转换为相对URL:
区分大小写。大多数URL都区分大小写,但如果站点托管在Windows Server上,您通常会发现具有不同大小写的URL返回相同的内容。您可以将两者都转换为小写或大写。
以下是如何将它们转换为小写:
以下是如何将它们转换为大写:
编码。有时,URL来自另一个源URL的URL参数,如果它们具有查询字符串,则它们将被URL编码。提取参数值时,您使用的库可能会也可能不会为您执行此操作。
以下是如何解码URL编码的URL
参数处理。如果网址包含多个网址参数,则可能会遇到以下问题:
您可能没有值的参数。
您可能有冗余/不必要的参数。
您可能有不同的顺序参数
以下是我们如何解决这些问题。
日期
日期可以有多种不同的格式。主要策略是将它们的源格式解析为Python 日期时间对象。您可以选择操作日期时间对象。例如,要正确排序日期或本地化到特定时区。但是,最重要的是,您可以使用一致的约定轻松格式化日期时间日期。
这里有些例子:
关键词
在不同数据集之间正确匹配关键字也是一项挑战。您需要查看列以查看关键字是否显示为用户输入关键字,或者是否存在任何规范化。
例如,用户通过复制和粘贴文本进行搜索的情况并不少见。这种类型的关键字搜索将包括在键入时通常不会出现的连字符,引号,商标符号等。但是,在键入时,间隔和大写可能在用户之间不一致。
为了规范化关键字,您需要至少删除任何不必要的字符和符号,删除额外的间距并以小写(或大写)标准化。
以下是在Python中如何做到这一点:
现在我们知道了如何预处理列,让我们来看看文章的有趣部分。让我们回顾一些额外的SEO数据混合示例:
搜索点击的错误页面
您从Web服务器日志中获取了大量404错误,因为Google Search Console无法轻松获取完整列表。现在,您需要重定向其中大部分以恢复丢失的流量。您可以使用的一种方法是使用搜索点击确定页面的优先级,从最受欢迎的页面开始!
以下是您需要的数据:
谷歌搜索控制台:页面,点击次数
Web服务器日志:HTTP请求,状态代码= 404
公共列(用于合并功能):left_on:page,right_on:HTTP请求。
页面缺少谷歌 分析跟踪代码
有些网站选择手动插入跟踪代码,而不是将其放在网页模板上。由于页面缺少跟踪代码,这可能导致流量少报问题。您可以抓取该网站以查找此类网页,但如果网站未在网站内链接,该怎么办?您可以使用的一种方法是在同一时间段内比较谷歌 分析和Google Search Console中的网页。GSC数据集中但GA集中缺少的任何页面都可能缺少GA跟踪脚本。
以下是您需要的数据:
谷歌搜索控制台:日期,页面
谷歌分析:遗传算法:日期,遗传算法:兰丁帕佩斯,已过滤到Google自然搜索。
常用列(用于合并功能):left_on:page,right_on:ga:landingPagePath。
从谷歌分析报告中排除404页面
在模板中插入跟踪代码的一个缺点是谷歌 分析网页浏览量可能会在用户最终进入404页面时触发。这通常不是问题,但是当您尝试分析流量问题时,它会使您的生活变得复杂,并且无法分辨哪些流量是好的并且以实际页面内容结束,哪些是坏的并且以错误结束。您可以使用的一种方法是将谷歌 分析中的网页与从网站抓取的返回200状态代码的网页进行比较。
以下是您需要的数据:
网站抓取:网址,状态代码= 200
谷歌 分析:ga:landingPagePath
常用列(用于合并功能):left_on:URL,right_on:ga:landingPagePath
挖掘内部站点搜索内容差距
假设您在谷歌 分析中查看内部网站搜索报告,并查找来自自然搜索的用户,然后执行一项或多项内部搜索,直到找到他们的内容为止。可能会出现缺少内容片段的情况,这些内容片段可以直接从有机搜索中驱动这些访问者。您可以使用的一种方法是将内部搜索关键字与Google Search Console中的关键字进行比较。这两个数据集应使用相同的日期范围。
以下是您需要的数据:
谷歌 分析:ga:date,ga:searchKeyword,已过滤到Google自然搜索。
谷歌搜索控制台:日期,关键字
常用列(用于合并功能):left_on:ga:searchKeyword,right_on:keyword
检查Google购物自然搜索性能
Google 上个月宣布,Google购物Feed中列出的产品现在可以显示在自然搜索结果中。我认为检查您获得的流量与常规有机列表相比会很有用。如果您向Feed中的网址添加其他跟踪参数,则可以使用谷歌搜索控制台数据来比较常规列表与有机购物列表中显示的相同产品。
