数据驱动的
互联网营销和运营

理解Google Analytics报告的范围

我们都知道,Google Analytics(后文统称为GA)让不懂数据背后的处理逻辑的人也能很容易的收集和查看数据。通常情况下,理解了GA收集和存储数据的模型,就会很好解释一些复杂问题或者古怪的访客行为。下面就从最基本的说起:

GA的数据收集可以分成两类:维度和指标。然而,并不是每一个维度-指标的组合都可以在GA标准报告中进行分析。例如,“所有页面”报告提供的是关于网站不同网页的详细信息,你可以这个报告中看到网页浏览量、唯一身份浏览量,以及每一个页面的访问进入次数、平均页面停留时间、跳出率、退出率和网页价值等指标。但是你看不到用户数或者会话数这样的指标。

关于会话和用户指标的数据到底在哪里?

你使用GA的目的就是想尽可能地了解关于网站表现的信息,那么为什么这些额外的指标并没有出现在表格里呢?这看起来像是标准报告的限制,但是这些指标其实是故意遗漏掉的。了解这些指标为什么会被遗漏是创建有意义和准确的报告的关键。

什么是Scope(范围)?

基于GA定义和收集数据的模式,维度和指标是各自被分开储存的。Scope是每个维度和指标的一个特性, 每个维度或者指标只能有一个Scope。GA数据是由以下4个类型的Scope组成的:

  1. 用户数据
  2. 会话数据
  3. Hit数据
  4. 产品数据(电子商务)

Hit的定义是指网站上的任何一个单一操作,例如网页浏览或者由观看视频或下载PDF而触发的事件。Hit同时也与产品相关联。

会话则是在特定时间区间内的一个或多个hits。一个用户在一个会话内,在网站上的所有操作,如加载的页面和下载的文件,都是与这个会话相关联的。

用户数据是数据收集的最高级别,并且是连接过去和未来网站行为的关键点。具体说来,GA会为访问你网站的每个用户存储一个客户端ID,然后将同一客户端ID的会话聚集在一起。这个客户端ID是GA跟踪代码生成的一个值,且储存在用户电脑的浏览器cookie中。需要说明的是这里的用户并非是一个人的意思,指的是cookies,理解这点对于报告的分析是至关重要的。因此,如果一个人在工作时通过Chrome访问了一个网站,然后在家里的电脑上通过Firefox浏览器又访问了一次同一网站的话,会被计算成是两个用户,因为每个浏览器各自产生一个cookie。

用户是由一个或者多个会话组成的,会话是由一个或多个Hit组成的,Hit则可能会跟一个或者多个产品相关联。

用户级scope

用户级scope内的任何维度或指标都与用户相关,最常用的包括:

会话级scope

会话级scope的维度和指标指的是单次会话的属性,包括:

Hit级scope

Hit级scope的维度和指标指的则是单次Hit的特性,包括:

为什么Scope很重要?

如上述,用户是由一个或者多个会话组成的,会话是由一个或多个Hit组成的,Hit则会关联至一个或多个产品。理解这种层次结构的方向性是非常重要的。例如,我们可以说,会话包括Hit,但Hit不能包括会话,Hit匹配到产品,但不会反过来说产品匹配到Hit。然而,Hit是包含用户的,要理解为什么Hit可以包含用户却不能包括会话,我们需要分解一下GA数据的处理步骤。

Hit是GA的基本单位。一个客户端ID是由大量包含很多其他信息的Hit组成的,这些信息包括Hit的类型(页面浏览、事件等),Hit产生的时间等。Hit是发送到GA的需要被处理的碎片化信息。根据在数据视图设置的过滤器,有些Hit会被保留,有些则会被丢弃。Hit是根据时间戳按先后顺序组织的,并且通过客户端ID而关联起来。只有这样,GA才能通过这些Hit的间隔时间来确定他们属于哪个会话。

这样处理的结果就是,Hit并没有一个会话ID可以分配,虽然我们可以说“Hit包含用户数据”,因为Hit包含客户ID的信息;但不能说“Hit包含会话数据”,因为它并不包含会话的信息。即使有方法可以把Hit和会话连接起来,Hit级报告也会出现重复信息。因此,Hit和会话级别的报告是不兼容的,故我们说“Hit不包含会话数据”。

基于此,在做数据报告以及设置自定义维度和指标的时候,你应当将Scope考虑在内。

报告

一谈到报告,Scope就显得特别地重要。如上所述,GA的内置报告不允许创建无效的维度-指标组合。然而,如果是创建自定义报告或者通过API创建报告,那么限制就少很多了,你可以任意组合想要的维度或指标,但这并不一定是件好事情。

创建报告时首先需要弄清一件事,即就GA收集数据的方法来说,这个自定义的维度-指标的组合真有意义吗?否则,你可能会创建出一些与你的想象不一致的报告。

例如,如果你试图将GA里的“网页”和“会话”组合在一起,生成的表格并不会显示该网页被浏览的会话数,而是显示有多少个会话是从这个页面进入的。为了得到想看的信息,你需要将“网页”和另一个Hit级维度组合起来,例如“唯一页面浏览量”。

在组合任何Hit级维度和会话级指标时,该指标都只会包含会话的第一个Hit的数据。在这里将列举一些在做报告时可能会犯的错误。

以下是你无法设置的一些组合:

  • 事件和目标达成数

你也许想知道有多少事件被算成目标达成数。 一个目标可以被定义为一个事件,但不能把它和目标达成数关联起来,因为目标是会话级的,而事件是Hit级的。

  • 产品和事件总数

你可能对有多少人购买了产品并完成了一个事件感兴趣。这种情况下比较每个Hit级的产品级数据是不可行的,这种组合只会产出没有数据的报告。

  • 页面和目标达成数

你或许还会对另一块信息有兴趣,那就是目标是在哪些页面完成的。你可以通过维度、目标达成URL看到某些层级的详细信息,但是你不能将页面维度和目标达成数量指标组合起来。此分析以及上述的事件-目标达成数的组合不可行的原因是相同的,即:目标是会话级别的,而页面是Hit级别的。不过,你可以利用转化细分来分析这类数据。

总之,基于GA定义和处理数据的方式,这些维度和指标的组合生产出来的报告都是无意义的。

自定义维度和指标

在设置自定义维度和指标的时候,特别需要考虑到Scope,当然你也可以为它们设置Scope。

设置的Scope可以建立在你希望如何收集这些数据以及最终如何汇报这些数据上。这些信息是否只和当前的Hit有关?它是否会提供我们更多关于浏览会话的信息?或者它是否会提供一些值得保留的用户信息?这些疑问都可以通过自定义维度和指标产生的报告找到答案。

例外情况

正如上文提及的,跨Scope地组合维度和指标是绝对会产生误导的。要不得到的是完全没有意义的报告,要不就是会得到和期望大相庭径的报告。但是有时候,你确实能从里面得到所期望的报告。

例如,如果你创建了Hit级维度(页面)和用户级指标(用户数)的自定义组合,那么你就能得到每个页面被多少用户访问过的报告。如果你记得我之前说的,Hit确实包含用户信息(客户端ID),那么这就是这种组合可行的原因。

主要结论

谨记:做报告的时候千万不要跨Scope—— 如果你要跨Scope组合,先考虑好它们之间的层级关系。同时,把跨Scope报告与GA中的其他数据进行交叉参考,以确保报告展示内容确实是你想要的。记住GA是如何处理数据的——每个Hit都有一个客户ID,但是没有会话 ID。还有个原则是,千万不要组合Hit级和会话级的指标。

作者简介:

Emily Rosche是LunaMetrics的初级分析师。她从很小的时候就喜欢所有科学的东西,并且在维拉诺瓦大学获得天文与天体物理学学位。她喜欢户外活动,不工作的时候,Emily经常跑步、远足或者攀爬。

译者简介:

梅子,网络营销和网站分析从业者和爱好者,也是iCDO翻译志愿者。

未经允许不得转载:DigiMaxDigiMax » 理解Google Analytics报告的范围
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址