生命不息，作弊不止：怎么发现自己的流量被人做了弊？

本文长度为2765字，预估阅读时间7分钟。

引言：这是一个永恒不灭的话题。技术的进步增加了广告投放的效率和效果，也带来了更加凶猛的作弊。品牌广告的作弊一直以来被人诟病，效果类广告的虚假流量其实也很猖獗。线上营销的成本不停升高，再加上流量掺水作假，对广告主而言，不啻为一个黑暗的考验。

作者 | 宋星

编辑 | 华子

到底作弊有多厉害？

AdMaster刚刚发布了2018年上半年的数字广告无效流量白皮书。数据显示，2018 上半年，上千家广告主企业（行业范围涵盖快消、母婴、汽车、餐饮、金融、互联网等各行各业），无效流量占比为 28.8%，同比 2017 年上半年无效流量的占比 29.6%和 2016 年上半年无效流量的占比 30.4%，虽逐年有小幅下降，但形势依然严峻。

接近三分之一的流量是有问题的流量。而流量的来源上，垂直门户一直都是重灾区。再加上今天的网民行为的迁移，垂直门户的日子只会越来越难过。

媒体行业细分来看，还是品牌类广告行业的无效流量占比多。而且，女性相关媒体的流量情况触目惊心，接近50%！汽车行业媒体的流量作弊有所抬头。

与常识不同，AdMaster给出的移动端的作弊少于PC端。但并不奇怪，因为AdMaster监测数据主要覆盖的是品牌广告主，尤其是视频贴片＋信息流＋开屏等广告。如果包含了其他的移动端ADX以及效果类的广告，从我们投放的经验上看，移动端的作弊，尤其是安卓系统的作弊，比PC端严重太多。所以下面的这个数据，请大家注意不是移动端的所有流量的数据。

发现效果类作弊

发现效果类作弊只要牢记几点，其实并不困难。

1. 对流量的细分标记一定要做好。

你不做细分流量，怎么发现什么流量有问题呢？

细分流量一般有两种方法，最常用的是link tag的方法（见我这篇文章：用Google Analytics的Link Tag http://www.chinawebanalytics.cn/google-link-tag/深入了解流量来源（广告）的质量），现在已经是流量行业的标配。

另外一种方法，是直接给每个不同的流量不同的落地页，不想做不同页面的话，同一个页面不同URL即可。同样可以区分出不同的流量。这种方法用得少，但是在不能给流量做link tag的时候，这个方法很解决问题。

2. 查看各个细分流量的用户行为。

这些行为已经不能只是透过简单的跳出率来查看了。原因看我这篇文章：时光流逝，互联网运营的经典指标还剩下几个？www.chinawebanalytics.cn/times-fly-and-kpi/。

我们需要看更加具体的用户的行为，诸如点击的分布，设备的分布，地域的分布，时间的分布，互动时间与参与状况等。显然，大部分效果类的作弊，都很难真正的模拟人的行为，所以，发现作弊其实真正无敌的方法，就是看这些流量的行为是不是“真人”。没错，利用一定的方法，你肯定能分辨出来。具体看我这篇文章：信息流投放没效果？可能不是你自己的问题！www.chinawebanalytics.cn/xinxiliu-traffic-secrets/，在这篇文章中，你会看到出现严重问题的流量是怎么被发现与证实的。

3. 查看流量的行为演进过程。

作弊流量和低质量流量的共同特征，就是它们不会往交易的更深处“演进”。对于转化需要多个步骤完成的业态，这个方法尤为有用。这些流量集中在落地页，但是停留在这里，不再继续发展。这些流量背后一般不是机器，但垃圾无效流量较多。

行为演进的细分与分析，还能够帮助我们发现一些客户端的劫持。典型特征是，当流量演进到购物车或者支付环节的时候，就不再继续进行下去了。而另外一些流量则莫名其妙的以购物车或者支付环节为落地页。不过，有一类效果作弊基本上没有办法能够被找出来，即互联网基础通信服务端发起的劫持。唉，当一个流量一出现的时候，就已经被人从头到尾改换了门庭，而且还是从互联网基础设施的角度改换的。那就真心没办法能查能堵了。正因为如此，这一类作弊，是目前效果类作弊的最严重的，屡禁不止呀（关键也没有任何强力机构会禁止这种抢钱行为）。虽然说你不能真正发现这类作弊，但还是可以“能感觉到”。比如，当你真的停掉那些ROI很差或者“毫无作为”的流量了以后，那些看起来本来很好的流量渠道也应声下降。

发现品牌类作弊

品牌类的作弊，按照AdMaster上面的数据，大约三分之一的流量有问题。

品牌类的作弊的发现，较效果类要困难。直接原因，品牌类广告的目标是影响消费者的心智，而不是直接作用于消费者的行为。

可是，直到今天，也没有什么特别有效且高效的方法去衡量消费者的心智变化。因此，品牌类广告的投放，在作弊方面天然“有优势”。

发现品牌类投放的作弊流量，主要有如下方法：

1. 查看Click和Impression的频次。

Click的点击频次应不高于1.1，而1.2以上基本上存在很大问题了。Impression的频次作为指针相对比较弱，但如果发现有局部IP普遍频次超过10，那么虚假的可能性也很大。

2. 与效果类类似，如果流量有落地（网站、app、小程序之类），那么查看流量的行为。

这一块，我经历了有很多有意思的故事。比如，早些年，某些垂直媒体贡献的流量极为巨大，但是跳出率极高。若干年后，有一些不明渠道的“运营商弹窗”流量，也是每天海量流量，但是却几乎没有任何在页面上的行为。

还有很多app的下载推广，app确实也下载了，可是从来没有见过激活。或者激活了，从来没有见过使用。这些都是典型的机器流量。

3. 利用第三方黑名单。

比如，AdMaster有这样的黑名单，在对广告进行监播的同时，会查看浏览广告或者点击广告的IP、device ID、cookie等。这种方式目前也是主流的发现品牌端作弊的方式。至于怎么知道这些IP、device ID或者cookie后面的流量是作弊的，主要的原因在于，这些监测第三方收集的数据比广告主要多很多，因此，更容易察觉出异常的行为。

图：上图是AdMaster的一个案例，关于作弊流量的cookie与IMEI号的特征

4. 借助具有公信力的第二方DMP。

如果能够拿到广告投放之后的覆盖人群的device ID或者其他ID，那么你也可以将这些数据上传给阿里品牌数据银行或者腾讯DMP之类的第二方DMP（请注意，很多人认为他们是第三方DMP，但实际上中国基本上没有严格定义上的第三方DMP，如果大家感兴趣这个话题，欢迎到我这个课程上聊：宋星深度公开课：数据和大数据驱动的智能营销与运营（8月19日北京）www.chinawebanalytics.cn/beijing-big-data-marketing-20180819/）。之后，你能看到这些人群的ID与第二方DMP的ID匹配率往往很低，而且就算有匹配，人群的数据也完全驴头不对马嘴。

5. 爬虫。

这个方法主要用来检查那些定向投放的视频广告是否“作弊”。简单讲，视频广告尽管一般不会提供固定的广告位保证，比如我要投放某个节目前面的前贴片，这种媒体是不会承诺的，但是媒体还是会承诺节目类型，比如投放在美剧，或者投放在社会新闻之类。不过，媒体不会提供具体的投放位置的URL。解决这个问题的方法很简单，第三方追踪广告投放环境（页面）的URL，并且分析这个URL页面具体的内容是否与承诺的节目类型的内容符合。上图：通过爬虫爬取投放广告的页面的内容，与实际承诺的投放定向内容相比较（来自AdMaster的案例）

这种方法其实对于程序化广告的投放基本上都是比较适用的，本质上程序化投放的品牌安全性也是来自于这种方法。

6. 移动端：利用其他硬件识别信息。

这个方法也需要第三方帮助，但是道理很简单：作弊设备不会随着人到处跑，因此它们的硬件识别信息，尤其是网络环境相关信息、LBS相关信息等，基本上处于永远不变化的状态。这样能够帮助发现可疑设备。

7. 反模拟器与反肉鸡流量。

另外一些作弊用的模拟器或者肉鸡之类。模拟器和肉鸡仍然是机器，因此，它们的行为与人的行为实在有太大的差别。但由于品牌广告的投放，有时候并不看受众的行为——只是为了获取曝光，那么这种情况下，仍然需要依赖于第三方帮助识别。第三方识别这些肉鸡的方法有几种，包括利用特征库做相似性学习（有点类似于机器学习，用现有的肉鸡库或者模拟器库里面的机器行为比对被测流量的行为），做这些流量的行为特征分析（第三方能够有一定的跨域追踪这些流量的能力）等。

总体看，随着流量进入下半场，流量的价格变得更贵，作弊的情况只会变得更加复杂，而不会更加简单。流量作弊识别已经不再是仅仅查看流量访问行为本身，而不得不通过技术把它们作为一个具有更长线行为的“人”来看待，方能知道它们原本“不是人”。

作者简介：宋星，纷析数据创始人，国内互联网营销和运营数据分析与优化最早的从业者，说他是这个领域的开创者绝不过分，他也是网站分析和互联网营销分析在中国公认的布道师。

他所创建并全文撰写的“网站分析在中国”博客在国内互联网行业中脍炙人口，很多文章被广为分享转载传阅，10年内获得了超过200万人次的阅读。

宋星也是百度特聘专家和钻石讲师，阿里巴巴友盟+特聘顾问以及Google mLab特聘顾问，北京航空航天大学软件工程学院特聘教授。

他创立的网站分析在中国、WAW中国和互联网数据官均在业内享有盛誉。

关于宋星的更多介绍，请移步这里：http://www.chinawebanalytics.cn/about_author/

生命不息，作弊不止：怎么发现自己的流量被人做了弊？

到底作弊有多厉害？