数据驱动的
互联网营销和运营

ICDO专访神策数据桑文锋:私有化部署解决互联网数据营销采集和分析难题

互联网数据官(iCDO)专访互联网数据掌门人,是互联网数据官(iCDO)的重磅专访栏目。这个栏目与中国最优秀的互联网数据公司的掌门人对话。听他们对行业的观点、对数据的理解、对客户的观察,以及,对增长的思辨。

我们已经先后采访了国双(中国第一家也是唯一家Nasdaq上市的互联网大数据公司)、铂金智慧、神策数据、Data MIP、QuestMobile、秒针等公司的创始人。如果您的公司也想被采访,欢迎随时跟我们联系!

 

第一部分:关于神策数据的“特立独行”

iCDO:之前文锋也是百度的技术高手,一直在为百度的底层数据提供技术服务,什么原因要从百度离开,并进而创立了自己的大数据公司呢?

桑文锋:我在百度工作八年,从2007年进入百度到2015年离开。这八年里有七年多的时间,都是在做数据这块的工作,所以对数据非常有激情,也很有感情,更有“感觉”。任何老百度人在选择离开百度的时候一定是非常纠结的,我也不例外,毕竟是百度给了我们一切。不过最终考虑离开百度有两个原因,一是仍然希望能够有机会去尝试不同的事情,希望能在不同的领域去发掘自己的技术能量和潜力;另一个原因是我始终认为数据是最有价值的资产,所以觉得自己何不做一些能够让数据直接产生价值的东西。

其实最初还是想利用数据做一些2C的事情,并不是一开始就想做2B,因为觉得2B主要是靠关系去拿客户,我们做技术的哪儿有关系呀。所以一开始完全考虑的是做2C这块。

正好那个时候,我的一个发小给我打电话,问我要不要一起做一个相亲网站,他看好相亲这个事情,因为今天“光棍”和“剩女”确实很多。我从数据的角度上想,相亲也不错呀,做一个相亲大数据,用数据技术解决匹配问题,是一个不错的方向。

不过,后来仔细想,这个市场不够大,就算我做得很成功,做成TOP1又能怎么样,估值也不过1.5亿左右,不是一个大事感觉。

包括创业过程中和一些投资人碰撞,和我们几个小伙伴碰撞,决定还是要做一个能够让数据直接带来效果的产品。我们经过了非常多的论证,也研究了各种可能性,最终归结到一点,我们决心做一个可以私有化部署的数据产品,一个可以私有化部署的互联网用户行为采集和分析产品,或者可以简单的理解为,我想做一个私有化部署的Google Analytics。

为什么这么定位?因为GA毕竟是统计分析领域做的最好的,市场份额至少是最高的。但为什么我们跟GA不一样,我们要强调私有化部署呢,那是因为2014年我在百度的时候,曾经做了一个项目,就是要把百度的这种大数据能力输出到外面的一些企业去,但在沟通的过程中我发现,我们想让这个客户把它的数据放到百度的平台里面,其实很难说得动,比如有一些银行啊,还有一些大企业都不愿意将自己的数据纳入第三方。那时我就想,如果我以后出去创业,一定要支持私有化部署。

iCDO:私有化部署很显然是神策数据与其他同行的一个显著性的差异点。互联网数据官的读者朋友们也有人专门建议我问文锋,你们跟其他类似厂商(比如GrowingIO,诸葛IO等这样的公司)有什么显著的区别。很显然你的答案肯定会是私有化部署。不过,私有化部署并不是大家的共同选项,反而是神策的一个“特立独行”之举。企业数据系统的私有化部署,其实是有很多困难的,比如,部署本身很难,此外,部署之后的维护、升级,用户的灵活性等,都有很多难关要克服。神策为什么有“勇气”瞄准私有化部署领域呢?

桑文锋:是的,私有化部署并不是一个普遍选项,所以我们才更要选择这么做。当然,我们不是意气用事,我们做了很多分析,而且也结合了我们自己的很多优势。

14年底15年初,SaaS是非常火的,因为它有两个明显的好处:维护成本低、掌握企业数据。但我对这个的看法不同:首先,维护成本是能用技术手段来解决的,包括如何更好的维护分布式这种复杂的系统,并让其健康的运行,这些对我和我们这个团队来说不是一个大的问题;其次,就掌握客户的数据这点来说,在国内大家对数据安全还是比较顾虑的。你拿到客户的数据,客户难道就不知道很重要吗?我们还是要从客户的需求出发,提供私有化部署,客户不用担心我会出卖他们的数据,因为我们不会获取其用户的数据。

我们从成立以来定位就是做私有化部署,私有化部署的客户在我们客户里面占2/3。像中邮消费金融、聚美优品、秒拍、小黄车等等,都是我们私有部署的客户,其实这些标杆类的客户一般选私有化比较多。

iCDO:有没有友商跟进呢?如果他们也在做私有化部署呢?

桑文锋:我是这么看这个问题的,就是一个策略如果有效,对手不可能不跟,但是私有化部署对技术的挑战还是很大的。举个例子,SaaS方式就像依山建一所房子,然后客户要求在平地上再建一套房子,怎么办?你直接把那依山而建的搬过来,最后可能就是个缺胳膊少腿的房子,这里的问题是维护代价就比较大。所以对原本只做SaaS要转成私有化部署的情况下,技术上本身的挑战就很大,而神策因为一开始定位就是私有化部署,从开始就建了帐篷,不管在山上搭还是在哪里搭,都可以很好地去支撑。

所以从这一点上来说,即使有竞争对手也去支持私有化部署,我觉得跟我们这种方案的成熟度一定不同。比如部署周期,我们部署周期会比较短,单机版远程部署仅需30分钟左右,集群版也仅是1~3个小时。另外,维护其实是一个更大的环节,我们部署方案出问题的概率非常低,即使出了问题,我们也有完善的处理方式。所以看似简单的一个私有化部署,想要真正把它玩转,要把这些分布式的服务做好,这本身就是神策的一个优势。

iCDO:但关于私有化部署,争议是很多的,所以,您是否也认同业界所说的私有化部署的弱点?

桑文锋:私有化部署总体来说维护成本会比SaaS高,但我觉得最后是要看投入产出比的,你只要能够划得来就可以了,同时,我们神策数据不追求低价,我们更认同711便利店的理念,就是在相应价格上的物有所值;其次,私有化部署无法拿到客户的数据,但是这一点对神策的定位来说并不是问题,因为我们立足帮助客户打造数据根基,而非获取客户数据。

iCDO:可是私有化部署毕竟比SaaS要复杂,这是物理决定的,你得在客户的环境中一个一个去做,很难规模化。你们有什么更好的方法去解决这个问题?

桑文锋:是有更好的办法的,这里包含两点:一是产品和部署环境要标准化,如果你去部署的每家都是独立的一套,并且有很多定制化的需求,那你处理起来每一个都是独立的样本,维护代价就非常大,所以我们要求产品和环境的标准化,后续的维护就可以标准化的处理;

二是我们本身系统里面有专门的自动化运维系统,是中间很重要的一个环节。其实对于大数据系统,很多时候大家仅关注数据“如何采,怎么传,怎么存,怎么查,怎么可视化”这五层。但实际仅有这五层还不行,额外还得有三块:监控、元数据、调度器,要把这些东西结合起来才能稳定地运行,比如某一块是数据采集出了问题,还是传输出了问题,还是查询出了问题,并且它有问题的时候可以自动恢复等等。所以这些东西真正做好才是维护性比较强的。

iCDO:每个企业的生产环境和营销环境可能都不尽相同,既然要做私有部署,那么意味着肯定存在相当繁重的定制化工作吧?

桑文锋:这里面就是定制化的问题,首先我不相信一个SaaS类的软件或是一个分析工具能够解决你所有的问题,我甚至觉得SaaS类和分析工具仅能解决一少部分问题,还有许多是需要个性化独立处理的。神策提供的是PaaS+SaaS模式的服务,我们将数据底层建好后,客户可以在此基础上做二次开发,并且我们面向的客户大都是互联网公司,本身就有开发能力,做二次开发并不难,这也就很好的解决了个性化需求的问题了。

(iCDO互联网数据官解释,什么是SaaS,什么PaaS,SaaS是Software as a Service的首字母缩写,即“软件即服务”,PaaS是Platform-as-a-Service的缩写,意思是平台即服务。 把服务器平台作为一种服务提供的商业模式。)

神策希望帮助客户建立数据根基,用windows做类比来说,windows作为一个操作系统做了两件事情:一是对各种硬件、CPU、内存、磁盘、网络等的管理,二是它提供了一层API,可以让第三层应用层开发QQ、outlook等应用。

对比神策来说,首先是把各种各样的数据源采集回来,建好底层;其次提供PaaS平台方便用户二次开发;第三层就是各种应用了。大家普遍看到的神策分析的部分,只是一种应用,基于这个PaaS平台同样可以去做推荐,去做推送,去做风控或是做其他挖掘都是可以做的,从这三层去考虑,对于windows做类比的话就更能清楚神策这个价值了。

iCDO:为了能够实现这种私有化部署及定制,神策肯定需要深入客户的业务,对客户的业务进行梳理之后才能进行定制吧?如果是这样,这种深入业务进行梳理工作的一般周期大约会是多久?

桑文锋:是的,肯定要对客户的业务进行深入了解和梳理。时间周期一般在半天到两天左右。因为互联网产品还是会垂直分类的,比如互联网金融是一类,电商是一类等等,每个类别下都是有共性的。如果没有共性,每一个都是独特的,那这个代价实在是太大了。一旦掌握了这种共性,我们能对每一家都是独特的,但对我们自己来说,是可以更高效的去解决问题。

所以进一步说,如果每一家都建自己的数据团队,然后去摸索,其实我认为并没有发挥出团队的威力,这也是我去年的时候写过一篇文章,就是在大数据时代,每家都需要一个大数据部门吗?其实是不需要的,这就好比在电气时代,每家都要做个发电厂吗?其实也不需要,你可能更多的时候需要的是能够把电用好的一个人就可以了。

第二部分:关于行业和客户

iCDO:你怎们看待今天的企业在数据使用上的痛点?比如,大家现在对于数据普遍比较重视,但是实际上你会发现很少有企业真正很好的利用起来了数据。

桑文锋:这里需要从互联网公司和传统公司两个角度去看:互联网公司一是采集数据的方法有问题,对数据源的重要性意识不够,比如我们最开始的时候不管数据源头是怎么样的,然后通过在中间做复杂的ETL,再建立数据质量管理,等我们做了几年之后发现这种思路有问题,不管怎么做就做不好,所以我们痛定思痛,这也是我在百度很重要的一个心得——就是数据源很重要,我们需要从源头尽量让数据规范标准起来。比如之前我在百度做的数据采集审核系统,每次变更一个字段或变更一个什么东西都能去审核管理起来,从源头去结构化,让源头不放水,源头放水了后面就很难做,这是第一个数据源的问题;

二是数据采集的优先级问题,数据工作在团队内的优先级不高,数据团队推不动工程团队,比如数据采集需要工程团队和数据团队打配合,往往工程团队忙着迭代功能,数据的优先级就会被弱化或是应付了事。所以我们现在跟一些客户去沟通的时候,一般尽量找那个能够调动工程团队资源的人,因为只有他认可,才能把这个事情做好。

从传统企业来说,同样归结为两个问题:一是IT化程度不够,IT化是数据化的前提条件,数据没有采集的温床,也就没有根基;二是数据意识不强,虽然认识到了数据的重要性,但在实际工作中,仍然凭感觉做事。

iCDO:所以是不是其实客户可以分成两类?一类就是他已经意识到数据的重要性,也懂得利用数据去提升效率和效果,但是缺少好的解决方法,即意识已经到位,能力有所欠缺;另外一类是可能连意识都还没有到位,希望通过大数据解决所有问题,并希望尽快看到高收益高回报?

桑文锋:我是这么看的,越初级的客户越会是第二类。认知比较浅的话,要的东西就会越飘,越要求高大上。就像现在人工智能比较火,越是不懂的可能要的越是天花乱坠,懂行的更清楚如何可行的看某一个问题,部分利用人工智能,部分利用正常的IT系统,按人配合去把它做好。所以从这点上来说,我觉得如果一个客户他要的很荒唐,这也是需要我们这样的数据从业者去引导他们的地方,我们不能被客户牵着走,我们本身是需要普及整个数据化进程的。中国这种数据化进程是一步步往前走的,但是现阶段底子还是很差,所以这也是我们为什么将“建立数据根基”作为神策定位的原因。

iCDO:神策现有的客户中,哪些会比较接受数据驱动运营的理念?

桑文锋:目前的客户可以分成三类公司:一类是BAT还有硅谷回来创业的公司,这种公司就是在挑工具,只要工具能够解决问题就可以,不需要讲理念;第二类是其他类型的创业者,之前没有数据驱动的理念,这个时候就需要我们去灌输整个体系了,包括他在实际工作中应该关心哪些指标,应该如何做分析等等;第三类就是互联网+企业,这些企业许多时候是高层站得很高,但是一线员工的意识和能力比较有限,这个时候我看到的这种特征是自上而下来push的,所以导致的结果就是执行周期比较长,当我们遇到这样的客户,会进行更多的培训,进而培育市场。

iCDO:现在很多用户会认为分析不能解决实际问题,中国现在更需要能够落地要执行甚至帮你执行的解决方案,您怎么看?

桑文锋:这个问题特别好,其实这是一个恶性循环,分析不能解决实际问题的最主要原因就是数据采集没做好,那后面的环节就都受影响了。许多公司在做数据分析时的一个很大的问题就是靠需求驱动,比如老板要一个数据,分析人员就处理一个数据,下次要了另一个数据,就再单独处理,根本没有数据体系的建设。

我们可以从四个方面来考虑这个问题:首先,我们要做好数据采集,这是根基;其次是做好数据建模,比如神策一直强调的一个模型,就是event-user模型,其实就是最重要的两张表,一张表记录用户做了什么,另一张表记录用户有什么属性;三是各种分析方法,比如漏斗分析等,界面上点选几下就可以实现,而不是让工程师花数周时间专门开发;最后是指标体系,围绕产品从拉新、留存、变现等各个角度来看,我们需要关心哪些指标。所以我觉得真正去建好一个数据体系,应该分成四层,即“采集、建模、分析方法、指标体系”

iCDO:您一直提到神策的愿景是帮助企业建立数据根基,这里其实很大程度上是对数据源的有效把控,但数据源在采集的时候,该采什么数据或者哪些数据是对公司有用的,这些问题神策是怎么考量和解决的呢?

桑文锋:我对数据有一个看法,数据这个事情想要做好是需要经验的,没有经验真的是很难做好,因为会不断的踩坑,比如哪些字段要采集,哪些不要采,然后该用什么系统,涉及哪些系统组件,其实都是一个一个坑。即使你想好了,然后推动业务部门去配合你,工程部门配合你开发,业务部门配合去用,其实这里面都是一系列的坑。

这也是神策的一个价值,神策是一个80%产品+20%咨询,我们有一个强大的分析师团队,还有一个客户成功团队,基本上就是分析师团队在部署之前会帮助客户去梳理他的业务,然后围绕业务里面有哪些关键的行为事件,事件里面涉及哪些关键的维度,再去决定部署,只有这样的话,才能把这个底子打好,否则你凭空产出分析或工具去用,可能也只有10%的功能客户会埋单。

iCDO:中国人很着急,花钱买了你神策的东西,或是Adobe的东西(比如Adobe Omniture等),就希望能够立即看到效果——能够马上看到企业组织在工作流程或方式上的改变;另外一种心态则是,我花了5万元买了你的产品,你的产品必须给我带来超过50万额外的销售作为回报,否则你的产品就是“忽悠我的钱”,您怎么看这个问题?

桑文锋:我是这样看的,中国确实有一个大的背景,就是中国的人力便宜,在这种情况下,大家许多时候能用人顶上,干嘛还要用你这个第三方工具呢,还得额外花费成本,然后大家就不愿意为效率付费,这是一个问题;另外一个问题是流量很便宜,许多时候获取流量太容易了,粗放型的也能活得很好。

但现在我觉得这两个条件都不具备了,已经被打破了,首先人力变得越来越贵,就拿咱们数据分析这个领域来说,招人非常困难,很难招到合适的人选;其次,流量红利没了,做广告带来的收入又不是纯利,亏多少就是一个问题。所以从这些因素就逼迫着互联网企业要精耕细作,要挖掘好已有的用户群,并想办法把它利用好。

所以在我看来,互联网统计分析其实经历了三个阶段:最开始是流量阶段,这个阶段大家只关注访问量就够了;到了第二个阶段,是用户阶段,我们开始关心DAU、MAU等一类指标,但仍然不需要深挖;而现在我觉得已经是第三个阶段,就是订单阶段,我们要关心一个用户怎么转化进来的,来了之后怎么去盘活他,所以整体数据分析的需求都变强了。

同时,确实如你所说,我们希望尽快看到效果,这也是一种趋势,而且我觉得最后按效果付费会占到很大的比例,虽然这个过程比较着急,但我觉得一定会进入这个阶段,可能还需要3~5年的时间。

iCDO:目前Sensors Analytics采集的数据主要是用户行为数据,其他类型的数据也可以采集吗?比如业务数据,线下数据等?

桑文锋:都是可以采集的,比如客户的业务数据,线下数据,服务端数据等,这些数据都能采集过来。从我们的理念上来说,大数据总结成四个字就是“大”、“全”、“细”、“时”,这里面的“大”主要指宏观的大,实际采集上我们并不用关注它;“时”指高实效,实时的数据,这个我们一般也忽略它,我们更多的是考虑一个“全”,一个“细”。其中“全”,就是指多种数据源,不管是客户端的、服务端的、线上线下的、或是各种设备的,将数据全量采集。其次“细”,就是强调多维度,采集过来用户一个提交按钮,用户一次浏览,他相关的维度“who、when、where,how、what”信息也采集起来,这才能建立一个好的数据底子,之后的分析也会变得容易很多了。

另一方面,这个数据不一定是来自于APP或是服务器模块,也有可能来自各种各样的传感器、视频、麦克风等等,未来是一个传感器时代,或者叫物联网时代,不管是虚拟的还是物理的,这些数据我们都应该去做采集,这个阶段一定会到来。

其实,这也是为什么,神策数据的英文名字是“SensorsData”,就是传感器数据嘛。我们认为未来一定是传感器的世界,神策也在采集传感器数据方面做更多的工作。

iCDO:会不会存在客户不需要你去采集数据,他采集好的数据提供给你们,然后你们来为他们做预处理?

桑文锋:我认为未来会有的,因为数据采集手段是多种多样的,我觉得以后通上电的这种设备,各种各样的传感设备都能采集到数据,比如就像我们看这个灯泡,其实它是在60赫兹以及相关条件等作用下在闪烁,这里面也会涉及数据,以后也可以采集到,而如果客户已经有了这些数据,交给我们的就是如何建好数据仓库这一块。即使到了一个新的阶段,对于神策的定位来说,我们还是要帮我们的客户把数据根基建好。

iCDO:有一些企业比如说像Martech(Marketing Technology)这个领域,他们会直接把数据输入到应用场景中去,用机器规则来实现一些业务上的操作、管理和应用,神策有准备做这个吗?

桑文锋神策是处理数据流的,不会做流程与控制。但是神策是能够给这些系统提供弹药的,比如神策有用户分群的分析功能,我们可以把满足某些条件的用户抽取出来,并提供到对应的营销系统里面去使用它。所以这些公司其实跟神策去结合起来,是可以事半功倍的。

iCDO:中国的商业环境是这样,大家更重视应用层面,会轻视后台的作用,您怎么看这个问题?

桑文锋:我相信其实美国也是一步步迭代出来的,我们现在看到美国互联网环境很开放,接口很开放,大家都是组件式的,但我觉得在六七十年代美国刚使用这种大型机的时候,他们也是做全套系统的,但是后来竞争越来越激烈,就会要求你做好某一块儿。这是我比较认同百度的一个理念,把事情做到极致,你可以少做一点,但是要把它做到最好。我觉得开放只是时间问题,可能就这3~5年的时间。到那个时候,后台的作用大家不仅不会轻视,反而一定会成为刚需。

iCDO:预测下五年后的神策,您希望是什么样?

桑文锋:五年后的神策,我希望完成了愿景的70%。神策的愿景是希望花十年的时间重构中国互联网的数据根基,现在神策做了两年了,服务300多家客户,离目标还远,但这个速度是指数级增长,是会越来越快的。

iCDO:希望神策早日达到自己的目标。感谢文锋!

桑文锋:谢谢!

 

未经允许不得转载:DigiMaxDigiMax » ICDO专访神策数据桑文锋:私有化部署解决互联网数据营销采集和分析难题
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址