告别小时代,大数据为我们带来了什么?

告别小时代,大数据为我们带来了什么?2014年4月20日,在“改变的年代:现实与远见”中国绿公司年会的“大数据”变革企业经营与管理圆桌论坛上,蒋锡培、刘积仁、王均豪、冯军、王文京等企业家岛邻,就大数据对企业的经营和管理都会带来哪些变革,又会带来哪些管理模式和商业创新等问题进行了分享。
大数据在商业及管理模式上带来哪些创新?
王文京(用友软件股份有限公司董事长兼首席执行官):大数据对企业的经营和管理都会带来哪些变革,或者带来哪些管理模式和商业创新?
刘积仁(东软集团股份有限公司董事长兼首席执行官,正和岛岛邻):大数据和经营之间的关系,肯定是创造价值,创造过程中有个特点,第一是它的准确性,通过这些数据分析能够准确的识别目标,包括谁是你的客户,客户的属性,是男的还是女的,今天买什么,明天可能买什么,过去消费习惯等,为你很快、很准确的掌握客户十分重要。大数据不是大,是有意义的意思,当你获得更多有意义的数据、大的数据,这是判断基础。第二个基础,当这些数据来自于跨越了某一个行业的界限的时候,使得这个数据的价值更加大,一个人天天到酒吧的信息和到医院彩超做了肝的扫描的信息结合在一起,是可以判定出他肝的问题是喝酒造成的还是别的问题造成的。这个关联性,现在很多数据都是孤岛,当这些数据关联越来越联系起来的时候,这个问题就使得我们的判断更加准确。
还有一个特点,每个人主动的贡献数据的时代。这个事很多人不认同,我对数据不是主动的控制,肯定是别人给我收集的,你就不用信用卡,不拿手机,不用导航,不跟人家打电话,不在网上发微博,把所有东西都关了,你就不是贡献者,只要你开了,一定是贡献者。在社会平台上,个人主动暴露信息的行为,已经变成了一种交易。如果行业之间的数据界限被打破,就可以精准到人的性别、年龄、消费行为,过去和未来,通过大数据能算准客户的消费行为。
如果能做一家公司,它对数据敏感了,对它的创造价值的大数据机会掌握了,就应该把大数据当做销售的手段。低成本,就是节省钱的手段,是你能够用最短的时间,快速的收取客户群体的手段,这些如果能掌握清楚,对企业有极大的好处。
忽略了数据,就忽略了成本,忽略了速度,忽略了精准,当然你也就没戏了。
王均豪(均瑶集团总裁):未来,大数据可以让企业从战略角度更准确的预见未来,或者从市场营销阶段,更精准的营销客服,这是大数据对我们整个企业之间息息相关的很重要的数据。拿到大数据之后,还要分析,我相信未来大数据的分析师这个职业会很火。
1990年包飞机的时候,那时什么数据也没有,我跟我哥(王均瑶)在房间里按计算器按了一个通宵,大概算一算温州有多少人在湖南,也是用的大数据,当然准确率有偏差,但是通过各方面的努力还是做起来。后来有市场调研公司出来,当然通过电话访问也好,入门访问也好,采集了很多行业需要的数据,准确率也没有那么精准。
现在这些大数据,无形当中自己的行为习惯是真实流露的,今天买什么东西是真实的,这些数据绝对是准确的,最重要的就是企业如何把它精准使用。如果真的要准确,应该把行业数据或者把政府的数据纳入进来,一起去思考。我们下面有家公司做个人征信系统,把政府各个部门所有的公民信息集合起来,然后做一个征信系统,改变中国以后诚信社会的问题,以后不诚信,这个数据马上就体现出来了。有些中小企业可能用不上,但是要把公共数据如何赶紧对接进去,这是必须要做的,打个比方,上海已经开始做征信系统,在上海的企业,如何把上海的消费者用征信系统,这是必须对接的。
蒋锡培(远东控股集团董事局主席):不管信不信大数据,它已经到了我们身边。作为企业的人来讲,必须去面对它,接受它,让所有的人理解,这是不可改变的趋势;第二,怎样用它?因为做企业,信息就是财富,现在叫数据就是财富。
远东有志于成为一家全球能效管理专家的企业,也有志于成为全球投资管理专家的企业,这两个定位毫无疑问,需要有数据的支撑。我投什么样的企业,要了解这个行业、这个企业相关的经营成果,未来空间,客户群体等。远东要跟电子商务融合,现在的平台有大量的交易数据,有材料交易的,有产品交易的,少不了。还有我感觉现在想到了,但有些还要做到,特别是政府要做到的。宜兴是全国经济最发达的城市之一,每年在数据方面的投资有好几个亿,这是政府要投的,不包括企业,怎样做一个智慧城市?当了解到宜兴在这方面已经很超前的时候,他们感觉尽管如此,后面要做的事情很多,但是有一点,卫生部门做卫生部门的事情,公安做公安的事情,教育做教育的事情,所有的数据并没有做到一卡通,那个时候我想为什么不能有一个部门来扎口呢?为什么还有这么多壁垒呢?
真正要让每一个企业,每一个地方能够打通,要精准用它的时候,还是要做一些研究的,这样使得我们的成本更省,无论是交流成本、机会成本还是其他方面。像远东这样的企业,毫无疑问,必须面对这样的时刻,而且要领先,至少在从事的这个行业领先,要用好大数据。另外,关键还是要有这方面的优秀人才,我们原本将近一万人的公司,通过制度优化、流程优化,再通过信息化的战略,省了差不多三分之一,造氧效率还要比原来提高20%,数据提供了太多的支持,我相信如果把它用好的话,我们未来会更加领先,而且效益会更好。
冯军(爱国者数码董事长):做实体经济的特别关心到底大数据跟我们是什么关系,其实大家更关心的是究竟跟企业能有什么直接关联。
一年前我也挺懵的,联想国际大厦楼上楼下全是大数据,全在这个圈里混着,我的理解,通俗一点讲,就像BAT怎么做大,三个企业都是针对它的目标客户群,用大数据去提供服务,做的精致,做的好。百度专心服务网民,网民想从数据里搜谁查谁。阿里巴巴帮助了网商,而且支付宝做了重大贡献,原来互相不信任,马云为这个事情做了重大贡献。
马化腾更厉害,满足了网友,成了沟通平台,直接抢了中国移动、中国联通的生意,大家不花钱免费打电话,一下又创造了价值,这里的数据库量太大了,很多人都招架不住。马化腾对于网友之间的沟通降低成本,对于整个中国的沟通效率提高,特别对于企业家上手机做出了重大贡献,因为在没有微信之前,企业家其实不上网,我调查的绝大部分企业家电脑摆在那儿是样子,员工天天在上网,但是企业家平常忙活,都在开会或者奔波,所以没有时间上网,但是现在手机有了微信之后,大家天天在微信上泡着,不管坐高铁还是等飞机,甚至上洗手间。
总之,(大数据对于企业)意义重大,因为有了网友的介入之后,沟通架高了。实话实说,一个是支付宝,一个是微信,这两个是中国现在率先走向世界的两个品牌,其它的都在仿国外,而这两个是咱们领先于世界的。
不管是中小企业还是实体经济,现在应很清晰自己该干吗。先别管别人,这三个老大在打架,他们提供了很多免费的服务,甚至现在是倒贴服务,这个时候从这个地方为自己行业的用户赶紧想好怎么利用好这个平台,把你的客户服务好就行了,这一点小米雷军做的非常好,跟周鸿祎打的一塌糊涂,免费软件,结果彻底转行,做手机。
老大在打架,他们提供的大数据不但免费,甚至有倒贴行为,这些大数据为你所用,做餐馆,服务好周边的客户,用互联网,基本上不用花钱,大家都争着抢着,只要用好这个东西,不懂不要紧,重用一个30岁以下的年轻人,让他给你汇报,让他盯着,你经验、资源丰富,两个组合,你当萨马兰奇,鼓励员工,好好干,将来没准当马云。你只要抓住两个字就行了,诚信,消费者特别简单,只要把诚信搞定,消费者就会跟你交往,不管是实体经济,餐馆还是美容院,只要把诚信问题解决,利用大数据为你所用就可以了,把事情越简单越好。
阎紫电(联动天意董事长):我从另外一个角度看大数据,其实大数据一点不奇怪,一点不神秘,但是随时随地都在现实中,因为网络的发展,包括光纤的发展,变得很快,变得对称了,立即、即时,所以成为大数据了。
我有一个观点,腾讯,现在的大数据或者现在中国这些巨大的互联网巨头得成功,是因为它抄了近道,大数据不是它的,是谁的呢?举个例子,最大的大数据拥有者是中国移动和中国电信,只不过它们不会用。
假设原来的设备制造商,比如IBM和华为是种茶叶的,中国移动是开茶馆的,把茶叶泡点水,说是龙井、春茶,一杯一百块,老百姓交一百块没什么,中国移动赚了很多钱,IBM和爱立信也赚了很多钱,这是原来的商业模式,大家很开心,特别是很多世界五百强的公司。突然来了一个马化腾,他把茶叶拿来之后,说我送给你,不要钱,水还用中国移动的水,中国移动很憋屈,原来一百块钱的水现在只能收二十块钱,但是说不出来什么东西,因为水还是用你的。
腾讯的微信部门有多少人?原来我以为它有上千人,我没去之前,因为都是我们的小兄弟,现在只有几百人,我不公布准确人数了。我很奇怪,有六个亿的用户,用了三年的时间,有几百人的团队。从技术角度来讲,如果服务六百万的用户,也需要几千人,最简单,有计费系统,打电话的钱得计下来,它只有几百人。
第二个问题,微信现在盈利了吗?我先不说答案,大家慢慢想。我觉得微信盈利非常非常容易,大量的用户,随便做点什么都能盈利。我认为现在的大数据是打劫者,它抄了近道,大数据一直都在,这是我的一个观点。
另外一个观点,我说两个不好的问题,大数据再往下发展,要解决两个最致命的问题:
第一是安全性,其实大家不知道,你们的身份,如果想知道,所有人的身份都会知道,你所做的事情都要小心点。像王总这种名人要小心点,其实它是不安全的,但是我们现在的维权意识和技术手段都不够,要解决未来大数据,所谓大数据再进一步发展的问题,安全问题要解决,怎么解决呢?我觉得不仅仅是技术手段,要立法,比如文章同志在香港喝杯茶,要立法,不能随便发照片,我觉得要立法。您的任何一个信息,如果有人关心,是都可以知道的,所以这件事情要立法。破坏国家法律了,给FBI送信息,这个事没问题。如果是个人问题,要合法。
第二是不平等,为什么?第一个,你的数据是你的财富,别人都拿走了,我说一点王坚博士可能不一定喜欢听,现在的数据不是大数据,现在是孤岛数据,都是信息的孤岛,是不公平的,为什么?本来我去阿里买东西,我买一个尿布,得把我的名字、电话全填进去,他知道了,但是我没有任何收益,特别多的尿布信息卖了,特别不公平。第二,对大企业和小企业不公平,大企业有大量的数据,但它是孤岛,我希望有的时候没有办法拿过来,巨大的流量,巨大的负流量费用拿过来了。
再提另外一个建议,有一天要做一个所谓大数据的交易规则,大数据应该可以交易的,可以交换的,有法律前提可以交换,如果这样能实现的话,大数据的未来是非常非常巨大、了不起的事情。
企业怎样通过大数据进行管理变革?
王文京:大数据是一个变革,是一个新浪潮,对企业的经营和管理会带来巨大的改变和影响,会使你的商业模式、管理方式、战略决策都会发生巨大的变化和创新,请每位嘉宾讲一讲,给企业家提一些建议,参加完这个会以后,企业回去怎么推进,怎么实施这个企业用大数据进行业务的创新,进行管理的变革?
刘积仁:首先,对数据这件事情的认识要有敏感性,或者说学习它。数据能够产生价值是少数人的行为,和今天做商业是一样的,但是我相信所有的人都不会这么认为。创业能够成功,是少数人成功,但是每个人都相信那少数人就是我自己,我认为不要被大数据迷茫了,大部分的数据意义是有限的,要抓住关键数据。第二,数据越关联越有意义,而关联数据本身就需要你的能力。第三,数据分析和计算的背后,是一个复杂的科学问题,大量数据的算法达到精准,是因为计算,而计算的方法学本身有的时候需要或者比数据获取的时间要多的多的时间。
未来,大数据的方法学和计算工具,就是一个云服务的东西,并不是每个人都要花时间来研究这些方法,中小企业真没有这个钱做这件事,包括客户行为的分析,有专门的产品,专门的工具,数据的获取,在哪拿到客户的数据?我十分清楚信用卡的数据很重要,客户买我的东西数据很重要,但这些数据并不在你手里,现在有方法拿到数据吗?这是数据应用的第一个问题。如果今天比较火,我希望大家能够客观的看待大数据本身事实上是一个十分复杂的应用,是在一般应用基础上的一种升华,是基于某些大量样本计算之后才有效的一些方法学,所产生的服务于目标的结果。
王均豪:如何融入大数据?从中小企业来讲,一个是行业积累,但是如何利用公共数据这块要赶紧做,打个比方,智慧城市的数据,征信系统的数据,包括有些公共数据怎样自己用,这是很重要的一点。
第二个,不管懂不懂,必须要去了解,因为它是我们生活的一部分,有两本书,田溯宁写的《大数据时代》,一般人都看过的,这是大数据时代大的宏观分析。我今天早上在机场看到一本书,大概是说“大数据的应用”,整个一套体系,这本书讲的比较清晰,这本书可以给大家比较系统的解决包括架构,包括各方面的应用,有些方法,逻辑思维,理论跟实践,这本书的名字我想不起来,大概意思是大数据的应用,大家看一下,对自己未来的发展很有应用。
蒋锡培:作为企业的决策人来讲,毫无疑问,一定要了解它的趋势,无论是经济还是社会的,把握好趋势,发挥你的优势,可能才能做成一些事情。因此,作为远东来讲,希望能够赶上甚至引领我们从事的行业去发展。
我们现在做的很多事情都是要由各个方面的资源集成的,包括像阿里巴巴,包括IBM,能够提供给我们哪些服务,有些事情不用自己去做,好好的精准分析,精准营销,精准管理等。另外,我觉得确实要打破这些信息孤岛,怎样使得我们花的时间成本更小,投入更小?有些事情可能是政府层面做的,无论是企业的征信也好,个人的征信也好,现在还是各自为战,没有从整个社会的情况来考量,花的确实太多了。最后,个人的需求,其实这门生意也很多,也可以做研究,无论是健康的还是其它爱好的等等,包括旅游等,都可以做。
总之一句话,做企业,包括经营人生,都离不开把握好方向,离不开建立一个很好的法制环境,确实是没有秘密可言,倒不是有多少秘密,但是真的有秘密的话,还要有这样的法规予以保护,否则确实企业没有知识产权,没有什么商业秘密了,最终也没有人去创新了,最后社会也无法可持续发展了。
远东现在的电缆网,一网两平台,是全球的门户网站,也是全球电缆交易平台,特别是电缆材料交易所,成为全球独一无二的交易品种的交易平台而成倍的增长,现代制造业,传统制造业,就是运用大数据,就是看上了马云、马化腾这样的企业快速发展带给我们很多的启示。我相信未来很多企业留的不会太多,尽管现在有无数中小企业,每个行业都有几千家,甚至几万家,一定在未来五年、十年里,90%的再也没有了,这是肯定的。
王均豪:90年代没有计算机的时代,我只能用计算器拍拍脑袋,现在肯定不行。现在小众的,黑天鹅事件,小众的会出来,数据跟大数据对接是相同的。
王文京:其实人类自从有了商业之后,就有了数据,数据不是今天才有的,三千年前就有会计系统,就有数据了。但是,今天各位嘉宾基本的观点,大数据是新时代,一个新的商业时代的开始,这个标志表明我们之前的商业时代,是一个小数据的商业时代,新的商业时代是大数据的商业时代。这个转变可以用王坚博士的观点来验证,原来人加小数据就可以做很好的商业决策,但是新的大数据时代是数据加机器,会超过原来的人加机器,这就是改变,这就是新时代的转折。
今天,成功的互联网公司,电子商务公司,无论是全球的还是中国的,都是利用数据,也就是利用大数据成功进行商业创新的先锋,他们是走在最前面的,是先成功的一批,但是更大的机会在于其它各行各业的企业,所有其它各行各业的企业都可以成为数据驱动的企业,都可以利用大数据促进我们自己企业的成功。
加入文集

水文管理和大数据让信贷扁平化

水文管理和大数据让信贷扁平化看过一本书,说的是the world is flat,翻译成中文,也就是《世界是平的》,讲述的是科技与互联网彻底改变了传统的商业与生活模式,让世界越来越趋平化。什么概念呢,也就是互联网提供了更多标准化的服务,并抹平了山川、河流、文化、政治、经济对跨国间交流的阻隔,最终让世界在互联网上实现了平等、开放的沟通。
站在这个角度,结合大数据对金融服务的改造和局部的颠覆作用,以阿里小贷为代表的互联网金融业态,正在通过数据化的标准来革新现有的金融服务格局,并让更多的弱势信贷者实现与优势融资方一样的,享受金融服务的权利。简而言之,大数据结合金融,正在让信贷与融资变得智能化。
大数据应用于金融的潜力
大数据与互联网的结合,是未来金融发展的方向之一。这里的金融,既包括了传统金融机构业务的电子化和数据化,更包括互联网金融机构在建立大数据平台基础上开展数据征信和风险控制的诸多衍生操作方式。大数据的特点是“动态,海量,多维度,相关性”,这也完全颠覆了传统意义上的数据以及由此产生的数据处理,样本调研和行为预测。
拥有数据,开展分析,这本是各个行业进行计划与生产,市场与营销的基础能力,但事实上,要么是缺乏有效的数据积累意识,要么是缺乏高效的数据平台和分析工具,中国的数据生态就是这样处在一个相对碎片化的状态,而且彼此难以连通。在这一方面,一个明显的案例就是金融运作数据的方式,金融的主要功能就是资金融通,让有效的资金流入有效的资金消化渠道,同时提高金融服务效率。
但是,就目前的金融整体效率而言,一方面是利率管制造成的资金供给与需求之间的结构性错配,另一方面就是融资过程中,对传统的线下抵押、担保模式过于倚重而复杂了本可优化的服务流程,也提高了金融机构进行数据验证和核定的线下调查与审核成本。也正是因为如此,出于成本与收益的边际效应考虑,银行在进行客户选择与分层定位时,往往更偏好于数据资料完整,资产负债状况明了的优质大中型企业,而对数据资料不完整,缺乏线下实物资产和抵押品的小微企业,往往是绕远道而避之。
核心不在于金融的二八定律,也不在于客户的道德冒险,核心在于融资方与借款人之间缺乏完整的,公开的,可以相互制约的信用机制。而这种信用机制,在缺乏大数据的信贷扁平化功能辅助的情况下,也只能通过相对更保险的线下抵押物担保来实现借贷双方的信用约束。
大数据金融起底:阿里小贷为代表的电商金融
什么是大数据,相信在互联网金融的这波浪潮中,大数据已经成为了金融行业的一个代名词。数据其实有很多的属性,而金融属性相对来说,由于能够反映数据相关方的真实资金、消费行为能力,也就具有数据价值化的操作空间,甚至可以成为一种资产。
“平台,数据,金融”三位一体的数据金融模型,是阿里金融对自身大数据金融的核心概括。大数据的积累是一个相当复杂而纷繁的过程,一般而言,目前国内可以具备大数据收集能力的平台,需要具备这么几个条件:
1、持续的平台运作和服务供给,能够收集跨经济周期的数据;2、数据需要具备频繁的流动和交叉,因此平台绝对需要具备流量基础;3、数据与自身服务存在有效的转化途径,如阿里小贷。从这三个条件筛选一遍,你会发现,当前最好的,也是最能够积累数据,进行信贷征信服务的,也基本上就是大电商平台了。银行虽然也是一个主要的数据积累源头,但根源在于银行缺乏频繁的客户接触和激发渠道,它的数据是活性较低的,是分时期和阶段性的,且缺乏一定的数据与服务的转化工具。
为什么是电商,又为什么是阿里金融为代表呢?道理很简单,电商所掌握的日常消费和支付数据,是目前活性最高的,频率最快的,与终端消费者距离最短的,同时也是应用场景,涉及行业最多的数据入口和来源。3月7日,阿里巴巴举办了西湖品学大数据峰会,当天阿里透露,在阿里数据平台事业部的服务器上,攒下了超过100PB已处理过的数据,等于104857600个GB,相当于4万个西雅图中央图书馆,580亿本藏书。
打个形象的比喻,这就像是一个大口径的吸尘器,把边边角角的,散乱的,不成规矩的数据点全部收集起来,然后集中处理,按照不同的行业、属性、类别、阶段进行标准化的数据仓储,并数据分析模型进行对接,结合最新的数据相关方的行为资料,进行历史和当前,未来的比较、分析、预测。例如,阿里小贷的一个风控模型需要分析数年里千万家淘宝店铺的近3万多个指标,并在这过程里摸索出解决2大世界级的数据分析领域难题的方法,即海量数据如何在云计算平台进行加工运算处理,第二个就是如何在3万多个指标里进行大浪淘金般的数据挖掘。
阿里金融,客观上而言,是国内最早开始做电商数据积累和金融属性挖掘的电商平台,也是2013年互联网金融的领军企业。阿里自身的B2B,B2C,C2C的电商生态圈主要的参与者是商户与消费客户,在长期的电商生态培育中,商户与用户通过高频的信息流、资金流、商品流交汇,为阿里的数据库提供了最详实的数据来源。可以这么说,阿里金融的框架,起源于电商信贷,并通过信贷端的数据处理能力的培育,慢慢扩散到负债端,也就是余额宝产品的开发。
现有国内主要的电商金融平台,在运作模式上也基本朝着阿里的全金融方向前进,也充分说明,大数据金融与电商平台结合,将是改变数据征信在中国整体融资服务中作用不足的一种可行路径。
大数据如何让信贷扁平化?
那么就阿里金融而言,大数据是如何实现了让信贷扁平化的?扁平化的几个维度又在哪里?
1、大数据解决了小微企业和信贷机构的信息不对称问题,提高了双方互信。在融资提供者和借款人之间,大数据起到了很好的媒介作用,通过数据这一客观资料来解决信贷提供者的调查和审批过程,并让小微企业获得了更好的数据化资信能力。
为什么大数据能够解决,而传统的信贷机制解决不了?一方面,存在银行金融机构信贷投放标准和小微企业借款人所能提供的标准之间的错位;另一方面,也存在对小微企业天生不良率高,服务成本大,违约可能性大的误区。
就第一点而言,商业银行作为传统的社会资金融通主体,在进行授信业务审核时,往往需要借款人提供标准化的企业和商户的运营资料,比如财务报表,利润表,资产负债,现金流水,以及其他有效抵押品作为违约的保障。这些常规的企业财务资料,对大中型企业并不是什么难事,除非是伪造和改动,一般而言都能符合银行前端的信贷审核标准,并按照贷前、贷中、贷后的程序一直往下走。但是,小微企业运营时间较短,企业财务制度不完善,也没有专门的资产管理能力,一般是提供不了这么详实的数据。这里就存在一个银行所需要的标准和小微企业所能提供的标准之间的错位。
那么,怎么解决呢,传统的做法是,要么把小微信贷的利率上浮30~50%,甚至200%,要么要求小微企业提供联保,或者足够的抵押品。要么就直接不做,放弃这部分所谓的“高风险”“低能力”客户,专门服务那些大企业去。
就第二点而言,在利率市场化未开启之前,阿里小贷为代表的互联网金融没有成熟之前,银行业一直存在着对小微信贷的误区,认为其成本过高,风险过大。事实却并不是这样,小微企业的风险主要集中于经济周期,风险也主要是由于缺乏良好的信用记录(银行信用资质难以获得)而导致的融资成本过高,近而挤压利润空间的风险。从阿里小贷的不良率来看,截至2013年6月末,不良率为0.84%,低于商业银行的平均不良率水平。这充分说明,小微企业并不是没有建立良好信用记录的能力,通过大数据管理完全可以实现小微企业的良好信用记录。
2、大数据的动态管理和监测,拉平了贷前、贷中、贷后的业务流程,提高了集约化管理的效率,便于灵活调整,及时处理信贷风险。
这里有必要比较一下传统银行与阿里小贷业务方面的触发机制与管理方式的不同。对于传统银行而言,贷款的前、中、后管理很大程度上是分开的,也就是银行内部的前台业务营销与中后台的风险管控之间的平衡。从触发的角度而言,银行是等客户有了潜在信贷需求和意向之后,才会要求企业提供标准化的财务数据资料,包括担保抵押情况等,整个信贷流程也从确定需求意向开始进行。另外,即便贷前业务岗已经把客户的贷款需求和资料上报至信贷审核部门,中台的审批效率和流程也是因人而异,因行而异,后台的贷后管理也一定程度上脱节于企业最新的发展状况。这就像是一个并不需那么高效的信贷链条,在各个时点之间存在一定的时间差,而这种时间差一定程度上成为风险的聚集点。
但是阿里金融等电商平台则基本不存在这种担忧。为什么,还是大数据和以数据为核心的信贷风控模型在起作用。
通过阿里小贷的信贷通用决策系统(A-GDS——Ali-Generic Decision Service)来实现对现有客户和潜在客户的动态化管理。借助大数据的分析,阿里小贷A-GDS系统将电商平台上所有的小微企业进行透析,根据其分析结果选择向风险可控的企业开放信贷服务,已然将风险管理前置。商户的历史积累以及最近发生的日常交易,资金流,订单,周期性变化,成交速度和频率都可以通过数据模型来获得非常直观的分析和预测,把静态的贷款变成了动态化管理,精准地把握商户经营和资金需求的走向,不仅可以指导系统完成自动化的信贷营销服务,如结合商户数据变化的授信调整、利率定价调整(即实现不同客户的风险定价)等,并可借助系统实现实时对商户经营监控,及时发现风险并预警。
从业务触发角度而言,阿里小贷的市场推广是无形的,融合与企业的日常运作之中,甚至可以提前预知企业的资金需求。这也就是说,贷款的一切前置程序通过大数据分析模型和固定的数据标准,已经积累完毕,只要商户有融资需求,系统会自动分析,完成贷前审核,并及时提供信贷资金。这样,阿里小贷的电商金融模式就实现了贷前程序前置,以及贷前、贷中、贷后的流程化,高效,动态运作,提供更便捷的小微商户授信服务的同时尽可能地通过技术手段降低了风险。和银行相对固化的贷款程序和贷后管理相比,基于大数据的动态模型通过技术和程序的设置,提高了效率并降低了风险。
3、大数据建立信贷模型,实现信贷资金投向的精细化管理,把钱给到最需要钱和最有可能使用钱的企业。
如同为一个亿万富翁开设一张信用卡,某种程度上,再高的透支额度都没有意义,因为他没有真实的透支需求。与其让其占用授信,不如把这笔授信分拆给到更多的所谓屌丝客户,因为他们有更迫切的透支需求。在现有银行信贷操作中,其实很多资金给到了并不缺钱的大企业,这些企业甚至再把这些资金以更高利率转手卖出。银行的钱并没能给到实体经济中最需要钱的企业。当然,这无损银行的收益,因为只要信贷放出去即可。
但对于信贷资源有限的互联网金融机构而言,显然不能像银行这么运作。如果这样,也丧失了互联网金融高效率的意义。借助数据,类似阿里小贷这样的机构,必须寻找出谁最需要钱、什么时候需要钱,需要多少钱,只有这样,其自身的信贷资源才能得到最优效率的分配,才能配得上其互联网金融的称谓。
从这个意义上而言,在阿里小贷的过百个核心数据模型中,最能体现大数据运用的水文模型,可以充分提高企业对资金的需求分析能力和阿里小贷对商户的精细化需求满足能力。水文交易预测的作用在于:利用水文变量,预测淘宝商户未来的交易金额,并有效剔除季节性波动影响,其核心在于大规模海量计算,在阿里云ODPS(Open Data Processing Service)的算法平台协助下实现了对商户资金需求的精细化管理和预测。
在这种动态的水文模型中,每家店铺的销售额就像一条条河道里的水文,会随着市场的热度、客户的喜好、卖家的运营以及季节周期性的波动而忽高忽低;此外,不同的淘宝店铺尽管销售产品千差万别,但可以根据行业、主营类目、星级进行归类划分,这就把不同商户的不同水位的产品和类别进行了市场化的对比,便于日后进行精细化的基于商品的信贷和细分行业的风险预测、信贷政策。此外,这种数据模型是对目前、未来企业资金流动和细分行业发展趋势的一种分析,可以和现有的细分行业、商户的贷后管理相结合,以提高动态化的贷后管理能力。
站在服务于实体经济的角度,阿里小贷的大数据分析模型:水文模型通过对细分商户和行业的资金、销售额的水文分布分析,以提高信贷资金的投放比例和最佳的投放行业,实现了提高服务于实体小微企业的金融效率,把最需要的信贷资金用在了最需要钱的商户上。这和“控制增量,盘活存量”的目标不谋而合。反观现在的大多数商业银行,在信贷资金的投向上,往往缺乏一个比较科学的监测和评价机制,往往是依据行业风险程度和行业周期进行,此外,大部分资金通过银行进入地方债务,房地产以及基建项目等主要的资金池,并没有很好得服务于底层的金融需求。这种资金投放的方式,相对比较粗放,也难以抗衡突发的行业经济风险,正如这几年频发风险的信托、地产、钢贸项目等。

大数据结合互联网,让传统信贷突破了信用机制的约束和借贷双方之间的距离隔阂,而是用大数据的方法和平台运作的方式,实现了信贷的扁平化,这种趋势在以阿里小贷为代表的电商金融中更明显。大数据在互联网金融领域已经开始了扩散,提高金融的透明度,建立集约化的流程化动态管理,提高资金与需求的精细化匹配,并最终建立良好的信用生态。大数据是一股推动金融自身优化、改良的革命性工具,而信贷扁平化,则是金融服务效率提升的体现。
金融分析师陈凯歌,财经专栏作家,微信公众号:samchenkai文章为作者独立观点,不代表虎嗅网立场

向作者提问

加入文集

阿里CTO王坚:脱离互联网与云计算去讲数据是个大误区

阿里CTO王坚:脱离互联网与云计算去讲数据是个大误区虎嗅注:本文是阿里巴巴集团CTO王坚在“大数据”变革企业经营与管理圆桌论坛上发言。原发新浪财经,虎嗅进行了摘编。

做大数据以前,对企业的影响可能还要追溯到互联网对企业的影响。要讲清,让大家理解大数据对企业的理解,有三件事情可能少不了:

一个就是互联网。互联网很热门的词就是云计算,就是大数据。原因非常简单,互联网公司一定是一家数据公司。阿里巴巴在2008年的时候开过一次会,突然发现不是电子商务公司,是数据公司,对公司非常非常大的影响。

第二个事情对企业有非常大的影响,当自己发现是数据公司,突然发现少了一个东西,少了把数据变成财富的东西,靠什么呢?就是靠云计算,必须用最低的成本从数据里面得到价值,才能活下去,所以大家设想一下,如果不能用最低的成本得到价值,是活不下去的,这是最基本的。

第三个明白了事情就是计算一定要变成公共服务,2008年开始,对我们企业来讲,用另外的角度来表达阿里巴巴,我们曾经讲过几句话,不上淘宝的人可能不太有,淘宝对中国社会最大的贡献不是让大家上去买东西,对社会最大的贡献是消费者的习惯在我们自己企业手里。消费者的习惯就是数据,这是倒过来看的。有时马云也会讲,公司是拿数据去卖东西的,阿里巴巴这家公司是卖东西,是为了数据,这是一个最基本的不一样的地方,也是我们慢慢慢慢过来的。

阿里巴巴做的小额贷款的事情,最体现了数据的价值,或者互联网数据,我先不说大数据,互联网数据的价值,过去要说贷款的话,银行最重要的是调查信用,要抵押,就这两个事。调查信用是传统的来看数据的方法,也可以讲这是数据,但是传统的,为什么它?它跟互联网无关。我们怎么用数据来变成一个企业的信用呢?用过去它在我们平台上沉淀下来的数据,不是我们去收集的数据,是沉淀下来的数据,这些数据过去是没有用的,但是因为我们把它变成模型,变成信用以后,就变成这家小企业的财富,才会使我们由300多个员工给70万人做贷款,这是数据的效用跟价值。

倒过来,对我们的组织结构的冲击是很大的,过去用这样的方法做事情,今天会想用另外的方法做事情,对我们的组织结构的冲击也是很大的。

我想表达的意思是什么呢?如果你今天讲数据的话,千万不要觉得大数据是从数据变成大数据的,不是这样的,其实今天实际上是一个把过去从所谓的信息社会变成了数据社会,可能这样讲更好一点。这句话是什么意思呢?过去因为没有互联网,因为没有计算能力,所以你能够得到的数据一定要大家觉得马上很有价值的东西,大家过去称之信息。

今天是因为有了互联网巨大的计算能力以后,今天你是可以得到很多数据,而不追求今天的数据价值,但是它在第二天可以带来更大的价值。从第一天起大家都知道数据,它是从信息到数据的转变,因为有了互联网,有了计算能力,大家可以设想一下第一天会要求拿到的是最有用的信息,但是过了两天发现,今天看起来没有用的东西变成了最有用的东西,谷歌是做的最好的例子,让一个点击,鼠标点一点可以挣几千美金,鼠标这个东西,在微软时代,多少人点鼠标没有人把它变成财富,但是互联网时代把它变成了财富。这是非常典型的例子,只收集信息,今天看来不会变成你的财富了,而去年得到看起来没有价值的东西可以变成财富,这是阿里巴巴自己很重要的理解。

今天我们对数据的理解,尽管有很多消费者喜欢,但是还很粗浅。我曾经跟马总讲的话,对我们自己公司反省,阿里巴巴对数据的理解还是非常原始的,另外一个角度讲,阿里巴巴对数据的理解不会超过苏宁对电子商务的理解。应该尊重苏宁集团,但苏宁对电子商务的理解的确不够。

讲这句话的意思是,大家对这件事情的认识还是很浅,我们对数据很尊敬,只是想表达一下我们在非常原始的状态,在这个行业,今天刚刚开始,严格上讲也没有专家,大家碰到的都是新问题,但是挑战不要低估了,走出两个误区,一个是觉得把过去的数据,过去谈数据,今天再谈大一点,把方法再搬过来。第二,脱离了互联网跟云计算讲数据,也是蛮大的误区。

加入文集

一次微博数据挖掘试验:鹿晗粉丝的七张画像

一次微博数据挖掘试验:鹿晗粉丝的七张画像鹿晗1990年生于北京,毕业于北京市外国语实验学校,2008年赴韩国留学,2009年通过了韩语等级考试后进入首尔综合艺术学校实用音乐艺术系。2008年在明洞逛街时被韩国S.M Entertainment公司发现,2010年进入该公司,2012年作为EXO成员正式出道。首张迷你专辑《MAMA》一个月销量超过十万张。如果这是你以为的鹿晗实力,那你就太OUT了! 百度贴吧里的鹿晗吧可是常年占据着霸主地位的哦,2012年9月10号,鹿晗私人微博里的第一条微博的评论已经达到了4,045,778条(截止到北京时间4月6号1:20),这可是目前单条微博的评论数的最高纪录, 在这个只有8条微博内容的账号里,评论总数达到了6408307(截止到北京时间3月15号)。
通过对鹿晗微博的640万评论和89万转发进行挖掘技术和分析,用数据诠释了一个不一样的粉丝群落。
“越小越大”,神一样的微博账号
2012年1月29号,鹿晗微博账号(M鹿M)第一条微博内容,更新了新浪微博iPhone客户端 后,到2014年2月1号,账号里总共发表8条微博,其中包括3条转发,3条节日祝福。发博间隔最长跨度为10个月,最短1个月。图片3张其中包括个人照片1张,视屏1个。显而易见,鹿晗发表的微博数量屈指可数,涉及其自身的信息量极小。

虽然只发8条微博,却有160多万粉丝,600多万评论,点赞87万之多,真是神一样的存在,神一样的账号!其在2012年9月10号转评的曼彻斯特联队俱乐部的一条微博,评论达到了300多万,达到了单条微博评论的最高纪录,其余的微博评论也基本都在10万以上。这账号在赤裸裸的诠释数据时代数据存储“越小越大“ 的特点么 。

微博粉丝画像
1)性别比例--女性不只半边天:160多万微博的粉丝群中,女性数量达128万,是男性的四倍。
常说女人是感性动物,男人是理性动物;女人们容易感情用事,男人们理性客观。EXO参加快乐大本营的录制,引得粉丝蜂拥而至,尽管那一期湖南卫视不售票只有分发有限的公开票,但是黄牛当依旧把收集来的票买到了12000元的高价。
2)年龄分布--90后是主力军:53%的粉丝是不超过24岁的90后,是粉丝群的主力军,他们喜欢新鲜事物,接受能力强。其中还有25%的80后的粉丝和11%的70后粉丝。总体来看粉丝总体年龄不高,以青、少年为主。

3)粉丝地区分布--海外最多,帝都第三:粉丝主要分布在海外,北京,广州,江苏和浙江,以东部沿海地区为主。其中粉丝最多的地点是海外,粉丝数占总数的11.39%,1.58%的男性粉丝都分布在海外,女粉丝中的9.81%也在海外生活。
其次是高端大气的广州。经济发达,社会开放程度较高的广州拥有的“鹿粉“数量在所有地区中排名第二,占比为10.61%,其中女性为9.70%,男性为0.91%。
鹿晗的家乡,大帝都北京排名第三,占比为9.55%,女性为8.18%,男性为1.37%。男性数量仅次于男性占比最多的海外。
江浙一带男性粉丝占比较少,两个地区男性粉丝总量为0.86%,低于广州。但女性粉丝占比达到13.01%。从数据中不难看出,男性粉丝数量较多的是海外和北京,女性粉丝数量较多的是海外和广州。

4)“铁粉”top10:铁杆粉在本次粉丝画像中的表现明显。通过对互动频率的分析,知微得出了“铁粉”的top10,这些铁粉的发布的微博平均都在2000条以上,几乎所有的微博都是转自鹿晗8条微博中的一条,以转发加评的形式呈现微博内容。
在这些“铁粉”top10中,来自EXO成员——吴亦凡家乡的广东粉有3名,鹿晗出生地的帝都粉有2名。 笔者通过新浪微博搜索了解到,这些top10都偏爱美食和旅游。

5)星座盘点--土象星座牛气冲天。在提取的数据中我们发现金牛、天蝎、天秤、摩羯、狮子着五个星座的粉丝在所有粉丝中占比例较大,其中金牛座粉丝最多,占总粉丝数的10.23%,天蝎其次,占了9.45%。五个星座所占比例相差不大。土象星座金牛和摩羯在这五个星座中有占的比例比较大,特点是比较务实、踏实。

6)粉丝标签--男女粉丝标签相同。从标签中可以看出在粉丝中以90后学生居多,时尚,文艺,喜欢音乐,对旅游感兴趣。生活态度较好,喜欢搞笑幽默,平时也会研究些星座运势,爱好美食。喜欢鹿晗也喜欢吴世勋,有娱乐精神。


7)粉丝偏爱的品牌--求同存异,男女有别通过对数据进行分析,我们得出了男性粉丝和女性粉丝各自关注品牌的top10。
男性粉丝和女性粉丝共同关注的有4个,分别是小米、万能淘宝王、天猫、蘑菇街。其中的天猫、万能淘宝王和蘑菇街都是知名的网络购物平台,小米的主要销售渠道也是网络。
鹿晗的男粉和女粉们对小米,天猫,万能淘宝和蘑菇街的高关注度,也说明了这160多万的粉丝可能会是小米,天猫,万能支付宝,蘑菇街的潜在的庞大客户,如果鹿晗可以代言它们,商业效果一定非常明显。     
男生高关注品牌的top10清一色全是国产,女生的关注范围相比较男生来说就要广得多。除国产品牌外,女生关注的还有有韩国品牌的三星和KRAVITZ(韩国知名品牌服装设计公司),美国品牌星巴克和瑞典品牌WIS(护肤品牌)。
相同的关注点,不同的品牌:女性偏爱韩国三星思密达,男生对国产机热衷程度高,小米,魅族,oppo都在男生的考虑范围之内。

不同的关注点:男性粉丝高关注度品牌的top 10中,景逸国产汽车和美的冰箱是女性粉丝不怎么感冒的关注点,同样,在女性粉丝高关注度品牌top10中,KRAVITZ和星巴克也是男性粉丝不怎关心的。
但是不能否认的是KRAVITZ作为EXO的服装赞助商,的确是受到了众多女粉丝的追捧。女人的衣柜里永远都少一件衣服,女性是对服装狂热的感性生物。如果KRAVITZ能够选鹿晗作为代言人,扩大宣传,相信KRAVITZ能够更好更快的进入中国市场。



结语:
1.在数据爆炸的时代,信息的传播从注重速度开始逐渐转向注重效果。利用数据处理信息,有目标的进行数据处理在生活中越来越重要。
2.通过分析明星粉丝画像,了解粉丝的特点能够为明星更好的发展提供建议,对明星的商业活动和演艺事业具有借鉴意义,有利于找准目标受众。
3.社交媒体是个大熔炉,在熔炉中练就一双火眼晶晶,去粗取精,分条缕析才能洞悉事情,找准方向。 文章为作者独立观点,不代表虎嗅网立场

向作者提问

加入文集

维修站里发生着什么?这是你未曾了解的、被大数据包裹的F1!

维修站里发生着什么?这是你未曾了解的、被大数据包裹的F1!本周末,全球赛车爱好者的目光都投向了中国上海,2014年F1 (世界一级方程式大奖赛)第四站于本周末举行,相信这让所有车迷的肾上腺素飙升。笔者追随F1多年,从当年的车王塞纳,到大舒马赫,再到现在的维特尔、巴顿等,几乎有F1的周末都赖在沙发上几个小时,享受于引擎轰鸣。
F1最神秘的地方,我想没有人反对,那就是维修站!不仅仅因为每场比赛,都会有两三次的进站换轮胎及调整赛车,而是因为在那里汇聚了精明的决策,也是致胜的法宝。数不清的超越是源于:车手在进站时接受到的策略被完美执行。而这些策略除了来自经验判断,也必须来自数据。所有数据的采集,整理及强大的分析都在那不大的维修站中完成。
笔者有幸从迈凯轮车队获取到了一些关于F1维修站的秘密,你想知道有多少人在分析数据?有哪些数据被收集和分析?他们看到的实时赛况是如何呈现的?本文揭示赛车背后的数据大战。 工程师

没有工程师的智慧,大数据是无法展现它的极致价值的。现场团队中的工程师差不多有10到12个来完成比赛各个阶段的数据采集和分析的工作。但是在正赛中,数据的实时采集与分析是一项非常艰巨的任务。因此,该车队有一支额外的支持工程师团队在总部的迈凯轮技术中心(McLarenTechnology Centre),通过维修站的控制墙与前方支持团队沟通,他们分工非常明确,大部分是负责数据实时分析及决策支持。比赛中,有一个特殊的角色叫“比赛工程师”,只有他可以与车手对话,布置战术,所有指令和沟通都是由比赛工程师发出的。
数据
海量的数据简单分为三类:历史数据,赛前测试数据和实时数据。对于上海站而言,最有价值的历史数据就是该车手在上海赛道的以往各种数据集合。一辆F1赛车上基本上会有150-200个传感器,一站下来的所有数据将达到3T之多。数据主要是以数字为主,因为图像数据并没有数字看得直观。这些数据比如说,在第5圈的第4弯的胎压是多少,当时用的油量是多少,车子的速度、刹车的情况等等。最有趣的是你连那个时候,车手出多少汗都能测量出来。由于这个数据库非常庞大,在车队来之前,会打印出来一部分最重要信息。其他信息都通过电脑临时下载,但局限于网络和电脑硬盘容量,很难更好的有效利用所有数据。所以迈凯轮实施了一系列新的软件解决方案,比如现在来上海比赛,想先查看2011年在32圈第9弯发生了什么事情,那辆车的当时状态等信息,原来需要个把小时才能展现出这个数据,但现在只需要9秒钟就够了,而且不仅仅是数据提取,这9秒钟之内也包含了数据分析,大大提升了数据的采集,整理和分析工作,从而可以在赛前为车手创建特有的策略,比如,根据空气动力学设置赛车,什么时候使用什么轮胎,何时进站等。
再来说实时比赛数据。由于数据属于商业机密,下面的图所展示的是一些模拟数据供参考。所有核心数据都集中在这个数据仪表盘上。数据来自于赛车的传感器,GPS,天气和赛道信息及历史数据等,都是实时的采集,加工和分析。大体上把仪表盘分为上方的赛车性能监控及下方的预测时间轴。

 赛车性能监控
性能监控是基础,正常情况下(无事故及天气原因),会基于燃料,胎压,轮胎磨损及各零部件数据去预测什么时候需要进站。在上图中的两位车手数据,还可以进行驾驶行为对比,比如出现在相同位置时,油门及刹车的使用都会有效反映到速度性能监控表中。同时,在赛道信息图(上图居中),还可以显示赛道布局及弯道所有编号,风力情况,天气情况,乃至赛道温度,这些都是重要的指标来决定使用什么样的轮胎和空气动力学设置,乃至进站策略。
如果聚焦到某一辆赛车,可以实时获取到如名次,领先时间,最快及当前圈时间,当前速度及档位,刹车及油门实时使用情况,燃油情况及预测燃油耗尽圈数等信息,同时还可以看到更详细的数据,如上一次进站消耗的时间,胎压信息,预计再次进站窗口等,这都将作为决策的重要线索。

 预测时间轴
这个就更加直观了。可以看到巴顿(蓝线)计划在21圈进站,但实际他是22圈进站,并且接下来的进站窗口是36到39圈,而且预测到可能在44圈的时候,轮胎会有一个问题将导致赛车性能极度下降,并且在第51圈时,燃油耗尽。这些最重要的信息,都非常简单明了的展示在仪表盘上,供当时的工程师做出最佳的决策。
当然数据仅仅是重要的参考,工程师的经验也是至关重要。但数据获取的速度越快,准确性越高,数据模型越完善,决策就更容易。在F1这样的赛事中,速度,哪怕早几秒都是至关重要的!迈凯轮总是想分析更多的数据,而且更快!迈凯轮一直在和SAP一起开发这个系统,借助SAP HANA来增加的数据容量,高速提数据处理及分析速度,并希望未来通过移动设备,让工程师们将能够从任何地点访问信息。 数据及策略是获胜的必要条件,但想取胜,因素还有太多,天气因素,车手的状态啊,轮胎的性能,赛车的调教等等,就祝各车队好运了。
最后希望明天下午3点即将开始的上海站正赛不让咱中国车迷失望,也祝愿上海站昔日冠军大舒马赫可以早日醒来!文章为作者独立观点,不代表虎嗅网立场

向作者提问

加入文集

失之桑榆,英特尔如何在云端和物联网布局?

失之桑榆,英特尔如何在云端和物联网布局?从计算、网络到存储,软件定义整个数据中心
目前整个行业正处于非常重要的新业务转型时期,云计算和大数据的兴起重构了整个产业的格局,因应行业变局,英特尔数据中心业务将新增长的三大动力定义为:云、大数据、高性能计算。在这场变迁中,信息和通信技术的交互方式发生了根本性的转变,IT已经从一个业务支持功能变成业务本身,英特尔将之称为数字服务经济,如果说IT是沟通服务业务和消费者需求的一个工具,那么云计算已经是交付这些服务的基础架构了。
于是业界有了软件定义的数据中心的概念,它的核心是更好的部署基于云端的服务以及相应的应用,这在公有云领域有一些案例,像阿里巴巴、腾讯等都在应用这方面的技术,而且这种架构是非常动态的,也就是说随着不断有新用户加入,系统也可以得到扩展。而英特尔的工作就是要把这些单个的云服务提供商所运用的技术进行整合,变成一种主流的技术,这样可以针对更多的顾客使用需求,都会通过动态的基于云端的服务架构和环境得到满足。
“我们需要重新架构我们的数据中心,我们需要一起来进行创新,让数据中心需要由应用和服务来进行定义。” 英特尔公司高级副总裁、数据中心事业部总经理柏安娜强调。
大数据需要对数据进行分析,而且还意味着一种提供商业价值的机会,提供商业上的洞察力,商家可以更好地了解消费者的行为,更好地管控安全和风险,让数据的分析把不需要的垃圾清除出去提高运营的效率。大数据是一个数十亿甚至上百亿价值的市场,大概到2020年将达到500亿美元,其中很大一部分会搭载在英特尔架构基础上,因为英特尔能降低40%成本,并提高90%效率,能够使得大数据的解决方案真正成为可能。
此外,除了自身推出大数据处理的Hadoop发行版,英特尔还和cloudera有稳固的合作关系,英特尔上周已经宣布对该公司投资7.4亿美元,并获得后者18%的股份。英特尔对Cloudera的投资估值为41亿美金,并且放弃自己的Hadoop版本作为交易的一部分,英特尔将从自己定制的Hadoop版本中逐渐转移到Cloudera版本,这样可以提供全企业级的解决方案,帮助企业用户抓住500亿的市场机遇。
数据中心除了对计算能力和伸缩性的巨大要求以外,随着云计算技术、理念与网络的逐步结合,通用芯片计算能力的极大提升和业务需求走向多样化,网络功能虚拟化(NFV)和软件定义网络(SDN)正在成为整个业界的趋势,而对于处理器厂商出身的英特尔来说,这个市场也是它发挥自己优势强力进入的新疆界。
“尽管整个市场价值160亿美元,但是我们目前在市场上的份额大概是在5%左右,换句话说我们的增长是有非常大的潜力,” 英特尔公司数据中心事业部副总裁,通信与存储基础设施事业部总经理Rose Schooler对此市场充满了期待。网络负载有四种主要环节:第一个首先是应用,像计费、运营的真实系统在应用范围内;第二个是控制,控制包括路由选择协议、对话管理;第三个是数据包,这里面有QoS、数据压缩等;最后一个是信号,信号包括转码及信号处理。原来这些任务都通过不同的专用硬件设备来处理,现在英特尔通过不断提高处理器性能以及集成图形处理器和信号处理器的方式来完成对各类专用硬件的替换,好处就是平台通用,功能完全依靠软件来完成,而不需要购买昂贵的专用硬件设备,数据中心由此得到重构。
物联网时代的端到端智能系统方案
我们正在进入一个“万物智能”的时代,2013麦肯锡的调查报告显示,在过去的五年间互联设备数量实现了300%的增长。但由于很多智能系统缺乏与云、存储等技术的联结,往往无法在实际应用中做出快速反应。英特尔希望在智慧城市的建设过程中,未来不论是安防、交通、环境等用途的基础设施,能够更好的串联在一起,通过在前端完成数据的采集和分析,再借由云平台等后端力量有效的进行数据挖掘与分析。
与环境监控公司罗克佳华的合作是英特尔在环境的监控和减排领域做出的新尝试,英特尔为罗克佳华公司提供后端云平台的服务和终端网关器件,借由完全基于英特尔架构上的计算解决方案,从终端到云端。罗克佳华能够用网关器件去整合各个碎片化的传感器信息,而后将信息提供到云端进行处理,保证煤矿的安全、企业排放检测和控制,双方的合作能够很好的对大企业能量污染排放进行控制。
柏安娜认为,端到端给用户带来价值的是架构的一致性。其实架构一致性有两点最大的好处:一是开发商更容易开发;二,设备安全和管理的一致性也变得非常非常重要。英特尔在这方面确实有巨大的价值,能够把端到端的价值链串联起来,为开发商提供一致性的开发平台以及安全可信的管理平台。
从以上言论能够看出英特尔的策略是不仅致力于提供领先的芯片计算能力,更要加速开发和部署面向零售、安全监控、网络通信、车载系统等领域的端到端解决方案。未来以连接传统系统与新系统,使原本孤立的系统转为互联设备,并通过过滤、分析、共享才能最终更好的解决由生活智能化引出的社会问题。
文章为作者独立观点,不代表虎嗅网立场

向作者提问

加入文集

大数据如何玩儿?这是BAT的不同思路。

大数据如何玩儿?这是BAT的不同思路。去年5月笔者曾撰文阐述百度、阿里和腾讯这三个互联网巨无霸开始挖掘大数据。一年过去,拥有海量数据的公司已在多个领域尝试对掌握的数据进行利用,大数据意识和能力进步飞快,体系和工具日趋成熟。
大数据应用实践,硕果累累
百度在大数据方面让人印象深刻的有百度迁徙这样的公益项目,应用在民生和新闻等领域。最新动态是,百度网盟利用基于大数据的CTR(广告内容匹配)数据,站长的平均收入提升70%。
阿里则对外宣称已经拥有100PB数据并以令人欣喜的速度增长,马云最新的内部邮件将阿里战略阐述为云端+大数据,阿里要进入数据时代。
腾讯广点通平台不乏亮点应用,例如美丽说借助广点通在移动端取得丰收,小米手机与QQ空间合作更是基于社交数据营销的经典。
百度、阿里均已将大数据升级为公司战略,李彦宏、雷军等互联网代表人物在两会时都曾有建言,推动政府的大数据意识和开放,大数据正在从理论走向实践,从专业领域走向全民应用的阶段。
互联网牵头大数据的必然性
为什么国内的大数据应用,只有几个互联网巨头取得成就呢?是因为它们拥有最多的用户、流量和数据吗?答案是否定的。因为所有关于大数据的论断都认为,大数据并不在于大。质量、性质以及谁拥有它,将决定大数据能被挖掘出来的价值和难度。
物联网传感器、视频监控设备时时刻刻都在收集海量数据,但价值没有微博大,因为数据难以变现。运营商拥有用户通信相关数据,从语音到短信再到位置,量大过任何一个互联网巨头。只能白白浪费,因为运营商不被允许也无能力去利用这些数据。与之类似,政府部门、软件企业均拥有大数据,却只能任其沉睡。
之所以BAT走在国内大数据应用的前列,即与其拥有的数据性质有管,与互联网企业的技术基因、开放创新和积极进取有关。
大数据利用难点在于技术。从数据的收集到存储到清洗,再到脱敏,归类,标签化、结构化,以及最后的建模分析、挖掘利用,均是技术活儿。需要服务器集群、数据利用模型和数据处理算法来保障,然后才是挖掘出来的结果的包装、变现。
相对其他拥有大数据的金主来说,互联网企业的技术甩开它们几条街。运营商技术是外包;银行的技术外包居多;其他公共部门例如政府、交通、教育、能源等行业,技术对他们是遥远的名词。
还有动机。互联网企业的服务产品几乎是免费,必须通过其他模式赚钱。过去是广告、游戏和增值这三种模式,到了移动端广告模式遇到瓶颈,需要新模式,抑或加强原有模式。这两点上,大数据都会起到大的作用。
BAT大数据思路迥异
BAT三家的数据各有特色。
百度是基于用户搜索行为的需求数据,阿里掌握着交易以及信用数据,腾讯则掌握着社交关系数据。各有千秋。它们对大数据的应用方向并不相同。百度和阿里更为激进。腾讯观望多过行动,也可能是说得少做得多。
首先是动机。
百度收入95%以上来自广告,淘宝的主要收入模式也是广告。百度、淘宝和CCTV是中国前三大广告投放阵地。腾讯主要收入来自游戏和社交增值业务,广告收入占比仅为三成左右。
本阶段大数据变现的主要途径是精准广告,这契合百度和阿里的诉求,两家将大数据升级为公司战略。
其次是技术。
搜索引擎是技术驱动,百度和其创始人李彦宏最具技术基因。马云对外宣称因为其不懂技术所以阿里技术最强。只有腾讯不怎么强调技术,一直强调产品能力。
大数据是技术活儿,百度和阿里这两位自认为技术很强的玩家探索在先符合常理。百度和阿里在大数据技术已经进行较多布局,从人才到架构到基础设施再到技术理论。
百度有深度学习研究院、高价聘请大数据领域人才以及与高校合作,正在建设亚洲最大云计算机房;阿里有飞天计划,有先进的跨机房5k集群、Apsara分布式计算系统,还有数据委员会这样的架构。
几家在云计算平台上的不同态度可以佐证我的观点。云平台和大数据是连体婴。“移动端”、合作伙伴和用户个人的数据,均需要“云”来收集、存储和处理。要掌握大数据,一定要具备承载数据的开放的云。
阿里云09年成立,百度云12年推出,分别对应到IaaS模式和PaaS(Amazon VS Google)。它们的云服务在向开发者和用户提供基础设施、云端服务的同时,收集第三方网站、应用、硬件和用户的数据。百度迁徙能够生效便是得益于第三方App为百度贡献位置数据。
腾讯云去年9月才推出,起步晚了点。虽然腾讯开放平台成熟,但开放平台更多是分享腾讯的用户和资源出来,目的不是收集数据。而且开放平台是运营、合作、生态层面的事,云平台才是技术问题。
最后是位置。
典型的互联网交易场景大概是这样的,用户在聊天、社交、娱乐的过程中,会被吸引注意力,关注“兴趣”,抑或因为兴趣而发现新的信息。然后用户去了解、去寻找想要的东西(需求、欲望、找到所求),最后在网上完成交易(电商和O2O)。
这里引用一下漏斗模型——一个悠久经典的营销概念。在这个模型里,用户消费时的大致决策路径是从注意(attention)、兴趣(interest)、欲望(desire)最后到行动(action)。

上图是被倒过来的漏洞。漏斗越到底部转化率越高。阿里在欲望和行动之间,百度在兴趣和欲望之间,腾讯则在漏洞顶部。
广告收费模式可以看出三家的位置差异。百度是CPC,按照点击次数付费(不管点击后的行为),阿里淘宝客等广告则直接可以对应到购买行为,CPA(按实际效果)和CPS(按效果佣金)居多。腾讯门户、QQ聊天Banner广告更亲睐于CPM或者CPT(按照展示次数或者时长),广点通是CPA,但亮点案例集中在应用下载领域,而不是交易领域。
三家都不希望只处于某一个环节,而是期望上中下通吃。百度有贴吧这样的兴趣社交产品,有视频这种注意力型业务,还推出了直接在结果页下单的“微购”,上下延展;腾讯重组了搜索业务(与搜狗合并)和电商业务(与京东合并),向下的机会还有;阿里投资微博、布局智能电视以及做导购网站做微淘,努力在向上走。
几个互联网巨头的动机、技术和位置的不同,在大数据应用上的思路也不同:腾讯蜻蜓点水,阿里布局为先,百度技术至上。相同的是,几家都在想方设法笼络更多的数据,收集数据是第一阶段,形成收集数据的能力和机制是第二阶段,第三阶段才是数据挖掘,目前BAT三家均处于从第二阶段到第三阶段之间,一旦大数据应用全面进入第三阶段,积累更深、投入更多的百度或将有望显出优势。
AppStore和iPhone的诞生,将人们带入了智能手机和移动互联网时代,颠覆了传统的软件业和手机业。未来,对大数据商业价值的发掘将给互联网公司拓展出更大的增长空间,甚至有可能催生出全新的商业模式和硬件产品,就像AppStore和iPhone那样,给人们的工作和生活方式带来颠覆性的变化。
作者微博@互联网阿超,微信SuperSofter文章为作者独立观点,不代表虎嗅网立场

向作者提问

加入文集

今日嗅评:“有童佳倩的宾馆才是我刘易阳的家”,这种事情公关解决无力

今日嗅评:“有童佳倩的宾馆才是我刘易阳的家”,这种事情公关解决无力监管逆风下,为何马化腾从容马云急?阑夕投稿:快捷支付如定位在“小额”,这一刀切下去,对腾讯伤到的是皮肉,对阿里而言却是动到了筋骨。最大化的利益决定了最大化的倾向,他们有时在扮演英武的赫拉克勒斯,有时又在扮演温和的赫斯提亚,但是实际上,他们都是善变的赫尔墨斯。
k9999:最近涉及A的文章必谈T,但是要搞清楚,阿里和腾讯激烈交锋的是移动电商和O2O领域。而互联网金融是支付宝与传统金融的战争,腾讯暂时还没有达到参战的门槛。
奇一:腾讯确实有些腹黑,但还没到无耻的地步,赫尔墨斯这个说法用得好,一切以利益最大化为目标,不管是打压对手还是合作。马化腾真的太会“借势”了
南十四:个人观点,除了最大化的利益,马云的性格、心态、路径依赖也是其顶风而上的由来:
1、性格上,好大喜功、好为领袖、好为道德导师,岂能言败?2、心态上,历年来一直站在众多赞誉声中,而马化腾开放之前山寨王的美名岂是白挨的,没啥过不去的3、路径上,从淘宝围城说成假货商围攻、支付宝VIE说成迫不得已再到余额宝的先斩后奏,一系列成功的弱势扳回,成功路径走的多了就习惯了,遇到问题总要再走下
阿里收购恒生?阿里金融战略放大招据传今天恒生电子(600570.SH)将公布阿里巴巴对其控股股东恒生集团的重组事宜。恒生IT金融系统几乎协助各大金融机构掌握和管理其重要商业数据,堪称金融数据服务细分行业产业链内的垄断企业。
何劲的围脖:微信上附加钱包,支付宝上增加聊天,两者是不同的。根子是人性。其实微博做的Page,card,从底层思维逻辑”信息结构化“上没有错,但结果之所以走上死路,就是因为人性的特点,导致了人的反应方向。
李成东V:周鸿祎说过,奇虎20个移动产品不如一个微信。阿里火急火燎投的近10个项目,不抵腾讯投资大众点评和京东。地图,物流,医疗,零售,文化,教育,阿里投资布局,有点慌不择路,饥不择食抓不住重点的感觉。
58同城增发背后的意味:旧股东的撤退Eastland投稿:58同城没能利用抢先上市,股价暴涨的机会并购赶集网,以后的路难走了。因此,软银、华平借58同城增发之机选择落袋为安。
俊世太保:58一直在重复犯着一个错误:重量不重质
说句理性的话,58同城肯定在信息发布审查方面投入了大量的人力物力,本来是不应该出现如此多的虚假信息。但问题的关键在于,58从赶集、百姓网等各类竞争对手那边抓取了大量的信息,用户只要在一个分类信息网站上发布了帖子,几分钟后就会出现在另外一个分类信息网站上,而这类信息却缺乏必要的审查,因为用户属于竞争对手的网站,事实上也无法审查。
如果你是姚笛的公关,你现在该怎么做?低调的旁观者投稿:文章马伊琍相继发声,只剩姚笛依旧沉默。如果你是姚笛公关,现在该怎么做?这个问题很有趣,需要把文章,马伊琍,姚笛,三个独立个体放入模型——出轨类丑闻公关战通常可应用到的数学模型,就是大名鼎鼎的“囚徒困境”。
刘铮:不想娶姚笛的马伊俐不是好文章。有童佳倩的宾馆才是我刘易阳的家。
入门先知:姚笛某种意义上是缺乏公关选择权的。因为公开表态对文章的感情并无益于实际促成与文章的关系,反而可能给文章更多的压力,逼迫文章做选择。在出轨的问题上,社会公众会倾向于婚姻,而且倾向于母亲和孩子。在此时主动出击可能反而会承受更多的社会压力。在很多实际问题中,公关都无法实际掺和到当事人的关系中,这种事情无法也不该由公关来解决。倒是姚笛朋友的那句打过孩子的公道话,可能倒成为最好的公关。
加入文集

阿里收购恒生?阿里金融战略放大招

阿里收购恒生?阿里金融战略放大招据传今天恒生电子(600570.SH)将公布阿里巴巴对其控股股东恒生集团的重组事宜。
3月18日,恒生电子发布公告称,公司于3月16日收到公司控股股东恒生集团的书面通知,恒生集团将筹划重大战略事宜,由于恒生集团系本公司的控股股东,其重大战略事宜将对本公司构成重大影响。“经公司申请,本公司股票自2014年3月17日起停牌。”
市场传闻,阿里金融将收购或控股性收购恒生集团。
了解下恒生
根据恒生官网介绍,“1995年2月,恒生电子创始团队八位年轻的工程师怀揣梦想,毅然决然投身于金融IT领域。”
恒生集团旗下的恒生电子总部设在杭州,在全国28个主要城市设有分公司或办事处,主营业务金融IT产品与服务涵盖银行、证券、基金、信托、保险、期货等金融市场 的各个领域,是国内唯一一家能够提供全面解决方案的”全牌照”IT服务公司。根据恒生电子2012年年报,公司在基金、证券、保险(放心保)、信托资管领域核心市场占有率分别达到93%、80%、90%、75%,在证券账户系统、证券柜台系统、银行理财业务平台、信托核心业务平台、期货核心系统的市场占有率分别达到57%、43%、85%、41%、42%。恒生系统还中标了上海清算所综合业务系统,承建的系统可谓金融软件的“航空母舰”。恒生IT金融系统几乎协助各大金融机构掌握和管理其重要商业数据,堪称金融数据服务细分行业产业链内的垄断企业。
恒生电子于2003年12月在上海证券交易所主板上市,恒生集团为其持有20.6%的第一大股东,上市公司股权较为分散;同时,由于历史原因,恒生集团的股东都为个人,持有股权也非常分散,2012年末,恒生电子曾经停牌,随后传出:阿里巴巴集团和恒生电子集团近日签署了重大战略合作协议,两家公司将在金融支付、国际数据交换、IT后台安全等方面进行深度合作。分散的股权结构为阿里巴巴收购恒生集团提供了绝佳的机会。
如今,绝大多数金融机构不但使用恒生的交易系统,还使用资金清算系统、CRM客户管理系统、客户交易系统、量化交易系统、组合配置系统、交易清算系统、风险控制系统等等,恒生系统几乎占据了金融产业链的各个环节,简言之,如果恒生电子将这些数据放到一起,可以看到很多金融机构客户的交易记录,据此分析客户的交易行为,这就是最近热门的“大数据”。
阿里的“金融云”
2013年11月27日,阿里云在北京宣布推出阿里金融云服务,即阿里内部俗称的“聚宝盆”计划。
通过该云计算服务,全国2000余家区域银行可以快速、低成本地实现网上交易支付等功能,打通了农村电子商务快速发展的瓶颈。同样,基金、保险及证券等金融行业亦可以通过云计算,实现处理海量业务和数据的能力,对接高速发展的互联网金融服务,拓展上亿量级用户市场的电子商务渠道。
阿里方面称,阿里金融云的顺利推出,表明阿里云在云计算的核心指标上已经达到了金融行业的生产标准。中小银行通过云计算可以享受大型银行才有的IT架构水准,这在提升其竞争力的同时,也给银行业带来了新的想象空间。
当天的发布会上,包括恒生电子、金证股份等ISV(软件商)代表以及天弘基金、渤海银行在内的金融机构代表出席并讲话,表示将加强和加深与阿里金融云的合作。
目前“聚宝盆”涉及的领域包括快捷支付、网银支付、缴费、代理收单、积分支付、系统管理、查询统计基础服务。之后,“阿里云”准备对银行业务进行整体托管,甚至包括核心账务系统、信用卡系统、放款系统和风控系统等。但就“金融云”的战略野心而言,阿里仍然缺乏交易和投资的大数据资源,一位电子商务人士对《新世纪周刊》表示,如果阿里巴巴收购恒生电子成行,阿里在证券、基金,甚至银行的IT系统服务方面获得较多优势的同时,其“金融云”平台的步伐将大为推进。《新世纪周报》报道同时说:
据基金业人士表示,目前,基金公司不但使用恒生的交易系统,还使用恒生的资金清算系统,同时恒生还涉及客户的注册交易。如果未来这些数据进入“阿里云”平台,能看到很多公募基金客户的记录,据此分析客户交易行为,这将为阿里大数据梦想添上重要一翼。
质疑
《新世纪周刊》把阿里金融对恒生可能的收购定性为“令人不安的婚礼”:
1、安全性
但业内人士普遍担心的是,阿里迎娶恒生集团后,相当于掌握了绝大部分金融机构的后门。因为恒生电子几乎是传统金融机构最大的IT供应商。恒生电子的客户包括证券、基金、银行、保险等诸多领域,基金公司和证券公司为其核心服务对象。
2、利益冲突
还有明显的利益冲突是,阿里旗下控股了天弘基金管理有限公司,后者管理的货币基金余额宝在3月19日的规模已经达到5531.3亿元,在基金业傲视群雄。未来恒生电子将如何处理与其他基金客户的关系?
3、垄断之忧
一位基金公司高管表示,恒生电子以其对基金IT服务行业绝对高的占有率,一直以来享有与基金公司谈判中的绝对定价权。“现在加上阿里,强强相加,对我们传统行业而言,简直是灾难。”
加入文集

没有大数据,营销怎么会性感?

没有大数据,营销怎么会性感?虎嗅注:2014虎嗅新媒体营销会今天如期举行啦(撒花~),没有到现场围观也没有在微信群撒欢儿?不要紧,虎嗅君第一时间给你带来新鲜快报。下面先来看看来自百度营销咨询部总经理刘伟的演讲(别担心,广告已屏蔽,嚯嚯~):
今天我聊的主题是新技术、新营销。跟大家分享一下我们的技术怎样能更好地帮助各位跟消费者沟通。
大数据在营销当中有什么样的地位?

第一个是大数据营销:CMO调研认为当前大数据营销是最重要的新技术。

最近一个月来大数据频频登陆央视,从春运到两会报道都有我们的大数据。春节期间利用百度LBS定位信息,我们跟央视共同合作,关于中国春运这样一个“哺乳动物史上最大的迁移”,这样一种迁移怎么在中国发生的呢?通过大数据可以非常直观、清晰生动的展示在大家的面前。对于政府部门而言,通过这些数据可以帮助企业规划运力,配置运输资源,进行各种防控,为政府进行更好的管控,对于普通老百姓而言也可以更好的规划自己的出行规划。

前段时间两会,大数据也结合央视呈现了大众人群最关心的内容,比如,用户部门可以根据用户不需求制订他们的城镇规划。

大数据对营销有什么价值和意义?

如果用三个关键词概括大数据功能的话,那就是:挖掘、预测和关联。

大数据可以做预测

大数据可以做很多营销效果预测。针对于消费者洞察、营销创新和帮助品牌挖掘市场蓝海等一系列的领域有很多合作。比如,大数据可以帮助电脑零售商预测寒暑假什么本最受欢迎,可以根据电影院线搜索量预测票房。

大数据关联应用

这个关联应用在是在代言人遴选方面比较典型。很多企业选择代言人希望知名度高,和品牌比较吻合。比如我们看到陈欧的目标受众是20到25岁的女性为主,比较积极上进,关注于培训等有关。我们八卦看了一下陈欧除了给自己代言之外,还适合给谁代言呢?我们发现在酒类里洋酒比较吻合。所以聚美优品如果想扩展家居装修是比较吻合的。

中午时我跟一些嘉宾谈到了,目前大数据也在帮助我们很多企业,依托与百度大数据,帮助他们更好的筛选代言人。我们可以提供一套非常好的模型为你们提供数据模型。

大数据的挖掘功能

大数据更多的是在国计民生和营销上的利用。随着移动互联网和智能云科技发展,大数据已经开始侵入我们的生活并且逐渐改变我们的生活。

举几个场景:比如说今天大家开车过来参加这个会议,车存到地库之后,通过车载自动诊断系统,他会为你今天驾驶行为进行评估打分,同时告诉你下一次驾驶安全建议是什么。

如果购物的时候,商场会自动识别你的会员信息,根据历史信息判断你的喜好和数据,为你推荐适合你的推荐。

走出家门,当你离家两公里的时候,可以通过手机遥控开启你家里的家电,回到家空气系统、照明系统已经开启了。

这些场景以前都是出现在一些科技大片中的,但是现在它就在我们的身边确实的发生。我们也是在做这样的一些事。

现在已经有厂商跟我们百度合作开发出了一系列的智能可穿戴设备。它的工作原理:可以通过手机远程遥控启动血压仪,数据会随时传输到云端,手机简单运算之后会告诉你结果,并给你提出建议。这些新的技术不仅改变了我们的生活,为新的商业模式和营销模式带来了很多机会。

比如你佩戴这样的一个血压仪,会提醒你,你现在已经座在这儿开两个小时的会了,需要休息一下,喝水一点什么样的饮料适合你。这些营销方式跟以前的方式不一样,它是适合于我们的使用和生活场景的。

大数据应用案例分享

创新营销分享案例:轻应用。刚才宝马MINI的范例也提到,他们做了一款应用,其实轻应用无需下载即搜即用。而且它也可以调用手机端很多功能,比如重力感应、光感、定位、陀螺等。

双屏互动案例:通过LBS定位信息捕获最后一公里的需求,这个已经是广泛应用了。

可乐的案例:现在很多广告主都在进行360度的全方位整合营销,现在通过手机读图的技术,可以直接对准海报拍摄照片,会进行自动识别,并且发送一张优惠券或者调取一款轻应用。通过手机可以查询到附近可乐的售卖机,可以进行兑换。我们可以通过拍照调取你的轻应用,让用户可以实时了解这个车的外观和内饰。

现在我们来总结一下:因为时间关系,非常快地给大家聊了一下百度在数据和技术领域的积累。今年我们也共同和广告主,和广告公司合作伙伴,共同发起了成立了品牌数字营销创新实验室,我们希望通过这个项目跟伙伴一起探索从理论到实践、从洞察到创意更个的营销过程。我们希望有更多的伙伴加入这个实验室,百度无论是营销研究院还是大数据部门,都已经为客户准备了数据洞察的能力,希望能为大家提供更好的决策。谢谢大家!

加入文集

来认识下刚刚被Spotify收购的智能音乐数据分析平台: The Echo Nest

来认识下刚刚被Spotify收购的智能音乐数据分析平台: The Echo Nest智能音乐数据分析平台The Echo Nest 今天在其官方博客宣布,该公司已经被 Spotify 收购,具体的收购金额暂未透露。

你也许不熟悉The Echo Nest,但是你一定熟悉Spotify、Rdio、MOG、iHeartRadio这些著名的音乐软件。而The Echo Nest正是这些著名音乐软件背后的音乐数据分析技术提供商。

The Echo Nest是一家提供智能音乐数据分析服务的平台型公司。它能够帮助使用其服务的音乐软件分析用户数据,计算出用户的对音乐的独特口味,从而能够向用户推荐符合其口味的歌曲。

以Spotify为例。用户使用Spotify听歌时,Spotify会记录用户听了哪些歌,哪些歌听的时间长,哪些歌听的时间短,有哪些歌甚至没有听完就跳过了,哪些歌被用户收藏进歌单以及哪些歌被用户分享给了朋友。这些被记录下的数据通过The Echo Nest提供的接口,传送到The Echo Nest的数据库中,使用The Echo Nest的专利算法进行分析,推断出用户的喜好,然后根据The Echo Nest的专利匹配算法,将符合用户喜好的音乐曲目返回给Spotify。这样,Spotify就可以向用户推荐符合其口味的音乐曲目了。

音乐软件的个性化推荐已经成为了各大音乐软件的标配,而个性化推荐的准确程度也就成了音乐软件竞争的焦点。The Echo Nest此前是一家独立的提供智能音乐数据分析服务的第三方公司,为市场上大部分音乐软件提供服务。也就是说,有竞争关系的音乐软件也使用着同样的音乐数据分析服务。这就导致这些有竞争关系的音乐软件无法取得竞争优势。

Spotify对The Echo Nest的收购是一次对竞争对手的成功打击。尽管The Echo Nest声称这次收购不会影响与各大音乐软件的合约,但是Spotify的主要竞争对手之一的Rdio已经决定在未来弃用The Echo Nest的服务,以防止自己的用户数据被Spotify得到。不过The Echo Nest长期以来积累的技术优势使得Rdio很难找到能够完全替代它的公司。

大数据时代的来临以及个性化定制需求的提高,使得那些藏身幕后提供数据分析服务的公司,凭借强大的专利算法,成为众多大公司竞相收购的目标。

加入文集

数据化决策如何更靠谱?来自唯品会的分享

数据化决策如何更靠谱?来自唯品会的分享作者为唯品会运营副总裁魏燕翔,本文根据魏燕翔在阿里巴巴3月7日举办的西湖品学大数据峰会上的演讲整理而成,未经演讲者审阅。
数据化决策对任何一个企业来讲,带来的都是全新的痛苦的变革。其实说大数据,数据用来做什么?数据首先是用来做决策的。
人在做很多决策的时候,总是会面对理智跟非理智不同的情形跟场景。我们在做电子商务运营中会收集很多数据,做模型分析、数据分析,我们往往假定用户从这一步到这一步背后有一个必然的过程,背后有一定的逻辑关系。但是在购物过程当中,尤其是女性购物者在网上购物往往是非理性的冲动的决定。那么,数据团队或者业务团队怎么可能用完全理性的逻辑的分析判断用户行为?数据还原过程丢失了很多环节或者盲点的话,就会带来偏差和误导。
数据决策可能带来的偏差
所以这是我们面临的第一个挑战:人的决策不见得都是理性的,但我们通过数据去推演做了很多的假定和判断,至少在现在很多企业做决策的时候,更多的是强调理性,做假定所有的决定都是理性的,但是事实上现实生活中原非如此。
就算说数据反映的用户行为决策都是理性的,也还有问题。谈到数据来供我们做决策的时候,不仅仅量化的,还有一些语意化的东西。所以很多公司谈到数据的时候,很多公司把数据指标跟KPI捆绑在一起,这样就往往忘记了最初的商业目标,导致了偏离。所以当我们真正关注的时候,即使都是理性的,我们还是要区分出我们到底关注的是数据还是数字?我们不要被数字的假象所迷惑,很多数字是不会告诉我们所有的真相的。
另外一个,我们的决策方法论也可能有错误。丹尼尔卡门(音译)教授有一句话,叫目光所及便是一切,指是我们人类经常会犯的一种错误,有人说这叫聚光灯效应,当我们在下面作为观众看着台上演出的时候,聚光灯打在舞台上,你会发现在聚光灯下的所有一切你看得清清楚楚,但是在背景在暗处的东西往往被你忽略掉了。我们依赖于最容易获得的信息,以及说我们对信息的解读,认为说这是我们可以作出决策的所有的信息或者必要信心。但是恰恰这些最容易获得的信息,以及我们对这些信息的解读,往往不是能够做出好决策的所必须的所有的信息。
其实在决策过程中,我们还常常受到一些人类本身的局限。
第一个局限,尤其我觉得在我们中国人的决策一般都是选择题,可选的往往没有宽广的范围,而是“是”或者“否”。在我们商业环境下,我们通常会限制自己的选择方位,没有打开我们的思路,没有让更多的东西进入到我们的视野,这是我们第一个常容易犯的决先。
第二个在做决策的过程当中我往往去寻求一些依据,但我们倾向于去寻找一些支持我们观点的证据。每个人在接受信息都会有自动的过滤,在这个过滤过程中,总是会倾向于选择自己听起来比较舒服或者是比较认同的,而自己不认同会把他放弃掉。实际上在商业环境下,管理者常常是有自己的一个判断。有了判断之后,他第一件事是说,数据团队你去帮我找数据证明这个观点,数据团队往往会倾向于绞尽脑汁从各种维度去找一个数据来证明老大的观点。在这个过程中,其实我们还会受到情绪的影响。我们的开心或者说我们的愤怒往往会导致我们更快或者是更慢作出一个决定。
因此,一个好的决策者,即使有了数据的支持他也常常需要给自己更多的一点时间去思考去判定。而有了数据的支持和帮助,我们做决策还可能受到情绪的影响、自信心的影响,所以,这些其实都是在数据决策过程中我们会面临的一些挑战或困扰。
关于建立数据文化与数据化决策的几点分享与建议
第一个英文里面叫Hippo,意思是河马,指的是公司里面最高的决策层。在数据化决策里面首先要改变的就是管理者本身、机制的本身。这个过程中,决策者要有一个谦虚的心态去学习,要能够尽可能的谨慎的发表有个人倾向的意见,鼓励下面的团队尤其是数据团队去构建更扎实的基础、更好的决策流程。这是一个管理者对数据化决策的进程推进能起到最大的作用,而不是他亲自上手去指挥去设定一些项目或者目标,然后让下面快速去执行。
第二个是构建数据文化。对电商企业来说,可能包含下面几点思考。
1,数据本身不会告诉我们全部的真相,尊重数据、认识数据,但不迷信数据。我们往往会在构建所谓的数据文化的时候,不是把数据当做信仰,而是把数据变成一种迷信。这个可能是要去调整的。对于业务团队而言的话,与其说依赖数据团队或者是BI团队,不如说走到消费者中间,了解你客户的真实的需求,可能你一个电话或者是你一个调研的话,你得到的洞察远远超过数据团队花上多少时间给你的一份报告来得更加直接有效。
2, 需要构建的是,在各个业务部门有共识的指标体系。大家能在这个层面上去讨论数据,而不是都是以自身各自的,站在各自部门或者各自的经验的角度上的理解去谈这些数据。这是最起码的对数据的尊重。经常我们看到当数据团队做假设或者模型或者分析的时候,早早就被业务团队或者管理团队给打断了。他没有理解说数据团队在分析过程中做的一些简化和嘉定,也没有克服情绪化去尊重数据。
3, 数据团队也要深入业务,需要理解数据背后的业务逻辑。他们要天天跟业务部门在一起,了解业务部门的痛点,了解业务部门真正要去改变的方向和目标。如果只是站在他们象牙塔里面是不会提出革命性颠覆性的做法来真正改善业务部门决策的。  第三,数据跟数据工具不是特权,数据要的是安全而不是监管。事实上在很多企业里面,我们都用了安全名义做了数据分析的事情。不能被一线扣动扳机的人使用,那是数据团队的失败。如果我提出需求,数据团队一个星期去开发然后给出结果,事实上过了那个场景,你作出的数据已经没有办法去改善当时真正要达到的目标了。
所以数据是应该有一个合理权限的、安全的管理。但是不能因为这样的管理,使得一线部门没有办法介入到数据里去,他们只能介入到BI团队做的一些报表。实际上我们在很多情形下不能说这些报表没有用处,但是仅仅做到这一点是远远不够的。
今天很多团队都说数据安全问题、企业竞争问题,认为我们要关注数据隐私。这些都对,但同时我也感觉的,这把数据都变成了一个一个孤岛,每一个企业的数据和每一个企业的数据都没有打通,甚至企业部门之间的数据都是无法打通的,商品的团队只能看到商品的团队,市场的团队只能看到流量的数据。
但是其实如果不能把这些数据打通的话,每个部门只从KPI角度关注自己的一些数据指标,是很难发生协同效应,很难推进业务真正持之有效的改善。
数据有时效性和场景化。像今天唯品会的特卖限时抢购模式,如果我拿到一个客户或者一组客户在这一周的行为数据,想在下一周基于这个数据做一些精准营销,实际上,我已经错过了上一周那个场景、那个时间点了。你已经很难说那是一个精准的,只不过在历史的某一个时刻你拍了一个快照,对快照里面的场景做了一个分析和判断,然后试图说服自己说,把这个东西应用在今天的场景下,应该也可以成功。也许这样真的能成功,恭喜你很厉害。但是在大多数情况下,在运营端,我们更需要数据的实时性时效性。我记得去年双十一的时候,车老师(阿里巴巴大数据业务负责人)的团队在阿里做了很大的实时数据展示的屏幕。事实上在业务层面,有多少的业务人员是希望在做大的活动中能够每分钟或者每五分钟就能够看到实时的结果,能够对结果作出一些响应。而不是说等到几天甚至一个星期之后,我拿到一份总结报告,告诉我们说这就是事实,但是我们已经无法追溯说我们还有什么地方可以做得更好。
第四,数据的颗粒度和管理成本有关。其实在很多数据团队在开始起步阶段,都会追求说把颗粒做得越细越好,当然在现在的商业环境下,颗粒度做得越细,越能更好的发现或更建立洞察,但数据颗粒度越细也代表管理成本越高。在商业环境下我们寻求的是一个权衡,我们可能寻求是每次比前一次更优的一个选择。  第五,在数据化决策的过程中,流程比分析更重要。有很多一流的分析师或者是BI团队作出了非常有洞见的一个结果,但是缺乏一个有效的决策流程的话,可能会毁了这一切。事实上,在一个企业里面,我认为建立数据化决策的流程,远远重要过我们现在有一个多么强大的数据系统和数据分析团队。事实上我看到很多情形,无论那个数据师做了多少努力,最终的决定永远是Hippo在做决定。所以在这个过程中,需要组织的力量构建有效的流程,去约束在这个决策环节上所有的参与者,才能够帮助这个企业在数据化决策的过程中,不断的成熟,不断的进步。
加入文集

LinkedIn:我们下一步要做的是数据产品矩阵化

LinkedIn:我们下一步要做的是数据产品矩阵化本文根据美国LinkedIn公司的数据分析部资深总监Simon Zhang在3月7日的阿里巴巴西湖品学大数据峰会的演讲整理而成,他着重分享了LinkedIn对体内数据的搭建、产品化和矩阵化的构想。文章未经演讲者审阅。
现在的大数据的后面是个大冰川,海平面上的普通人一般能看见,海平面以下是专业人士能看见的。Linkedin内部大约有起码20种不同的数据库,就是完全不同的技术的数据库,还不包括同样一种数据库有不同的应用。但实际上我们真正的内部企业用户,包括Linkedin本身,需要的不是一个大冰川,需要的最后是冰激淋,就想把结果出来就行,他不需要大冰川。
怎么能做到这个冰淇淋呢?咱们讲讲数据分析的变革。基本大数据分析的三个原则,这个基本的原则是我大约加入Linkedin9个月以后我们决定下来的。我们如果要做一件最重要的事的话,那个事需要有三个属性:
第一个简单,他出来的结果必须要非常非常简单,没有任何花哨的东西,任何人都能够看明白看懂。第二个迅速,就是刚才说的速度的问题,越慢结束度越低,越快接受度越高。当然在Linkedin使用的是蓝图法则,3秒钟的法则。第三就是要规模化,规模化各这的角度来说,我们当时思考的方法是这样的,希望Linkedin内部所有的员工每一个人都能够用数据来分析帮他们做决策,很快的做决策。
怎么做到这一点?
第一步,我们需要建立一个真正的金字塔。分析师不应该从数据开始,他必须要从客户、产品、市场、销售开始,也就是说明白公司怎么能做到这件事。他必须要明白如何在这种层面标记未来的事物,标记比数据本身重要得多。分析师本身要分析自己以后要分析什么,这样才能把正确标记加到数据库里面去。他还必须要明白,数据库之间的公用,流程,每种数据是怎么分工的。
下面就干活了。在Linkedin有一个不成文的共识,你做的东西不仅仅是有趣是不够的,必须要注重执行性。我分析到这个结果以后到底能做什么,这是很重要的。说完了做以后咱们就走到决策,决策本身一定要实现增加商业的价值,或为团队增加价值。
第二步是规模化。需要用科技来把金字塔变成一个非常小的底,而大的中心,最小的一个尖的一个过程。举个例子,Linkedin我待的九个月之内和另外一个同事合作,完成了500个不同的需求项目和模型,但是当年我们其实直接支持两百个人,500÷200,每年我才回答2.5个问题,这绝对是非数据驱动。后来我们决定是把整个做一个系统,来模拟以前我们两做的大部分工作,这个系统响应3秒钟,简单的规模化了,大概花了三个月,五个人,在内部支持销售的,在今天为止每天这个系统可以服务1000个销售员工,大约用这个系统十次,用一次大约时间是3秒到一分钟,这个系统一天就能做到以前我们两个人做不到的事情,这就是一个规模化的结果。当年出来结果是我们销售增长了175个百分点。
第三步,产品化。内部的东西大致做到OK了,就要把内部积累的这些实践、经验和产品和规模化的东西,要做到网站上去,要进来大量自然的用户、企业的用户,比如说我们前面讲的那个支持内部销售的分析系统,在去年Linkedin就对外开始了一个新的业务,用数据帮助全世界所有的销售人员变得更有效率。
第四阶段,不断的开发新的数据产品。我们发现了第一个数据产品后,做第二个就非常容易了,然后第二个产品会利用第一个产品的结果,第三个又用第二个结果,结果造成了数据产品内部的网络化、矩阵化,推动人与人之间的交流、互动、合作。这就是下一步我们准备要做的,就是把所有的产品关联起来,让它们互相提供价值。实际上这都是建立在一个平台上面的,数据是一致的,产品是多样性的,服务的对象既是同一个人又是一个同样一个人不同的面,比方说,作为一个父亲来说需要为我的孩子花钱上学,我作为上班族来说我需要买汽车上班,所以人的需求是不同的,做同样的产品挖掘不同的数据。
加入文集

在阿里召集的数据群英会上,数据先锋们都怎么看“大数据”?

在阿里召集的数据群英会上,数据先锋们都怎么看“大数据”?2014年3月7日,阿里巴巴对外开放的数据峰会“2014西湖品学大数据峰会”在杭州召开。会上,阿里巴巴方面披露了目前该公司的数据储存情况。
目前在阿里数据平台事业部的服务器上,攒下了超过100PB已处理过的数据,等于104857600个GB,相当于4万个西雅图中央图书馆,580亿本藏书。仅淘宝和天猫两个子公司每日新增的数据量,就足以让一个人连续不断看上28年的电影。而如果将你代入成服务器,你处理的数据量则相当于每秒钟看上837集的《来自星星的你》。
目前全球仅有两三家公司计算技术达到单集群规模5000台服务器,阿里位列一席。随着数据量的继续增大,即使单集群到10000台,也依然会触碰到天花板。而阿里做到的是跨机房运算。这也意味着,服务器突破了机房的空间限制,可以无限延展。这一技术也让占据另一席位的facebook前来求教经验。
会上阿里巴巴集团商业智能部副总裁、数据委员会会长车品觉作了名为《大数据这三年》的主题演讲。他认为,2011年的时候,大数据概念兴起。2012年,商业开始尝试如何运营大数据。而如今,大数据进入了DATA时代,也就是所谓的数据工程化时代。 在数据工程化时代,首先要学会运营大数据,其次是大数据需要开放出来,运用到行业乃至整个社会,这样形成一个正循环,数据产生数据,循环反复,充分运营后,价值就会被不断地挖掘出来,让整个社会受益。
所以,大数据已经从4个V的年代,Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)延伸至三个维度,可实时性、可解释性、数据准确性稳定性。这三个维度是现在到底数据能不能用上的很重要的三个维度。
他认为大数据目前最大的障碍是,做业务的人不知道数据怎么用,做数据的人不知道别人怎么用。以控制为出发点的IT时代正在走向激活生产力为目的的DT(data technology)数据时代。这不仅仅是技术的升级,更是思想意识的巨大变革。
因此,之前想使用数据却无力购买服务器和增添技术人员的中小企业,可以获得数据存储、数据处理服务,也可以构建他们自己的数据应用;在这里,线上线下所有数据都能串联起来;在这里,所有人都是数据的提供方,也是数据的使用者;在这里,数据变成一种普及,就像语言一样,成为人人可用的东西,每个人都能享受数据成果。数据者的思维,将不再被应该怎么拿数据,应该怎么用数据所束缚;而普通人,也不会再被“今天吃什么”这样的问题所纠结。一切,都是数据化的。
在分享中,他还阐述了自己的数据十诫:1.好的问题,答案就在里面。2.在实践中提炼数据3.让数据变成Technology,Enable更多人4.让数据跟着“人”走5.木有数据质量,神马数据都是浮云6.以假设数据都能获取去思考问题7.大数据安全,不是监管8.利用数据拿到更有用的数据9.建立数据的数据,才有进步10.让人做人擅长做的事,让机器做机器擅长做的事.
阿里小微金服集团首席风险官胡晓明也做了名为《商业驱动下的大数据》的分享,他指出:数据没有大小之分,数据只有是否被商业认知之分。数据是一种信仰,只有让数据产生商业价值,数据才能变大,数据才能真正的为社会、为消费者、为制造业产生力量。据他介绍,阿里小微金服已经通过数据为70多万小微企业贷款,而且没有一家企业是实地考察,只通过数据的分析,就实现了良好的风险控制。同时,他认为当数据能够变成数据科学和数据知识的时候,它跟计划经济配在一起可以让计划变得更科学,这种配置会优于通过竞争而导致的市场化最优配置。相信这个观点会引来经济学家的巨大争论,这完全颠覆了西方主流经济学的基础理论。
来自安客诚(Acxiom)的首席分析官程杰则提出:大数据的价值在于连结。在他看来,公司网络、互联网以及网络软件,这三大领域的发展对于大数据有着至关重要的影响。同时又运用“盲人摸象”这一典故,形象地说明大数据在商业方面实现价值最重要的,也是最大的挑战在于数据的连结。现在数据很多,但是数据的价值是不一样的,尤其数据连结在不同的整合基础上,他们表现的价值完全不一样。数据如何连结?数据需要分解再整合,把一些复杂的现象分解成为单独的要素以后,就能看到最基本的特征,真正的理解了以后再把它重新组合。美国已经开发了4000个针对单个消费者的数据模型,使得廉价的数据使用之后价值成倍提高。
LinkedIn数据分析部资深总监张溪梦从数据分析与商业智能的角度提出数据分析的框架。他认为,商业分析就是用历史来预测未来,需要着力五个点:1、以前发生了什么?2、为什么发生?3、当前正在发生什么?4、未来会发生什么?5、如何改变未来?从商业价值的产出来看,第一步到第四步基本的商业价值是零,而是要把未来变得更好,这才是分析本身产生价值最重要的一环。
大数据不是越大越好,大数据分析有三个原则:第一,简单,分析出来的结果必须非常非常简单,没有任何花哨的东西,任何人都能够看明白看懂。第二,迅速,分析速度越慢接受度越低,越快接受度越高。第三,规模化,希望公司内部所有的员工每一个人都能够用数据来分析帮他们做决策,很快的做决策。
同时,他也提出了传统分析向大数据分析进化需要经历4个阶段:1、打造数据分析大金字塔;2、数据分析的规模化;3、数据分析的产品化;4、分析产品矩阵化,网络化,与合作化。
加入文集

阿里大数据的“三个维度”和“十诫”,值得一看

阿里大数据的“三个维度”和“十诫”,值得一看本篇文章主要是卖阿里巴巴副总裁车品觉的一张图。 
今天,阿里巴巴在杭州召开西湖品学·大数据峰会,请副总裁车品觉来跟一些媒体交流了下大数据心得。 以下是笔者从峰会上学到的一些东西:
1、2011年的时候,大数据概念兴起。2012年,商业开始尝试如何运营大数据。而如今,大数据进入了DATA时代,也就是所谓的数据工程化时代。 
而在数据工程化时代,首先要学会运营大数据,其次是大数据需要开放出来,运用到行业乃至整个社会,这样形成一个正循环,数据产生数据,循环反复,充分运营后,价值就会被不断地挖掘出来,让整个社会受益。
2、大数据的三个维度
大数据从4个V的年代,Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)延伸至三个维度,可实时性、可解释性、数据准确性稳定性。这三个维度是现在到底数据能不能用上的很重要的三个维度。
3、现在大数据运用里很重要的问题是:业务的人不知道数据怎么用,做数据的人不知道别人怎么用,所以里面是有一个很大的障碍在中间的。
车品觉说,需要运营数据。“当你搜集很多数据的数据帮我们解决很多未来的问题时,这个才叫大数据。”过去阿里的大数据做了两个循环,一个循环是在怎么用数据;一个循环是说怎样养数据,怎么改善数据。
三年前,阿里巴巴的大数据不仅可以看,还是可以用的。但是今天,不仅仅让自己用,而且让别人用。这一次的圈,当阿里要做让别人用的时候,第二个圈就比以前那个圈更困难了,更注重精准性。 
通过运营,阿里巴巴发现从整个运营里面产生了一些价值,即有很多新的数据和新的工具。现在,阿里巴巴最近就在解决这些问题:数据的产生、人才的不匹配、数据冗余、工具不统一、安全、质量,这些是整个行业做数据必须保障的,否则就不容易产生数据的价值。
4、以下这张图就是车品觉做的“数据十诫”,每一条都很有份量,值得一读,不必过多解释了。

文章为作者独立观点,不代表虎嗅网立场

向作者提问

加入文集

今日嗅评:好的营销放大情感,最后才是产品的惊鸿一瞥

今日嗅评:好的营销放大情感,最后才是产品的惊鸿一瞥古永锵的选择题:要不要娶腾讯视频?赵楠100投稿:古永锵现在落入了一个选择题,那就是,是选择接受腾讯?还是等着腾讯去结盟搜狐从而超越自己?腾讯+优酷,这个故事,不仅比搜狐+腾讯要更有回头率,还会遮住爱奇艺+PPS的性感。
Vito1qq:视频不是简单的1+1=2。土豆过去有特色,是小清新的特色,但是被优酷吞并之后却丧失了特色。反而不行了。腾讯本是毫无特色的视频网站,比土豆次多了。腾讯和搜狐的联手能够拿下的市场率也不是现有腾讯+搜狐就能算的上的。说不定无特色的腾讯还是降低。
肆叁不带套:按你的数据 且不说加起来超过100% 我想乐视再被挤兑也不会占不到1%的份额吧
如果视频业如你所说是简单的加法的话,优土合并时就该占到35%以上。可实际情况呢?在这个行业横向并购肯定是死路一条,百度收PPS要的也是他的移动端。腾讯收购的逻辑更是天方夜谭。
Jnc8oUeE:现在的视频网站区别不大,联合与否主要看流量和版权,对自制版权多照顾多服务的视频网站才有出路。
以后没悬念玩儿了!微软大数据专家,预测中第86届奥斯卡金像奖24个奖项的21个!微软纽约研究院经济学家大卫·罗斯柴尔德今年对奥斯卡预测再创佳绩,24个奖项押中21个。他通过收集赌博市场、好莱坞证券交易所、用户自动生成信息等大量公开数据建立预测模型
公关界的007:奥斯卡预测不仅有规律可循,而且都有及时数据可以监测。虽然有会计事务所保密,不过各大公司都各显神通,可以随时看到自己的得票情况,这不是秘密。小李跟李娜一样,在登顶的路途中艰难坎坷。#小李不哭#,再坚持3年,会给你1个小金人!
怎么让消费者一起玩?可口可乐的“节点”营销fanglopez投稿:作为消费品公司,必须明白:消费者能够创造比你们更多的信息;是消费者而不是你拥有你的品牌。可口可乐的作用应该是主持人,而不是广播者或者布道者。
如意乐1qq:在此次营销案例里,可乐给我们带来了四点大象也灵活的启示:
一、抓住短暂的热度,细分市场里不只是划分产品,划分需要,也可以划分人群,比如昵称瓶案例。
二、再次把情感里的感同分子放大。
三、爆发式营销时间比故事更重要,其实大多数营销者都希望论述一个好故事,但在爆发式营销方面,其实时间比故事更重要
四、说故事的能力,不在于放大产品,而在于放大情感,在情感里产品只是存托,这就是硬营销与软营销的区别,低档的营销喜欢不断在任何场景里放大产品,而软营销通常是在放大场景放大情感最后结束才是产品的惊鸿一瞥。
加入文集

以后没悬念玩儿了!微软大数据专家,预测中第86届奥斯卡金像奖24个奖项的21个!

以后没悬念玩儿了!微软大数据专家,预测中第86届奥斯卡金像奖24个奖项的21个!今天(美国时间3月2日,北京时间3月3日),第86届奥斯卡金像奖在洛杉矶揭晓。是不是很沮丧,此前在某些群体里夺奖呼声很高的、或许正是你喜欢的迪卡普里奥又落选影帝?其实,在奖项宣布前,微软纽约研究院的经济学家David Rothschild(大卫·罗斯柴尔德)的研究就显示,最佳男主角获胜概率最高的本来就是修·麦康纳。少数影迷趣味败,大数据赢。
现在,在美国预测总统大选、或者什么超级碗赛事结果时,很多人都会上PredictWise(Rothschild用以公布预测结果的官方网站)去看看大卫·罗斯柴尔德以及他收集到的大数据怎么说。他都是使用百分比表示该预测结果实现可能性。
去年,罗斯柴尔德成功预测24个奥斯卡奖项中的19个奖项。今年,罗斯柴尔德针对奥斯卡也做出了预测。他通过收集赌博市场、好莱坞证券交易所、用户自动生成信息等大量公开数据建立预测模型,而绝非来自个别人喜好,其预测结果会随着时间和数据变化而更新。罗斯柴尔德团队和Office部门合作开发了Excel App “Oscars Ballot Predictor”,帮助实现动态数据的挖掘。
罗斯柴尔德表示:“这是我第二次预测奥斯卡奖,相比去年,今年的预测难度增加了。因为去年预测奥斯卡时主要电影颁奖典礼已经结束,我们的预测结果可以基于各大电影颁奖典礼的数据进行判断。”
不过,他补充道:“我从2013年的预测中学到了不少经验,这将让我在2014年预测更准确。去年我和我的同事利用数据模型、独特的投票数据和多种形式的预测市场数据,这其中有利有弊。而在2014年的奥斯卡奖预测中,我们引入了新的技术方法。”
“与去年相比,我们今年收集了更多的数据,不断完善今年的奥斯卡奖预测。”
他的数据告诉了我们什么呢?下面是其中一些预测结果(数据结果截至美国时间3月2日6:13 am奥斯卡颁奖典礼开幕前):
最佳影片:为奴十二年,88.7%最佳导演:阿方索·卡隆(地心引力),  97.6%最佳男主角:马修·麦康纳(达拉斯买家俱乐部),  90.9%最佳女主角:凯特·布兰切特 (蓝色茉莉), 99.2%最佳男配角:杰瑞德·莱托 (达拉斯买家俱乐部),97.9%最佳女配角:露皮塔·尼永奥 (为奴十二年),60.1%
罗斯柴尔德还说,主要奖项中唯一一个竞争相当激烈的是最佳原创剧本奖,根据他的分析,电影《她》获奖的可能性最大为56.3%,紧随其后的是获奖可能性为41.8%的美国骗局。
最后,最佳原创剧本奖获奖影片正是《她》。
事实上,在去年预测准19个基础上,今年罗斯柴尔德再接再厉,成功预测了第86届奥斯卡金像奖颁奖典礼24个奖项中的21个!哪个自然人能有这样的威力?
服不服?
附:第86届奥斯卡金像奖获奖名单
    最佳影片 《为奴十二年》    最佳导演 阿方索·卡隆 《地心引力》    最佳男主角 马修·麦康纳 《达拉斯买家俱乐部》    最佳女主角 凯特·布兰切特 《蓝色茉莉》    最佳男配角 杰瑞德·莱托 《达拉斯买家俱乐部    最佳女配角 露皮塔·尼永奥 《为奴十二年》    最佳原创剧本 斯派克·琼斯 《她》    最佳改编剧本 约翰·莱德利 《为奴十二年》    最佳动画长片 《冰雪奇缘》    最佳纪录长片 《离巨星二十英尺》    最佳外语片 《绝美之城》    最佳剪辑 阿方索·卡隆和马克·桑格 《地心引力》    最佳摄影 艾曼努尔·卢贝兹基 《地心引力》    最佳视觉效果 提姆·韦伯、克里斯·劳伦斯、大卫·舍克、尼尔·科博尔德 《地心引力》    最佳音响效果 史凯普·李维斯、尼夫·安迪里、克里斯托弗·本斯泰德、克里斯·穆洛 《地心引力》    最佳音效剪辑 格伦·弗里曼托 《地心引力》    最佳艺术指导 《了不起的盖茨比》    最佳服装设计 凯瑟琳·马丁 《了不起的盖茨比》    最佳化妆与发型设计 罗宾-马修斯、阿德瑞萨-李 《达拉斯买家俱乐部》    最佳配乐 《地心引力》    最佳歌曲 《冰雪奇缘》    最佳动画短片 《哈布洛先生》    最佳真人短片 《氦》    最佳纪录短片 《6号女人:音乐把我拯救》    人道主义精神奖 安吉拉·兰斯布里、史蒂夫·马丁、皮埃洛·托西、安吉丽娜·朱莉
加入文集

从百度迁徙地图看大数据的接地气

从百度迁徙地图看大数据的接地气长夜漫漫,无心睡眠,我以为只有我睡不着,原来晶晶姑娘你也睡不着!请问你也是春运没买到坐票吗?
每年的这个时候,总会流传着一张图片,那就是非洲的角马大迁徙和春运盛况的对比图,隐含的意思无非就是说“雨季又过了,又到了春运的季节,男男女女们挤在一起,随着列车轻轻的摇动,就如同那雄海龟趴在雌海龟的身上……”

所以当百度推出的春运迁徙地图在央视亮相的时候,马上让我眼前一亮。作为这种大数据可视化产品的脑残粉,一定要跳出来赞一下。
一.迁徙地图背后的大数据可视化

从全国迁徙图首页可以看出,数据来源是百度地图LBS开放平台,并且辗转找到此项目的负责人求证后,也验证了这一产品的数据来自于众多使用了百度地图的应用所传送来的定位请求,从而对所有请求信息进行辨认设备和定位位置变化来分析处理全样数据。
上面的话比较拗口,简单点儿说,就是只要你的手机里装有使用百度地图API的应用,那么你的长距离移动就是这张地图里的一条线。
只拿此刻的数据进行一下解读,1月26日上午十点,在过去八小时内最热的迁入城市前三名是北京重庆和赣州。无论重庆和赣州,都是劳务输出的重点地区,排名前三理所应当。那么北京为什么位居迁入城市第一?
点开北京的路线详情就能看到,迁入北京的大部分是廊坊、天津、葫芦岛等地的人,只是把北京当做一个交通中转站而已。这也就是北京能在迁出城市和迁入城市都能名列第一的原因了。
已经看到有人质疑这种产品有什么作用。在我看来,再牛逼的大数据挖掘技术,如果不能以一个接地气的方式表达出来,那么永远就只能停留在拙劣的公关PR稿中。举一个最浅显的例子,如果铁道部看完这个图,那么他们至少知道下一步的高铁线路应该怎么铺设。如果你是那个在火车上卖WIFI的小哥,你肯定也会选择最热线路吧?卖烧不坏的袜子、越南跌打膏之类的朋友们同理。
前两天,陌陌也推出了他们春运版的数据,盘点了热门回家线路热门群组各种数据。但是看完之后,我陷入了深深的失望,我最盼望的数据是“漂亮妹子最多的线路”“漂亮妹子最多的车厢”“D杯以上无座只好站着的漂亮妹子最多的车次”……
二.称赞与吐槽
一直以来,百度是我心目中人格最分裂的公司,A面是一个善于营销和自我推广的公司,但是最近几年推出的新产品基本都是跟随型产品,别人先蹚出一条血路,然后百度再用自己庞大的用户群和流量去拓宽这条路,包括踩死先行者。B面是一个拥有着众多牛人和牛逼数据的GEEK,但是却不拿这些数据来做一些让人拍案叫绝的东西。

如果想成为谷歌一样受到全世界尊重的搜索公司,那么百度必须要做一些让人惊叹的产品。例如2008年前,谷歌推出了一个单独的小产品–流感疫情地图,里面将从世界各国卫生组织收集到的流感信息用可视化的方式呈现出来,这样你在出差的时候,就知道是否应该带药品了。(嗯,根据地图显示,我国人民身体素质很好,身体倍棒吃嘛嘛香不得感冒)。

从表面上看,这产品对谷歌商业化产品没有任何拉动作用,但是经过这样的尝试,在两年后,当H1N1病毒肆虐的时候,谷歌已经能将患病高发区整合进自己的地图应用了。
百度迁徙地图算是百度近年来比较少见的,不以拉动任何产品下载使用为目的的数据产品了。但是就产品细节来说,有不少地方有待改进,例如视觉的炫酷感,例如地图的可点击操作等等。

无独有偶,就在五天前,英国《卫报》推出了他们的一个数据产品,叫做《在天上–航空的百年史》。因为1914年是世界上首个商业航班试飞成功,当时只有1名乘客。1914年全年也只卖了1205张票,而2013年卖了31亿2千万张飞机票。产品首页就实时展示了现在全世界上空正在飞行的飞机数和过去24小时所飞过的航线图,很炫很酷,并且密集恐惧症患者慎入。(地址,可能需要翻一下~)
三.大数据需要更接地气
大数据,要玩起来,才会更好玩。我们经常会在公关PR稿中看到这样的话“在本次发布会上推出的新版本,是基于大数据,由业内资深的大数据挖掘团队和机器学习团队埋头研究数月才推出的……”让人不明觉厉。同样的句式,放之四海而皆准,例如情趣用品,也可以说“我们这次推出的新的按摩棒,是基于大数据,由业内资深大数据挖掘团队和机器学习团队埋头研究数月才推出,完全符合绝大多数中国女性的使用习惯……”
所以,大数据现在需要的是将一个泛概念变成一个个接地气的产品或者项目。例如美国梅西百货,他们会根据库存和需求变化情况,实时的调整7300万种商品的实时定价。例如洛杉矶警局,会根据各个区域之前的犯罪率和居住情况,预测性的调整巡逻频率和力度。
百度迁徙地图,如今只是刚上线,所以更多起到的是公关和宣传的作用。而如果这个产品能坚持10年,那么这一定是了解中国产业结构变化和人群生态变化的最简单的途径。
打住,写到这里,突然觉得上面的文字正经到了可怕的地步。
我终于在过年回家之前,把自己的状态调整到了一个六线城市里的木讷内向男中年,准备在“瓜子花生矿泉水,鸡腿盒饭收收腿”的亲切乡音中要变身成地图上的一条线了……
向作者提问

姚晨看完感叹的——2013中国影视全V榜,大数据分析做出来!

姚晨看完感叹的——2013中国影视全V榜,大数据分析做出来!
created by:《影视圈》杂志、数托邦创意分析工作室/editor :刀刀/制图 :刘允泽 影视圈资源库
虎嗅注:姚晨看完此文,后发出感想:“矮马,在此之前,我一直以为自己只是女观众的菜”。大数据的作用多大啊,从《武林外传》后,你一直是我的女神啊!
是时候有一个新榜单了。
电影盘点,不要只看票房榜;电视剧盘点,不要只看收视率榜;明星盘点,也无须对着各路盛典大奖干瞪眼。《影视圈》杂志将用大数据告诉你一个不一样的2013影视圈。
最多元的评价指标、最多的投票人数、最准确客观的数据、最公开透明的意见表达、最顺畅的信息流动,汇集成365天全年度的观察数据——《影视圈》杂志联合数托邦工作室推出“2013中国影视全V榜”!
在粉丝经济渐成气候的今天,由社交媒体产生的数据榜单将是一面更为真实的镜子,360度无死角,不仅照见当下,更可预测未来。

新浪微博上的加V个人用户虽然在新浪微博3亿多的用户总量中占比不大,但却可以深刻影响整个微博虚拟社区的舆论生态及走向。为制作2013中国影视全V榜,《影视圈》杂志联合数据团队数托邦,对新浪微博上超过60万加V认证用户的影视提及微博进行了地毯式的爬取分析。
数据显示,全V人群的平均年龄为28.5岁,男女比例为1.78:1,南方用户略多于北方(北方用户与南方用户之比为0.92:1),人均坐拥粉丝2.2万个。
为了便于深入分析,数托邦还对全V用户进行了进一步的群体细分,将在个人昵称及认证说明中提及影视相关信息的用户归为“影视用户”,这个约5.5万人规模的圈子即为全V中的“影视圈”。如果说全V用户对影视行业的影响是间接传导式的影响,那么“影视圈”这个“小”圈子则对行业有着更直接有效的影响力。
下面就由全V投票,新鲜揭晓2013年震动“影视圈”的那些作品与那些演员。

2013年内地共上映电影305部,其中60部电影票房过亿,国产片占到了33部。全年的票房冠军《西游·降魔篇》在2月上映,累积收入票房12.46亿元。其后陆续还有《北京遇上西雅图》(5.2亿)、《致青春》(7.19亿)、《中国合伙人》(5.39亿)、《狄仁杰之神都龙王》(6.02亿)等国产片强势爆发,最终成就了全年国产片的高票房佳绩。
2013中国影视全V榜之国产电影TOP10的排名,在某种程度上也呼应了国产影片的票房吸金能力。虽然上榜影片与国产片票房年度前十名并不完全一致,排名顺序也略有差异(国产片年度票房前十名依次为:《西游·降魔篇》、《致青春》、《狄仁杰之神都龙王》、《私人订制》、《中国合伙人》、《北京遇上西雅图》、《小时代》、《警察故事2013》、《风暴》、《天机·富春山居图》),但上榜电影无一例外都是票房过亿的影片。
年初上映的《一代宗师》与年末搭上车的《无人区》凭借作品好口碑站稳脚根;年度话题作品——《小时代》、《天机?富春山居图》、《私人订制》也在全V榜中占据了一席之地。不过,与这些曾被大V黑过的话题影片相比,《致青春》明显更受偏爱。而《致青春》能在年度全V榜中问鼎冠军,与全V用户平均年龄偏高脱不了关系——数据已经表明,人们平均到28.5岁的时候,就要开始回忆青春了……
总的来说,上榜电影都是票房和话题性双收之作。只不过这股子热度,有的是归功于影片本身的品质,有的是归功于电影营销的技巧,有的是归功于自黑的决心以及被黑的勇气,还有的则多亏了网民们的——无聊。

“他她榜”再次证明了男人与女人是不同的生物。
全V男性用户提及国产片偏好度排名前五位的电影分别是《无人区》、《狄仁杰之神都龙王》、《天机·富春山居图》、《中国合伙人》与《私人订制》。从类型来看,悬疑、动作、武侠仍然是男性偏爱的类型。励志故事更能让男性找到共鸣。而《天机·富春山居图》与《私人订制》的上榜则让小编不怀好意地揣测,在微博上黑这俩电影的,会不会绝大多数都是男人啊。
全V女性用户提及国产片偏好度排名前五位分别是《分手合约》、《被偷走的那五年》、《北京遇上西雅图》、《小时代》、《致青春》——满满的全都是“爱”。可见爱情片(如果你硬要说《小时代》是友情片小编也不能反对)仍然最容易俘获女性观众的心。而《分手合约》与《被偷走的那五年》能够打败《北京遇上西雅图》、《小时代》、《致青春》,奇迹般的排到状元和榜眼的位置,想必是在营销上下了很大很大的力气,都不容易啊。
多说一句:据说在电影院看什么电影,选择权大多数时候是在女人手中。如果真是这样的话,好像还是拍爱情片更容易赚钱啊?

不同代际的观众对影视作品也有着不同的偏好。代际榜显示,70前与70后偏好榜前五名,与80后、90后及00后偏好榜完全没有重合。从《无人区》等五部作品的平均新闻热度可以看出,70前与70后明显比其他代际更关注影片的社会话题性及其口碑评价。而从上榜影片类型来看,80后,尤其是90及00后表现出了更明显的轻松观影倾向。

关于地域榜,先说一点背景。2013年全国十大票房地区依次为广东、江苏、北京、浙江、上海、四川、湖北、辽宁、山东、福建。并且数据显示,内地电影市场的增长重心,已经从一线票仓逐渐转移到二三线票仓:北京、上海等一线城市票房,由于市场饱和,在增长上已经表现出后继无力的迹象,在全国票房前十地区中,北京、上海的增长均不超过16%,而其余各大地区省市的票房增长基本都在25%以上。福建更是以45.7%的增长高居榜首。
一言以蔽之,南方观众的喜好很可能将越来越深刻地影响一部电影的票房表现。
在这样的背景下,我们再来分析南北方V用户们对国产片的偏好。南北方用户偏好差异之巨大,不是空口说白话。榜单中,影片前五名完全没有重合。整体而言,北方榜前五名作品,气质都比较爷们儿。南方榜前五名的作品,气质都比较婉约。北方榜《私人订制》排名第一,证明了冯小刚仍然是北方观众最爱的谈资。南方榜《小时代》排名第一,这一点《小时代》早在南方城市举办粉丝见面会时就已经用观众的实际反响证实了。

2013年,好莱坞科幻、动作片充斥银幕,近60部进口片收入内地票房90.02亿元,同比增长2.30%,占比41.35%。进口片中有27部票房过亿,其中大部分来自于好莱坞六大公司的分账大片。分账片票房第一名是《环太平洋》,收入6.94亿元(2013年进口片票房第一名是《钢铁侠3》,7.5亿元,但《钢铁侠3》是作为批片引进内地,在数据采集时未列入分账片全V榜)。
进口分账片全V榜第一名是《速度与激情6》,该片主演保罗·沃克2013年底意外去世,会在某种程度上推高该影片的微博提及数值,因此该片数据应该在此基础上审慎估计。

2013年的电视剧市场没有产生《甄嬛传》那样现象级的作品,巨制大戏没能复制辉煌,几部雷剧却赚得盆满钵满。电视剧收视率整体低迷,据媒体统计,卫视平台播出的800余部剧中,平均收视率过2的剧集屈指可数,仅《百万新娘之爱无悔》、《有你才幸福》、《咱们结婚吧》三部剧破2。
虽然电视收视率低迷,网络点播量却十分火爆。网络话题的热炒效应及网络收看方式的全面崛起,已经使网络播出平台成为电视剧的一大主战场(参见VLinkage提供的“2013年电视剧网络播放量Top10榜”)。
在全V榜之电视剧榜前十中,古装武侠剧、都市情感剧、历史剧三分天下。对武侠经典《笑傲江湖》、《天龙八部》的翻拍,虽然遭到观众的猛烈吐槽,但也收获了极高的关注度。以《小爸爸》、《咱们结婚吧》、《门第》、《推拿》为代表的都市情感、家庭伦理剧,也在2013年继续发力——有的像茶余饭后的甜点,有的则像陈年老酒。历史剧在这一年的表现则让人颇为遗憾,《楚汉传奇》、《赵氏孤儿案》、《精忠岳飞》的收视表现都不尽如人意,反倒是古装偶像剧《兰陵王》俘获了不少年轻观众。

从榜单来看,男性更偏爱古装武侠与历史剧,英雄主题最受男性观众的青睐。女性则对都市情感、家庭伦理剧更有代入感,俊男美女搭档出演的偶像剧(冯绍峰、林依晨《兰陵王》,钟汉良、张钧甯、贾乃亮《最美的时光》)也更受女性观众待见。

电视剧就像是一本人生操作指南,处于不同人生阶段的观众都希望从电视剧中读解生活的难题与经验。70前及70后在《我的父亲母亲》中追忆,在《老有所依》中感悟,80后则在《小爸爸》和《咱们结婚吧》中学习育儿经和脱单法,青春无限好的90后和00后也不甘示弱,正在大踏步追赶80后的节奏。

北方榜,历史剧《楚汉传奇》、《精忠岳飞》上榜,剧集主题凸显历史正气与英雄豪情。南方榜排在同样位置的则是两部武侠经典的翻拍作品《笑傲江湖》和《天龙八部》。在对情感剧的偏好上,北方V用户更多地关注了《咱们结婚吧》、《我的父亲母亲》、《老有所依》这样现实感更强的作品,南方V用户则明显对《兰陵王》、《最美的时光》这样浪漫色彩浓厚的作品更感兴趣。

加V用户都在谈论哪些明星?全V最热明星提及榜,上榜的大多是混电影圈的,都是积势多年的“少壮派”,并且每个人都不缺话题性。如果非要找出成功突围的“黑马”,那就只能是85后的杨幂了(注:明星的入围标准是2013年度有其主演的电影电视剧上映)。
微博女王名不虚传,姚晨仍最具关注度和人气。她的私生活、影视作品一直受关注,她关注社会公共事件勇于发声,渐趋“准公知”的范儿也让她收获了不少点赞和人气。她的影响力发于此圈,又不止于此圈。周杰伦高中榜眼,叱咤歌坛10余年的周董在2013年推出自编自导自演的电影《天台爱情》,影片融合了歌舞等多种元素,类型难以界定,但关注度不减。
总的来说,但凡2013年有好作品(或者说人气作品)交出的明星,排名都不会很差。可见,拍点好作品,很有必要啊。

影视圈中人,也是有偏好的。一般来说,这个圈子更趋向于作品导向,谈起明星来,也更有业务范儿。所以,如果你有好作品,别担心,你也有机会成为“影视圈”热议的Queen和King。
从2013年的榜单来看,在“影视圈”这个子关系网络中,大家提及比例最高的前十位明星,除了白百何、柳岩以外,全都是男星。另外,排名前十的演员许多都在类型片中有过令人印象深刻的表演,例如徐峥与黄渤在《无人区》中的表演,白百何为小妞电影代言,古天乐、郭富城则一直是警匪动作片中的熟人。

关于全V微博传播力榜单,我们先来解释一下。单纯的粉丝数作为评价微博账户影响力的指标已经显得日益鸡肋,在讲“关系”的微博平台上,血拼的是高质量的粉丝及有质量的互动。为此,我们新增了“V粉丝量”和“粉丝互动量”两个指标来衡量明星微博的实际影响力、传播力,在此基础上生成“微力榜”。
一般认为,微博粉丝中加V用户越多,微博传播力越强,辐射范围越广,影响力也越大。“粉丝互动量”则通过计算每条微博的转发量、评论量、点赞量总和来量化内容的实际传播效果和渗透力。我们选取每个明星微博转评赞量的中位数作为“粉丝互动量”的参考值。这两个指标让微博有力地摆脱了粉丝陷阱,不仅是微博账号健康程度的重要参考,同时也是微博活跃度、内容渗透力和号召力的重要指标。
在“加V粉丝榜”中,姚晨、文章、何炅摘得前三甲。“粉丝互动榜”的前三名被钟汉良、范冰冰、王力宏收入囊中。

2013年男V心中的年度男星,排名前两位的是功夫巨星李连杰与成龙。刘天王虽然出演了年度烂片《天机·富春山居图》,好在还有《风暴》替他扳回一城。《无人区》的好口碑则让人们对徐峥、黄渤这对黄金组合有了更多期待。
而在女V心目中,帅才是最重要的。痴情硬汉钟汉良、魅力大叔吴秀波、阳光型男彭于晏、儒雅小生冯绍峰,还有大众情人“二哥”黄晓明,这五人是国内影视圈如今最当红的帅气男神,也算聚齐了女性对未来伴侣的所有期待。

暂且不论周立波的咖啡大蒜论是否有道理,在喜欢男星的口味上,南北方V用户确实表现出了明显的差异。
北方V用户最喜爱的男明星前五位都是内地男星,分别是:黄渤、佟大为、陈道明、吴秀波、徐峥。而由于地缘文化的关系,南方V用户明显更青睐港台明星。古天乐、彭于晏、周杰伦、郭富城和刘德华才是他们的那杯茶。

都说男人看女人的眼光和女人看女人的眼光是不一样的,“女星之他她榜”告诉我们,还真的是不一样的。
男性V用户最关注的女星,不是姚晨,不是范爷,不是国际章,竟然也不是志玲姐姐,而是柳岩。性感尤物,剑走偏锋,成为男人心中的新女神。
女性V用户提及最多的女星则可以归为三类:知性优雅型、个性辣妈型以及小妞型。一直以清新知性形象示人的刘诗诗在女性粉丝中素来人气颇高,2013年她与“四爷”吴奇隆的恋情公布,更是成为圈内的一段佳话。孙俪放下“甄嬛”的光环,2013年以个性辣妈的形象再次赢得观众的喜爱。汤唯的优雅、舒淇的性感,则早已成为她们的标签。至于不太着调的小妞白百何,大概正符合女性心中好闺密的形象吧。

在对女星的喜欢偏好上,南北方V用户们表现出了一致性。杨幂、林志玲、高圆圆、章子怡、舒淇等女星的人气热度处在全国范围内的等值线。而很有意思的一点是,在众多一线女星的卡位中,白百何被更多的北方V用户讨论、关注,看来“治愈系女王”的不着调在北方用户那里还是很受认可的。
看完榜单了,你有什么想说的?或者,你还想知道更多的排名情况?

新浪微博@影视圈杂志,来问我们吧!数托邦(DATATOPIA)创意分析工作室是一支热衷于探索大数据价值的创意应用团队,团队成员均毕业于清华大学,专注于大数据处理与挖掘、微博微信新媒体分析以及大数据创意应用研发。
新浪微博ID:@数托邦。来源:《影视圈》杂志
向作者提问

大数据分析《私人订制》观众群像

大数据分析《私人订制》观众群像
虎嗅注:本文来自《中国广播影视》。相关数据由《中国广播影视》联合数托邦创意分析工作室抓取自新浪微博,选取涉及《私人订制》《泰囧》《小时代》共43.1万篇原发微博,从中抽取30.5万名独立观众进行对比数据分析。虎嗅进行了相关的编辑。
从大数据的角度分析《私人订制》的口碑评价,并通过对于观众的群像勾勒,看看未来冯小刚电影到底能走多远?

观众基本认可

通过与各电影同时提及的正负面词汇进行语义统计,《私人订制》在观众中的整体口碑为6.23分,的确不如《泰囧》,但比《小时代》高。《私人订制》的观众评分还可以参考:豆瓣网60695人评价,评分5.5分;时光网14301人评价,评分5.8分。

《私人订制》并没有“传说中”那么差,有七成观众给出了正面和中立的评价。而影评人和观众的评价,尤其是在争议性较大的电影上,确实存在一些差异。不过他们也可以达成共识,比如对《泰囧》的评分就基本相同。从整体口碑来看,无论是影评人、财经人士还是普通观众,《私人订制》的口碑均低于去年同期的喜剧电影《泰囧》。
观众的评价

观众的吐槽点集中在:和《甲方乙方》雷同“炒冷饭”,网络笑话不好笑等等。观众的好评中,“向自然道歉”这一段获得了大家的认同,而插曲《时间都去哪儿了》也是泪点之一。
值得注意的是,我们发现观众中提及“想去看看到底有多烂”的人数达到了0.24%,这和好评中的“群众里面有坏人0.20%”人数非常接近。这些“居心叵测”的观众,在某种程度上也推高了票房,看来的确像冯小刚在电影里感慨得那样,“群众里面有坏人”啊!
24岁的北方人在看

《私人订制》的观众平均年龄都是24岁,基本和新浪微博活跃用户年龄重合。但《私人订制》的90后和70后观众更多,年龄跨度大。

《私人订制》集中在北方地区,最远仅“攻占”到河南。从观众偏好度来看,《私人订制》并不算为全国观众“订制”的电影,王朔的京式调侃、冯小刚及葛优的“冯氏贺岁金句”,更多是语言上的幽默讽刺,北方观众喜闻乐见,南方观众则不太买账。
看冯小刚却喜欢张亮和郭涛
这群平均年龄24岁的年轻观众到底喜欢什么,这大概是冯小刚没琢磨明白的。

  通过明星关注排行榜,可以看出《私人订制》的观众和湖南卫视真人秀节目《爸爸去哪儿》的观众高度重合。而《私人订制》观众关注的明星中,冯小刚排名第十四名,演员白百何、李小璐、郑恺都没有上榜,这说明演员对目标观众没有很强的吸引力。其人群定位是模糊的——看《爸爸去哪儿》的、喜欢在年底看贺岁片的白领阶层。
这次《私人订制》的口碑争议较大,让爱冯小刚电影的观众遗憾颇多,他们下次是否还会捧场?在这个市场细分的时代,《私人订制》到底是为谁订制的?观众定位模糊,并仍然集中在北方,没有扩展到全国,冯小刚电影的票房号召力能延续多久?如今电影导演新人辈出,冯小刚的时代是否过去了?