以满足信息的传输、处理、存储、显示、记录和
从字面上不难理解,“大数据”之大,意味着数据“众多、海量”。我们在对多个搜索引擎[1]的百科词条(如百度百科、好搜百科、国搜百科、维基百科等)中,关于“大数据”词条所做解释的基础上,对“大数据”概念形成如下比较清晰、完整的认识。大数据,又称巨量资料,其规模巨大到无法通过人脑,甚至主流软件工具来收集和处理,需要更新的处理模式(如Hadoop技术[2]),才能实现对海量数据的收集、管理、内在价值挖掘与分析,并从对海量数据的处理中,获得更强的决策力、洞察发现力和流程优化能力。总之,大数据是一种海量、高增长率和多样化的信息资产。可以说,大数据是人类科技发展到一定高度的产物。我们回顾大数据近几年的发展历程,可以看到,大数据在舆论层面开始备受关注的一个标志性事件,是在2011年5月,全球知名咨询公司麦肯锡(McKinsey Company)发布了一份报告《大数据:创新、竞争和生产力的下一个新领域》,这是专业机构第一次全方面地介绍和展望大数据。这篇报告指出,大数据已经渗透到全球范围内的每一个行业和业务职能领域,成为重要的生产因素;人们对海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。报告还指出,“大数据”源于数据生产和收集的能力,以及速度的大幅度提升。这是因为,越来越多的人、设备和传感器[3]通过数字网络连接起来,产生、传送、分享和访问数据的能力也在发生着深刻的变革。2012年3月,美国发布《大数据研究和发展倡议》,该倡议标志着大数据已经成为重要的时代特征。同时,美国政府还宣布投资2亿美元到大数据领域,将数据定义为“未来的新石油”,高度重视数据资产的价值,并表示,国家层面的竞争力将部分体现为一国拥有数据的规模、活性以及解释、运用数据的能力;国家数字主权体现为对数据的占有和控制。数字主权将是继边防、海防、空防之后,又一个体现综合国力的重要领域。对此,我国也在国家层面对大数据投入了足够的重视。比如,早在2011年12月,我国工信部把信息处理技术作为物联网[4]发展中的4项关键技术之一提了出来,其中就包括海量数据存储、数据挖掘、图像视频智能分析等,而这些技术已经构成大数据技术的重要组成部分;2015年9月,国务院又印发《促进大数据发展行动纲要》,明确指出,要推动大数据的发展和应用,开启“大众创业、万众创新”的新格局,培育高端智能、新兴繁荣的产业发展新生态,在国家层面系统部署了大数据发展工作。可以想象,当大数据已经超越商业行为,上升为国家战略时,大数据已经成为我们商业生态环境和日常工作生活中所不可缺少的部分。比如,2012年7月,为了进一步挖掘大数据的价值,阿里巴巴集团在管理层设立了“首席数据官”一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台——“聚石塔”,为天猫、淘宝平台上的电商及电商服务商等提供大数据服务。随后,阿里巴巴董事局主席马云还在2012年度网商大会上强调:“假如我们有一个数据预报台,就像为企业装上了一个GPS[5]和雷达,你们出海将会更有把握。”因此,阿里巴巴希望通过分享和挖掘海量数据,为中小企业提供更多信息价值;阿里巴巴也成为最早提出通过数据进行商业化运营的企业。大数据还可以进一步深化我们对很多事物的认知,从而有助于我们做出更为明智的决策。举个日常生活中简单的例子来看,我们在抛硬币时,如果想知道硬币出现正面或反面的概率究竟有多大,假如只抛10次,可能会出现正面9次、反面1次的情况,也可能是其他正负不均的情况,倘若我们据此去下结论,那么抛硬币时,出现正面、反面的概率可能会有很多。假如我们抛10万次、100万次,甚至更多次,那么统计出来的结果就会趋于正确,即正、反面出现的概率一定是各占50%。此外,美国华尔街“德温特资本市场”公司首席执行官保罗·霍廷每天要做的一件事情,就是利用电脑程序分析全球3.4亿微博账户的留言,进而判断民众情绪,再以“1”到“50”进行打分。根据打分结果,霍廷会决定如何处理手中数百万美元的股票。霍廷的判断原则也很简单——如果所有人似乎都高兴,那就买入;如果大家的焦虑情绪上升,那就抛售。这一招使霍廷收效显著,在当年第一季度,霍廷的公司就获得了7%的收益率。可见,大数据思想广泛运用在我们生活中的很多方面。大数据之大、之海量是基础,对这些数据进行分析、深入挖掘并得出某种有价值的认知来指导我们的商业行为与生活,才是大数据的灵魂所在。关于大数据的特征,我们可以用4个“V”来描述,即:(1)Volume,数据量大大数据的起始计量单位至少是PB、EB或ZB[6],数据量极为浩大。(2)Variety,类型繁多包括网络日志、音频、视频、图片、地理位置信息等,多类型的数据对数据处理能力也提出了更高的要求。(3)Value,价值密度低随着物联网技术的广泛应用,信息感知无处不在,因而信息海量,但价值密度相对较低,如何迅速完成对大数据的价值提取,是大数据时代亟须解决的问题。(4)Velocity,处理速度快,时效性高这要求我们不仅能够收集与存储海量数据,还要对海量数据做出快速处理,这对我们在大数据时代的数据驾驭能力提出了新的挑战,也为我们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。到此,我们对大数据概念有了一个比较清晰的认识。接下来,在大数据广泛的运用领域中,我们来看使用大数据进行的营销,即大数据营销为何物。* * * [1]搜索引擎,英文名称“Search Engine” ,是一种软件系统,它能够根据一定的策略、运用特定的计算机程序,从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,并将检索到的相关信息展示给用户。著名的搜索引擎有Google(谷歌)、Yahoo(雅虎)、Bing(必应)、百度(baidu)、好搜(haosou)等。[2]Hadoop,是由著名的Apache软件基金会开发的一个能够对海量数据进行分布式处理的软件架构,它可以通过高效、可靠、可伸缩的方式对海量数据进行存储与处理。Hadoop架构最核心的设计是HDFS(Hadoop Distributed File System,即“Hadoop分布式文件系统”)和MapReduce;其中,HDFS为海量数据提供了存储功能,MapReduce为海量数据提供了计算功能。[3]传感器,英文名称“sensor”是一种检测装置,能感受到被测量的信息,并能将感受到的信息,按一定规律变换为电信号或其他所需形式的信息输出,以满足信息的传输、处理、存储、显示、记录和控制等要求。我们平时生活中所接触到的自动门、公交卡等物品便嵌有传感器装置。[4]物联网,英文名称“Internet of things”,是物物相连的互联网,也是新一代信息技术的重要组成部分。[5]GPS,是英文Global Positioning System(全球定位系统)的简称。它起始于1958年美国军方的一个项目,1964年正式投入使用,后扩展到民用领域。GPS利用定位卫星,可以在全球范围内进行实时定位、导航,现在多个领域(如车辆、智能手机等)获得广泛使用。[6]计算机中的数据由“0”和“1”两种状态组成,每种状态称为1位(bit);计算机最小的基本单位是字节(Byte),1 Byte=8 bit,1 KB=1024 Byte,1 MB=1024 KB,1 GB=1024 MB,1 TB=1024 GB,1 PB=1024 TB,1 EB=1024 PB,1 ZB=1024 EB。我们平常使用的PC机(个人电脑),硬盘容量在500G左右;据统计,2011年全球数据总量已达到1.8 ZB(相当于18亿个1 TB移动硬盘的存储量),这个数值还在以每两年翻一番的速度增长,预计到2020年,全球将总共拥有35 ZB的数据量。 掀开大数据营销的红盖头大数据在多个行业和领域中有着广泛的运用,比如通过对每条道路上拥堵信