智能数据:如何挖掘高价值数据图书
人气:11

智能数据:如何挖掘高价值数据

从大数据到智能数据,突破价值瓶颈——不加一分人财力,助你高效利用客户信息!
  • 所属分类:图书 >经济>中国经济>中国经济概况  
  • 作者:[德][比约恩·布劳卿] [德][拉斯·拉克] [德][托马斯·拉姆什] 著;[王盛男] 译
  • 产品参数:
  • 丛书名:--
  • 国际刊号:9787508678184
  • 出版社:中信出版社
  • 出版时间:2017-08
  • 印刷时间:2017-08-20
  • 版次:1
  • 开本:32开
  • 页数:--
  • 纸张:轻型纸
  • 包装:精装
  • 套装:

内容简介

如今,很多企业被淹没在数据洪流之中,数据并没有给它们带来太多好处。企业数字化竞争力的提升也并没有像在公司战略会议上渲染“大数据”这一概念时所描述的那样快。其实,在大多数应用领域,数据量的多寡并不是衡量数据价值创造力的决定性标准。本书描绘了一条走出“大数据带来的失望”的更智慧的路线,适用于那些已经意识到“起决定作用的不是数据量,而是正确地整合数据,物尽其用”的企业。这一路线被称为“智能数据”。

智能数据的出发点是:“在不增加技术、人员和资金投入的情况下,我们如何高效地利用客户数据信息?”其本身就是一种切实可行的方法论。从这个方法论出发,我们可以得出一套不断迭代更新的、在逐步摸索中的、基于假设的行为方式。智能数据的理念是,在你所在的行业内成为数字智能化非常高的企业,在面对直接的数字化竞争时,借助数据分析,能够一步步地打造自身的竞争优势。

一般来说,导致数字变革宣告破产的,并非是技术力量的匮乏,而是源于企业内部的对抗、过于刻板的组织构架和失误的变革期管理。本书介绍了企业如何通过改革自身的管理、企业文化以及组织构架以成为智能数据时代的佼佼者。在大数据时代,少即是多——只要是对的,那么更少的数据将更有成效。今天的企业需要提高“数字素养”。 如今,很多企业被淹没在数据洪流之中,数据并没有给它们带来太多好处。企业数字化竞争力的提升也并没有像在公司战略会议上渲染“大数据”这一概念时所描述的那样快。其实,在大多数应用领域,数据量的多寡并不是衡量数据价值创造力的决定性标准。本书描绘了一条走出“大数据带来的失望”的更智慧的路线,适用于那些已经意识到“起决定作用的不是数据量,而是正确地整合数据,物尽其用”的企业。这一路线被称为“智能数据”。

智能数据的出发点是:“在不增加技术、人员和资金投入的情况下,我们如何高效地利用客户数据信息?”其本身就是一种切实可行的方法论。从这个方法论出发,我们可以得出一套不断迭代更新的、在逐步摸索中的、基于假设的行为方式。智能数据的理念是,在你所在的行业内成为数字智能化非常高的企业,在面对直接的数字化竞争时,借助数据分析,能够一步步地打造自身的竞争优势。

一般来说,导致数字变革宣告破产的,并非是技术力量的匮乏,而是源于企业内部的对抗、过于刻板的组织构架和失误的变革期管理。本书介绍了企业如何通过改革自身的管理、企业文化以及组织构架以成为智能数据时代的佼佼者。在大数据时代,少即是多——只要是对的,那么更少的数据将更有成效。今天的企业需要提高“数字素养”。

编辑推荐

面对巨量数据,还能找到宝石和金子吗?

如果谷歌即将踏足你的市场,该怎么办?

成本高昂的IT工具真的能够解决问题吗?

罗兰贝格专家带你突破大数据的价值瓶颈!

作者简介

比约恩 布劳卿(Björn Bloching),罗兰贝格管理咨询公司的高级合伙人、数字化部门全球主管,罗兰贝格数字中枢创建者,经验丰富的营销专家,领导着该咨询公司的国际市场与销售技术中心。 拉斯 拉克(Lars Luck),麦德龙集团首席组合战略专家,此前曾任罗兰贝格管理咨询公司合伙人,领导“销售和有针对性营销”实践小组。 托马斯 拉姆什(Thomas Ramge),德国著名财经杂志《brand eins》记者,报道领域涵盖技术、IT及营销领域。《经济学人》特约编辑。著作颇丰,曾获得德国《金融时报》颁发的卓著商业图书奖。

目录

引言 以少博多的智能数据使用者

规模并不重要 // 001

成为行业“智者” // 004

智能数据理念梗概 // 005

新“数据合同” // 007

及时部分从大数据向智能数据转变

第1 章深陷数据过载的愁云惨雾

流感预测器也闹“流感” // 013

技术成熟度曲线(Hype-Cycling) // 019

没有“大爆炸”的大数据 // 022

以守为攻战术 // 027

第2 章数字化海啸—不关注数据也行不通

沿价值链产生分化 // 033

机智,联合,进攻 // 036 引 言 以少博多的智能数据使用者

规模并不重要 // 001

成为行业“智者” // 004

智能数据理念梗概 // 005

新“数据合同” // 007

及时部分 从大数据向智能数据转变

第1 章 深陷数据过载的愁云惨雾

流感预测器也闹“流感” // 013

技术成熟度曲线(Hype-Cycling) // 019

没有“大爆炸”的大数据 // 022

以守为攻战术 // 027

第2 章 数字化海啸—不关注数据也行不通

沿价值链产生分化 // 033

机智,联合,进攻 // 036

到处都土崩瓦解! // 041

投资者眼光 // 057

第3 章 智能数据冠军—选择正确的数据是成功的基础

聪明的数据使用者 // 063

找对数据比拥有超多数据更有用 // 066

“3W”:为什么?如何做?做什么? // 069

概率击败偶然 // 075

第二部分 智能数据的循环

第4 章 五步流程实现增值

提出正确的问题 // 081

使用正确的数据 // 090

客户需求理解 // 095

提出自己独特的销售主张 // 111

正确地吸引客户 // 114

结论:实现增值 // 122

第三部分 冠军企业的智能数据应用领域

第5 章 更加智慧地接近客户—在合适的时间、

以合理的价格、提供所需的产品

时尚策划 // 127

策划式配件 // 129

哈,这个卖家是真正了解我的! // 133

贸易方面的分析小知识 // 137

在价格发现过程中,好货也得便宜 // 140

物理网点销售打败网络化销售 // 142

第6 章 从贸易伙伴转变为数据伙伴—通过中介共同提高

客户潜力

一切对抗一切? // 147

协同型客户关系管理 // 150

瑞士法典 // 156

假名的力量 // 158

双重选择性加入?是的! // 163

第7 章 智能优化选址、产品线和产品

“错误的旗杆” // 167

在正确的地点采用正确的销售模式 // 171

实时优化产品线 // 176

第8 章 多渠道到底是什么意思—为客户和企业提供好

的“客户旅程”

多渠道发展—内外有别 // 187

弹球机而不是保龄球 // 190

每人一个苹果账户! // 193

客户旅程中的渠道断点 // 198

在线产品展示厅 // 202

第四部分 企业的智能化之路

第9 章 能够接受错误才是正确的经营态度

弹道式思维 // 211

用不断尝试打败加农炮理论 // 215

无计划时代的企业管理 // 217

孔子说…… // 224

数据大狂欢 // 227

第10 章 使组织更加灵活—选择正确的组织构架、流程

和技术

可以自由选择工作岗位吗? // 229

智能数据的折中路线 // 232

数字化变革中的“四步走” // 233

迭代增量,小步快跑! // 243

第11 章 智能化地引进人才和开展培训—正确选择员工

战略规划官 // 246

数据科学家 // 247

项目经理 // 251

变革管理经理 // 252

第五部分 赢得数据

第12 章 选择客户真正需要的数字化战略

公众众口铄金 // 257

隐私精神分裂症 // 259

透明的“数据章鱼”? // 262

赢得数据 // 265

后NSA时代的人 // 271

全新模式 // 273

在线预览

客户细分黑盒子

客户细分的目的是,基于现有数据的特征,将客户识别为尽可能同质的,或是尽可能彼此异质的群组(簇)。在将相似的要素进行分组或在发现数据中潜藏的模式方面,存在着不同的操作方法,这些方法源自机器学习领域“无监督学习”范畴。最重要的几个分类操作方法如下:

1. 分层聚类分析

这种操作方法是基于前期已经识别出来的数据特征(例如通过识别市场上同质化群组的社会人口统计学特征、使用行为和观念)测算出被观察者(个人或公司)之间的差异,并据此建立矩阵。这个矩阵也分为许多行,同数据库中被观察者的分类占比保持一致。被观察者之间的差异涵盖了所有已识别的数据特征,并且可以通过不同的方法计算出来。在分层聚合的过程中,一对儿被观察者在一个循环流程中被反复概括比对,就连最小的差异也会被发现。这个流程会一直不停地循环重复,直到所有的被观察者都被纳入某一个簇中。这个积聚的过程可以通过多种不同的算法实现。比较常见的算法包括单联聚类法(即SL聚类,又称邻近算法)和凝聚层次聚类(沃德法)。根据算法之间不同的聚合逻辑,会产生不同的聚合结果。采用单联聚类法可以识别出一些较小的边缘群体,若采用凝聚层次聚类法,那么簇的规模一般会比较均衡。

分层分析方法的优点是,不需要事先就知道簇数,而是借助于统计学参数预估出理想的簇数,从统计学的角度出发,理想簇数的确定需要考虑到组内同质和组间异质之间的平衡问题。分层分析方法的缺点是,计算量非常大,且只适用于小规模的数据量。很多时候,分层分析方法被用于分析通过社会调查形式获得的数据。分层分析流程也适用于从大数据中进行随机抽样,目的是获得稳定的分类并且确定簇的数量。后续,数据科学家会采取分区操作,将聚合结果扩展到整个数据库。

2. 划分聚类分析

在分层聚类分析过程中,不需要事先就确定簇的数量,这对模式探索型的聚合分析流程来说是一大优点。然而,在划分聚类分析中,必须要预先就确定好簇的数量。总体来看,划分聚类分析的各种方法间存在共性,都是根据预先确定好的簇的数量选择出相应数量的对象,将每个对象的初始值作为单一簇的平均值或者中心点,然后反复调整聚类划分,直到误差函数最小化为止。其中,最著名且应用最广泛的误差函数是K均值(K-Means)算法:先根据既定的簇数随机选择出相应数量的对象,将这些对象的初始值作为每个簇的平均值,对剩余的每个对象,根据其与初始均值之间的差异程度,将其归入相应的簇。然后再重新计算每个簇的误差函数平均值。这个过程不断重复,直到每个簇中各对象的差异不显著(或者说误差最小化)。划分聚类分析中还有一种算法是K中位数(K-Medians)或者模糊C均值(Fuzzy C-Means)。K均值的较大好处是,它尤其适合大规模的数据分析,因为它在算法方面不像分层聚类分析那么复杂。但是K均值算法的问题在于对异常值的敏感度过大,偶尔会导致十分小的聚类被划分出来。 客户细分黑盒子

客户细分的目的是,基于现有数据的特征,将客户识别为尽可能同质的,或是尽可能彼此异质的群组(簇)。在将相似的要素进行分组或在发现数据中潜藏的模式方面,存在着不同的操作方法,这些方法源自机器学习领域“无监督学习”范畴。最重要的几个分类操作方法如下:

1. 分层聚类分析

这种操作方法是基于前期已经识别出来的数据特征(例如通过识别市场上同质化群组的社会人口统计学特征、使用行为和观念)测算出被观察者(个人或公司)之间的差异,并据此建立矩阵。这个矩阵也分为许多行,同数据库中被观察者的分类占比保持一致。被观察者之间的差异涵盖了所有已识别的数据特征,并且可以通过不同的方法计算出来。在分层聚合的过程中,一对儿被观察者在一个循环流程中被反复概括比对,就连最小的差异也会被发现。这个流程会一直不停地循环重复,直到所有的被观察者都被纳入某一个簇中。这个积聚的过程可以通过多种不同的算法实现。比较常见的算法包括单联聚类法(即SL聚类,又称邻近算法)和凝聚层次聚类(沃德法)。根据算法之间不同的聚合逻辑,会产生不同的聚合结果。采用单联聚类法可以识别出一些较小的边缘群体,若采用凝聚层次聚类法,那么簇的规模一般会比较均衡。

分层分析方法的优点是,不需要事先就知道簇数,而是借助于统计学参数预估出理想的簇数,从统计学的角度出发,理想簇数的确定需要考虑到组内同质和组间异质之间的平衡问题。分层分析方法的缺点是,计算量非常大,且只适用于小规模的数据量。很多时候,分层分析方法被用于分析通过社会调查形式获得的数据。分层分析流程也适用于从大数据中进行随机抽样,目的是获得稳定的分类并且确定簇的数量。后续,数据科学家会采取分区操作,将聚合结果扩展到整个数据库。

2. 划分聚类分析

在分层聚类分析过程中,不需要事先就确定簇的数量,这对模式探索型的聚合分析流程来说是一大优点。然而,在划分聚类分析中,必须要预先就确定好簇的数量。总体来看,划分聚类分析的各种方法间存在共性,都是根据预先确定好的簇的数量选择出相应数量的对象,将每个对象的初始值作为单一簇的平均值或者中心点,然后反复调整聚类划分,直到误差函数最小化为止。其中,最著名且应用最广泛的误差函数是K均值(K-Means)算法:先根据既定的簇数随机选择出相应数量的对象,将这些对象的初始值作为每个簇的平均值,对剩余的每个对象,根据其与初始均值之间的差异程度,将其归入相应的簇。然后再重新计算每个簇的误差函数平均值。这个过程不断重复,直到每个簇中各对象的差异不显著(或者说误差最小化)。划分聚类分析中还有一种算法是K中位数(K-Medians)或者模糊C均值(Fuzzy C-Means)。K均值的较大好处是,它尤其适合大规模的数据分析,因为它在算法方面不像分层聚类分析那么复杂。但是K均值算法的问题在于对异常值的敏感度过大,偶尔会导致十分小的聚类被划分出来。

另外,该算法是基于随机选取的初始值,因此在反复调整过程中,划分结果不是很稳定。此外,结果缺乏可再现性也是缺点之一。分层聚类分析可以补偿划分聚类分析的缺陷,因此可以将分层聚类分析中产生出的聚合分类结果作为K均值分析方法的簇数起点值。

3. 密度聚类分析

密度聚类分析背后的逻辑是,将被观察者视为一个空间内的点,尽管这些观察者之间存在很多差异化特征。首先我们要识别出这个空间内的高密度区和低密度区,并以此为基础建立起簇。这种分析方法的核心流程就是所谓的“具有噪声的基于密度的聚类方法”(Density-Based Spatial Clustering of Applications with Noise,简称DBSCAN)。根据这个空间内点之间的距离,我们会识别出密度较高的区域,并将这个高密区内的点作为核心点。还有一些点处于中等密度区域,我们将这些点称为边界点,被归至周边的簇。还有一些点,分布非常稀疏,我们将这些点称为噪声点。DBSCAN分析方法的优点之一,是不需要提前就确定簇的数量,这与分层聚类分析法有异曲同工之妙。与K均值分析法相比,DBSCAN方法具有一个关键优势,即可以识别非线性聚类,并可以有效对抗异常值。但是当空间簇的密度不均匀、间距差相差很大时,DBSCAN聚类质量较差。DBSCAN是相对比较新的聚类分析方法(1996 年才被提出),目前已经发展成为机器学习领域最重要的算法之一。

4. 模糊聚类分析

目前既存的系统化聚类分析流程都是将一个因素明确地归入某一个簇中,这是所谓的“硬流程”。模糊聚类分析属于“软流程”,即某一个因素可以被归入一个以上的簇,换句话说,就是在识别聚类从属性的不同等级。模糊聚类分析中最有名的算法是模糊C均值(FCM)。首先假定每一个被观察对象都能够或者倾向于被归入一个簇,那么处于簇中心位置的被观察者归入这个簇的可能性高一些,处于簇边缘的被观察者纳入这个簇的可能性相对低一些,或者说簇边缘的被观察者也有可能被纳入其他簇。

从技术层面上看,模糊聚类分析的逻辑与K均值算法类似。模糊聚类分析这一设想的目的是,实现一个被观察对象被归入不止一个簇中,这在某些特定的应用案例中更具现实价值。如果市场和客户细分部门希望获得明确的聚类结果(例如要去评估某一聚类集合的市场潜力),在对客户针对不同商品种类的消费行为和购买决策进行统计分析时,多维的聚类可能更有意义。例如,为了精准定位并营销旅行社潜在客户,我们可以利用模糊聚类分析方法,通过分析交易数据信息,从而去识别客户的旅行类型。此时,有些客户或被归入多个特征组,例如海滩度假组、城市游组等,这可以帮助我们为客户提供多样化的选择。

网友评论(不代表本站观点)

来自无昵称**的评论:

大数据实干家

2017-11-19 06:51:44
登录后即可发表评论

免责声明

更多相关图书
在线咨询