数据分析方向实用13篇

数据分析方向篇1

比如说，采野蘑菇/野山参这样的事情，野蘑菇和野山参的分布地点都是随机的，经验告诉我，它们会分布在哪片山林，但是我们不知道具体位置，得一个一个的找。大数据可以解决这个难题。

我们可以把山林用数据可视化表现出来，然后让采野蘑菇的人根据自己的实战经验标出蘑菇分布的地点，并且把这些地点数据常年积累起来。然后结合野蘑菇的习性，收集每片山林的降雨量、灌木丛分布数据、土壤数据、温度数据以及山林里采蘑菇的人流量数据等等，来准确的预测出野蘑菇的分布地点。

这就是大数据力量。

一言以蔽之，大数据最直接的意义就是让“随机性”的事情变得可提前预测，从而提高效率和行动价值。

同样的思路，森林防火防贼、环境保护、旅游景点客流预测等等，都可以引入大数据思维。大数据同时也可以为我们工作、学习和生活中一些重大决策作为依据。

今天主要说的是大数据领域的创业思考，大数据只有和生活、学习、工作以及商业等场景结合才能产生价值。推动技术发展的从来都不是技术本身，而是消费者(用户)的需求。用户不需要知道也没兴趣知道你处理大数据是用Hadoop还是Spark、原理是什么、架构是什么，用户最关心的是大数据到底怎么用，用了能为自己带来什么好处。

今天我们将从“外部大环境”、“行业内部环境”、“创业风险”和“大数据创业机会和方向"四个点来阐述主题，聪明的朋友也许已经知道了，我们的思路就是大数据领域创业的SWOT分析。

大数据市场现状(外部环境)

根据贵阳大数据交易所5月28日的《2015年中国大数据交易白皮书》显示：2014年中国大数据市场规模达到767亿元，同比增长27.83%。预计到2020年，中国大数据产业市场规模将达到8228.81亿元。

一、大数据市场规模巨大

首先，中国大数据市场环比增长率较大。根据易观智库7月30号的中国大数据应用行业的报告显示，2015-2018年中国大数据市场营销规模达到258.6亿人民币。环比增长率为37.2%。

其次，大数据在全球范围内的市场规模同样巨大，根据IDC最新研究结果，预测到2018年全球大数据技术和服务市场的2018年的复合年增长率将达到26.4%，规模达到415亿美元，是整个IT市场增幅的6倍。

无论是从国内还全球的市场规模和增长率来看，我们都可以得出这样一个结论，无论你是什么样的公司，或者说你未来创业要做什么样的服务，大数据都是兵家必争之地。大数据本身就是一种无形的资产，如果你的公司还没有部署大数据，那么在未来的市场上会失去核心竞争力。就好比你走在中关村创业大街上，你能收到的100份融资BP里，可能有99份都是APP和O2O项目，但99家里90%以上会重视大数据。

二、政策好，政府支持力度大

根据gov.cn9月6日消息，国务院公开《国务院关于印发促进大数据发展行动纲要的通知》，纲要里明确的说明，中国将在2018年会建成政府的大数据平台。相比之下，我们敬爱的习大大和李克强总理也经常为大数据站台，为中国的大数据发展点赞。看政府对大数据的重视，你抬头看看前两天的北京的蓝天，就会对政府有信心了。政府真正要干一件事，执行力大的超出你的预期。

据我们的观察，大数据领域的创业环境只会越来越好。目前，很多一线城市乃至二三线城市的科技园区，都出台了相关的扶持大数据产业的政策。如果你真的想在这个行业创业，可选择扶持力度大、人才较多的城市作为大本营，当然了，北京肯定是首选。

三、资本关注热

上图是我们(36大数据，编者注)对大数据垂直领域2015年资本投资事件的不完全统计。其实你仔细来看图会发现，大数据行业的资本关注热度是远远高于其他行业的。这个可以从投资金额可以看出来。今年上半年O2O项目非常热，也是投资重点关注的行业，但是投资的资本里，普遍都是人民币几百万和几千万这样的量级。而大数据行业的投资，更多的资本量级都是上亿的，而且资本多源于顶级投资机构。

大数据行业现状(内部环境)

“大数据就像十几岁少年眼中的性行为，每个人都在谈论它，但没人真正知道怎么做。每个人都以为除了自己之外的每个人都在使用它，所以每个人都装作自己很了解它。”

TED的创始人Dan Ariely是这样调侃大数据的。虽然是句玩笑话，但也确实说出了大数据的行业现状。

现状一、市场尚未饱和，竞争并不激烈

1、尚未出现垄断性行业巨头

前面我们分析了大数据整个大环境的状况，我们知道大数据行业市场潜力巨大，未来的增长率将达37%左右。但是在中国，目前尚未出现一家如Palantir、FICO这样的垄断性质的大数据企业。也许百分点和Talkingdata都在布局上市，但是距离挂牌还有一段时间和距离。新创的大数据企业中，还没有一家在美股、港股和深交所上市。

这是一个机会。创业你做电子商务也好，做游戏也好，都有好几家有钱有用户的巨头公司和你争抢市场份额，但是大数据行业不一样，大数据行业没有那么大的竞争压力，而且真正的战争尚未开始。

2、现有大数据企业扎推北京

根据数据堂统计的数据来看，新创的大数据企业中，57%的公司都在北京，上海占了15%的份额。大数据需要和实际的业务场景结合才能产生价值，工业、农业、制造、交通和能源等传统行业仍然拥有巨大的潜力，北上广深和二三线城市的大数据力量还没有完全被挖掘出来，这同样也是一个优势。

3、大数据在生活、商业渗透性较弱

笔者做大数据两年了，天天都听到或看到大数据的各种消息，但是生活并没有因为大数据的到来变得更智能一些。它没有让大龄光棍女青年更快更精准的找到结婚对象，也没用让隔壁老王炒股赚到更多的钱，更没有让北京的交通不再拥堵……大数据有用是不假，但是和生活场景结合得还是较弱。并没有看到可以称之为“变革”的现象。

4、没有直接的变现模式

互联网上最赚钱的两大行业分别是电子商务和网络游戏，这两个行业的变现模式都是非常清晰和直接的，但是大数据的变现模式需要绕一个弯子，需要和实际业务场景结合起来才能产生价值，不直接的路定然不好走。

有人曾经把大数据比作石油，可是，目前的情况看来，大数据行业还需要像发动机一样可以将数据转化成动力的载体。一如2010年以前一样，大家都知道手机游戏是未来的一个趋势，可是没有iPhone等智能移动设备的出现，手机游戏的市场份额就非常小，用户体量也很有限。

现状二、大数据行业人才紧缺

根据中国商业联合会数据分析专业委员会统计，未来中国基础性数据分析人才缺口将达到1400万，而在BAT企业招聘的职位里，60%以上都在招大数据人才。2015年-2016年是大数据人才最为匮乏的两年，因为已开了大数据专业的高等院校，第一批大数据人才还为毕业；已有的人才里，复合型的人才较少，都是术有专攻。

全球的大数据人才情况也不容乐观，据Gartner预测，到2016年，25%的全球大型企业将部署大数据分析系统；到2015年，圈球大数据人才需求将达到440万人；调查结果表明，全球64%的企业已经开始向大数据项目注资，或者打算在2015年6月之前将计划付诸实践。

大数据创业，人才就是核心，所有的公司都在抢大数据人才，创业公司想要招到相应的大数据人才非常困难。

现状三、数据量增长超快

这里和大家分享三个数字。49亿、250亿和39ZB。

49亿物联网设备：咨询公司Gartner预测今明两年互联物品的涨幅将达30%。分析师在指出，截止到2015年，全球物联网设备数量将从38亿飙升至49亿。

250亿智能装置传感器：分析师预测，传感器的普及将大大加速智能设备的开发、生产进度。到2020年，将会有大约250亿部智能装置出现在全球市场。

39ZB数据存储量：在2014年年底，国内网络上集中存储的数据已经达到1ZB，到2020年时，当年的新增数据量将会达到15.45ZB，整体的网络上数据存储量将会达到39ZB，未来6年的年复合增长率达到了84%。

预测到2020年，平均每个中国人每年产生的数据约为4.1GB。

现状四：行业目前存在问题

1、炒作过剩，实际落地产品较少；很多产品都是打擦边球；把大数据玩坏了。现在你和大家说大数据，很多人都认为你在骗人。行业想要持续稳定的发展，企业必须有自律。

2、群众基础差，关注的人群多为三高人才，高学历高收入和高技术。从百度指数可以看出，关注大数据的人群中，53%比例的人群年龄分布为30-39岁，而20-29岁人群占的比例为28%；另外，关注大数据的男女比例里，男性占到了80%以上。这样的数字直接告诉我们的问题就是，“大数据”的话题传播性其实并不好。预计超过90%的大众用户不知道大数据是个什么东西。

3、大数据只解决了部分2B的问题，2C产品较少。现在大家都觉得大数据的方向就是2B，我们不这么认为。打个比方说，你做2B的产品，每家企业平均给你200万，新创大数据企业你撑死了一年做上20家企业，那么营收预计在4000万左右。但是如果你做2C的大数据产品，一个用户给你200块，当你做到20万付费用户的时候，你的营收就会超过4000万。为什么呢，因为用户的数据本身就是钱。从深远的角度来说，未来的创业，你必须学会讨好大众，服务好90后，这才是种子用户。

4、懂技术的人不懂业务，懂业务的人不懂商业。这一点不想做详细的说明，打击面太广了。笔者参加了众多大数据行业内的峰会大会小会，人人都在说大数据，可是问到你的业务如何赚钱的时候，很多人都是三缄其口。纯技术是无法赚钱的，必须和实际的业务结合起来产生商业价值，才能获益。

5、市面上存在的大数据工具上手门槛较高。又一个槽点出来了。前面也说了，任何的新技术，都是需求推动其发展。需求来自用户。任何的新技术，只有拥抱大众用户才能得到更好的发展，接地气非常重要。现有的大数据处理工具非常复杂，需要你懂这个那个会这个那个才能使用，大众根本接触不到。现有的大数据工具也不够亲民，无论是2B也好，2C也好，你需要给别人的是一个简单动动手就能用的工具，里面有功能按钮，而不是一堆代码，最起码应该满足目前Office工作人员使用。上手门槛较高意味着很大一部分用户被你挡在了门外。将大数据处理工具产品化势在必行。

大数据行业创业的风险预警

一、大数据的创业门槛

1、人才成本较高；在美国，在R、NoSQL和MapReduce方面需求的专业人才薪水达到了每年约11万5千美元，在中国，大数据人才一将难求，创业公司不容易招大数据技术人才，即使招到，人才方面支出也较高。包括高薪、期权和股票等等；

2、存储硬件成本高；考虑到数据归属和安全性。大数据公司一般不会数据存在云上。自建机房比云存储成本高很多倍。

3、项目启动资金高；不是30-50十万就可以玩起来的，比移动互联网APP创业项目启动资金要求高。

4、用户少、获取成本高。这一点的门槛主要是群众基础差带来的。

没有明确的商业变现模式，这是目前大数据创业的最大门槛。拼数据，你拼不过阿里百度腾讯，拼钱，还是算了……

二、数据安全问题

据Verizon的《2015年数据泄露调查报告》显示，79790个安全事件中已有2122个确认的数据泄露。值得关注的是在2015年的报告中新增了一个统计模型，用以帮助企业评估到底每笔数据泄露，要损失多少钱。如果泄露1000条记录时，有95%的可能会损失5.2万-8.7万。泄露1千万数据记录的花费介于210万到520万之间，但最多可能到7390万。

让我们来回顾一下近年来数据泄漏的事件：2014年5月，800万小米用户数据或被泄露；2014年12月，12306大量用户信息遭泄露；2015年4月，超30省市曝管理漏洞数千万社保用户信息或泄露；2015年5月，携程网全面瘫痪疑似数据库物理删除；2015年6月，美国人事管理局(OPM)被指出大量工作人员信息泄露；2015年8月，婚外情网站Ashley Madison数据遭泄露……

对于大数据新创企业来说，数据的安全性就是“命”，如何保命事关生存。大数据的安全性，是部署大数据架构和大数据创业最大的挑战之一！

三、大数据隐私

关于大数据隐私，在美国有隐私法案，而且美国与欧盟之间还签署了安全港、隐私声明等等。而在中国，目前的立法是非常模糊的，属于灰色地带。手机号码被恶意第三方收集了，然后给用户发了很多垃圾短信，或者我的姓名，我的电话，我的邮箱，他们收集我的信息是不是合法的，目前这一点在在立法上都不清晰。不知道未来国家会不会出台相关的法律法规来规范这个领域？大数据隐私目前具有不确定因素，也是创业存在的风险之一。

说完了风险，下面我们可以来说说大数据行业的创业方向和机会。

大数据行业创业机会与方向

一、资本层面关注点

对于大数据项目，投资人到底看什么？在写这篇文章之前，我们与多家投行的投资人曾经做过访谈，下面是我们根据访谈内容整理出来的内容。

大数据没有直截了当的变现模式，那么一个新创大数据企业想要获得成功，拿什么去拼？当然是人才。这也是投资人最关注的东西。

投资人告诉笔者，对于一个大数据项目，他们最看重的是团队。那怎么看团队呢？一般从团队技术能力、背景、过往项目经验和创始人四个方面来看。大数据对技术的要求非常高，投资人看项目的时候，首先看的就是创始人的技术能力。一般情况下，投资者会更加青睐拥有技术背景的创始人和他的项目。

还有就是看项目的商业模式和变现能力。看项目方面，投资人会去看你的项目对应的国外成熟企业，或者说你的项目对应的竞争者是谁。由竞争者经营的情况来预估你在其领域的市场份额和变现能力。商业模式方面，投资者会看你的客户(用户)体量和数据源。你的客户群体有多大？你手里有哪些具体业务上的数据？这些数据如何产生价值，应用到你的客户身上？解决好这3个问题就成功了一半。

大数据项目变现方向，投资人关注的是你的项目是否能够快速直接的产生价值，而且有持续的创收能力。

解决好以上几个问题，新创大数据公司想要拿到融资就非常容易了。

二、大数据垂直领域热门的投资方向

第一个是Hadoop商业化，简单来说就是做Hadoop的收费版本。Hadoop本来是开源的，但是在具体业务场景中，还缺乏很多功能，那么Hadoop商业化就是去完善这些功能，使其更好的应用于企业的业务场景。Hadoop商业化最典型的公司就是Hadoop的三驾马车，Hortonworks，Cloudera和MapR，Hortonworks目前已经在纳斯达克上市。中国相应的做Hadoop商业化的公司是星环科技。

第二个是SQL on Hadoop，用大白话来说就是基于应用场景下的数据框架。比如说大数据架构里的查询引擎、存储引擎、计算模型等等，这个主要是基于大数据技术方向的，比如说WibiData，它提供了对Hadoop的封装，连接前端应用到Hadoop基础设施。

第三个是NoSQL数据库，非关系型数据库和云数据库服务。典型的国外企业有MongoDB和Datastax。目前，创业公司MongoDB的估值已超过16亿美元，而在中国，基础云服务商青云QingCloud已经推出了基于MongoDB的集群服务，名字叫做青云QingCloud MongoDB。

第四个是分析和可视化。对应的国外企业有Tableau、Datameer。国内新创的大数据企业中，也有很多大数据企业在做可视化服务，比如说国云数据的大数据魔镜。

第五个是行业大数据应用。为社交媒体、广告公司、企业客户、电子商务等行业客户提供数据分析，帮助这些行业提升数据分析的水平，如DataSift、RelateIQ、RocketFuel等创业公司。

三、大数据行业现有的商业模式

谈到商业模式，肯定就要说到2B还2C的问题。

2B是目前大数据行业主要的商业模式，将大数据变为一种服务，服务的对象是企业或机构。比如现有的大数据企业里，星图数据，Hortonworks，Cloudera，星环科技、Talkingdata都是2B的商业模式。从他们的运营状况，不难看出，2B的商业模式，要么是做解决方案(类似外包)，要么就是做工具。

预计未来所有的互联网企业也好，传统企业也好，都会在企业内部成立大数据部门，那么到那个时候，解决方案的市场份额还会多么？不肯到也不否定。对于一家企业来说，大数据就是自己的资产，相信企业更倾向于自己管理自己的内部资产。所以我们大胆的预测，解决方案只是目前大数据行业的权宜之计，未来企业会用自己的人才管理自己的大数据，用自己的人才使用自己的大数据。做工具是目前较为主流的模式。Palantir其实也是做工具。

2C方面，在整理这份内容的时候，我们发现2C的产品非常少。女性经期助手、百度指数这样勉强算是2C的大数据产品。而大数据2C方面的产品，更多的是倾向于应用。可穿戴设备其实也算是大数据应用产品之一。

说了这么多，你肯定会问我了，那么腾讯、百度和阿里巴巴这样的企业，他们的大数据又是什么样的模式呢？在笔者看来，BAT企业的大数据商业模式都是2C+2B的模式，我们可以简称为复合型的商业模式，因为他们服务的用户有企业用户也有个人用户。

总结一下，现有的商业模式里，哪个最好？笔者个人认为是2B+2C模式。这样的模式是最健康的模式，形成了一个商业闭环。

用一句话来说就是：你收集用户的数据，分析出报告，然后给到的对应的企业，对应的企业根据数据反馈，从而开发或制造出更好的产品，让用户享受更智能更美好的生活。这整个过程中，大数据是贯穿始终的。

那么，现有的大数据公司，都是如何赚钱的呢？

1、广告、营销。这一类主要集中在第三方大数据营销公司里。典型的企业包括缔元信、时趣这样的公司。他们主要的业务就是帮助大数据分析能力较弱的公司来做大数据分析，优化广告和营销的路径，使市场投入的非常产生更大的价值。

2、直接卖数据的公司。典型的企业有数据堂。

3、做工具或者服务。目前的移动统计工具就是这一类，还有做Hadoop套件的也是这一类公司。

4、卖报告或解决方案的。做大数据解决方案的公司就太多太多了，典型的公司为IBM。

5、跨界和融合。

Talkingdata联合创始人蒋奇先生告诉我们，Talkingdata后台有移动互联网各个热门手机游戏的数据，包括用户的设备数据、行为数据、日常数据和游戏里的消费数据等等。根据这些数据，可以对这些游戏用户进行用户画像。

以招行信用卡推广为例，Talkingdata通过大数据分析发现，《刀塔传奇》以及《我叫MT》这两款游戏的用户属性和招商银行信用卡中心需要的用户属性很契合，于是促成了招商银行和的合作，还支持了后续的信用卡积分的礼包和活动等。

这次合作为招行信用卡带来了5万个绑定用户。一般情况下，银行类的应用要实现转化的平均成本在两百到三百块钱之间，而这样的跨界合作，招商银行基本上没花一分钱，就达到了5万转化率，理论上省掉了上千万的费用。这就是跨界和融合。

跨界和融合，其实也是大数据思维里最重要的一环。大数据就像是钱一样，你得让它流动起来才能产生价值。

四、大数据行业的创业方向和机会

先说2B方向。

大数据创业的2B方向，更多的是做工具和服务，如数据可视化、商务智能、CRM等。

现有的大数据工具有着技术门槛高、上手成本高、和实际业务结合较差以及部署成本高，小公司用不起等特点。那么新创企业就可以根据以往这些产品的缺陷，来做更适合市场和客户的大数据分析工具和服务。另外，将大数据工具完整化和产品化也是一个方向。新一代的大数据处理工具应该是有着漂亮UI，功能按键和数据可视化等模块的完整产品，而不是一堆代码。

再说2C方向。

大数据一个很大的作用就是为决策做依据，以前做决定是“拍脑袋”决定，现在，做决定是根据数据结果。在我们的生活中，需要做决策的时候太多太多，尤其是像笔者这样选择性困难的天秤座，非常需要大数据来辅助决策。个人理财(我的钱花哪去了，哪些可以省下来)、家庭决策(孩子报考哪所大学)、职业发展/自我量化(该不该跳槽，现在薪水到底合适不合适)以及个人健康都可以用到大数据。

【图：大数据应用的现状和机会】

五、我们的创业建议

1、想清楚谁为你买单(找用户)；

2、痛点是什么(找需求)；

3、稳定/独特的数据源(找数据)；

4、靠谱的人做靠谱的事(找人才)；

5、考虑2C的产品方向；

6、忘记科技行业过往经验；

7、将大数据产品化(小而美)；

数据分析方向篇2

0 引言

工业设计是以创新为核心内容，其涵盖范围包括技术、科学、和艺术等多种知识为一体的交叉类学科。其设计的过程是将创造性思维运用于工业设计过程当中，创造性思维不仅决定设计的创意，还进一步影响着设计过程和结果，因此在大数据时代的背景下，创造性思维对于工业设计的过程十分重要。近年来，许多企业为追求效益忽视创造性思维在工业设计过程的影响，只重视生产加工技术，而对国外优秀设计进行“抄袭”，这已经成为国内设计圈公知的弊病。

1 大数据时代对工业设计思维的要求

1.1 创造性思维工业设计的内涵与思维方式

（1）创造性思维工业设计的内涵：工业设计的产品是现代工业化条件下批量生产的产品，因为产品具备相应的使用功能，让人用起来产生舒适感，使消费者接受它们。但产品并不是冰冷的机器，它们是为人服务的，做出来的产品应具备欣赏价值和其他种种要求，特别是大数据时代背景下，为响应社会需求的提升，这就需要多种学科知识的协同。很多人都会将工业设计只是做为单纯的造型活动，如此简单的理解却并不全面，外观造型设计是设计师通过运用多方面的知识来赋予产品的一种外在表现形式，但其设计内涵却远不止这些，内涵包含在设计当中的文化价值观念、人机关系理解、市场需求和技术知识等。

设计如今已经远远的超出了工业生产活动的范畴，它更是一种态度和观点，小到一些具体的物件如冰箱、汽车、化妆品，大到跨国企业、国家方案的制定，它影响着人类生活的方方面面，为人类健康的生存方式创造了有利的条件。

（2）工业设计的包阔范围很广，思维方式也不能仅针对其中的某一个方面，而是要跳出旧的牢笼，突破现有的设计模式，这就要从一种综合的理解出发，设计出拥有全新内容的产品或服务，所以，创造性的思维方式才是工业设计的核心。

工业设计的创造性思维简洁地来说，我们可以将它看成是思维发散和收敛互相交替并且互相扶持的过程。例如说，桌子的设计，你如果只去想：桌子，桌子……，头脑只是被“桌子”二字占据的话，工业设计作品的成果是不会好的，因为只针对一种具体事物来进行设计的话，只会被这件物体的概念将创造力束缚住，思想如果只是停留在如何设计出好看的桌子，创新性设计也只会停留不前，最多也就是把桌子的尺寸、材质和形状上进行改变，但是如果我们从实用性和材质上来考虑，思路就会瞬间开阔了，我们可以根据不同顾客的喜爱，从材质上来选择适合的，还能根据不同人的身高来制定桌子的高度，这就打破了一种思维定势，社会的现状、价值观差异和文化差异等这些因素都纳入到了具体的工业设计活动当中，而不是非常简单地“就事论事”这样的狭窄思维方式。

1.2 大数据时代背景下，创造性思维体现在工业设计过程中的作用

（1）概念设计效率和解决问题的能力都可以通过创造性思维来提高：工业设计过程是发现问题-分析问题-解决问题，而创造性思维能够有效的提高这一过程。例如日本获得G-MARK大奖的汤匙设计，日本在儿童用的汤匙中加了一个弯曲结构来解决儿童在用汤匙过程中掉落的问题。

（2）团队设计的最大效率可以通过创造性思维发挥：团队协作提倡创造性思维能够在很大程度上提高F队效率。对于一个设计团队来讲，设计过程要遵循“全面兼顾大局，长短互补”的原则，对于逻辑思维较强，而形像思维较弱的设计师，可以从产品可行之处和实用之处来多做考虑，相反，对于一些逻辑思维较弱，而形像思维较强的设计师来说，就可以大胆的考虑从不同的造型、颜色、材质等多种特性入手。由这些设计师组成的设计团队，效率将发挥到最大。

（3）创造性思维工业设计的设计风格，具备鲜明的中国特色，本土设计的国际竞争力也会得以显著增强：在如此激烈的国际竞争中，一个国家的工业设计要想生存发展，设计风格就必须要有民族特色，例如德国的奔驰轿车由于其设计思维严谨，卓越的产品品质使得其长期在汽车行业当中立于不败之地。我国的工业设计如果想要生存发展，工业设计水平就要必须提升，产品的竞争力必须增强。综上所述，在工业设计过程中，创造性思维发挥着十分重要的作用。

2 大数据时代工业设计的思维发展方向

大数据时代工业设计思维的设计核心不仅指的是人的个体，还包含全人类社会，因此，利用创造性思维演化出的社会化设计更关注人类的整体利益。它是以社会化思维中“以人为本”的设计理念中延伸发展出来的，包含环境保护、资源节约、使用可再生材料、优化资源配置等方面，与“绿色设计”、“生态设计”一脉相承，这些恰恰都符合中国古代的“天人合一”的价值观。

3 结语

本文对工业设计的内涵和思维方式进行了一些剖析论证，两者的共同点都是不要“就事论事”，从事物的外侧去开阔思路，讨论大数据时代创造性思维的具体作用，进而延展出大数据时代工业设计思维的几大未来发展方向。

参考文献：

[1]王明昊，赵鹏飞.浅析大数据视角下的工业设计及其应用价值[J].商场现代化，2015（22）：20-22.

数据分析方向篇3

2. 网站访问时段

从上图观察发现，我们可以分析出用户在上午9点-11点，下午14点-17点，这两个时段较为活跃，那么便可根据此进行推广，因为访客越是活跃，进行推广便更呕效果。同样的，在做竞价推广时，也可以此作为参考。

3. 搜索引擎分析

有统计数据可以发现，各个搜索引擎过来的流量有多少，而从该网站数据上看，该网站的主要访客来源于百度，竟然如此，该站就更加需要加强百度优化，更多的去迎合百度。

4.搜索词

通过对搜索词的查看，我们可以查看用户主要通过哪些词来到该网站，从而可根据此来对长尾关键词进行挖掘。同时我们可以发现用户是通过一些我们根本想不到的词来访问网站，通过这些词我也可作为研究用户搜索习惯的重要参考因素。

5.访问时长及跳出率

通过对访客的页面停留时间长短及跳出率，我们可以分析出用户的需求点，从而分析出哪些最终页，哪些是过度页。如此此我们就可以根据此来对页面进行优化，以及分析哪些栏目更应放在首页等。

6.浏览器访问比例

数据分析方向篇4

大数据审计是对各类电子数据、账套、文件进行审计，是计算机审计的延伸和发展，是对多行业、多领域、多种形式海量数据的电子审计方式。大数据审计既要处理结构化数据，又要处理大量的非结构化数据，对审计目标、审计内容、分析技术和审计思维模式都提出了新的、更高的要求。

1.审计目标的转变

在信息化发展初期，计算机审计能够通过对数据的观察和分析发现疑点，为审计提供线索。随着大数据时代的到来，审计目标逐步转向发现线索、评估风险、关注效益等方面，审计不仅要发现违法违规问题，更多的是要揭示制度方面存在的问题，评估内控风险，通过对经济社会相关大数据的获取和分析，洞察行业整体走向，探索发展规律，对国家、行业、部门的制度出台与发展策略做出前瞻性的思考和战略性的分析。

2.审计内容的转变

传统意义上的“数据”大多是指数字，如主营业务收入金额、营业费用等，由简单数字或用数字编码的简单文本组成，传统的数据分析工具基本上能够满足其需要。而大数据不再单纯指数字，其涵盖的内容更加宽泛；传统意义上的 “数据”是关系型的、结构化的二维表数据，而大数据则是指在不同时间生成的复杂、异构、多样化的数据，包括xml、html、文本、音频、视频和“影子数据”（如访问日志和web搜索历史记录）等。

3.分析技术的转变

顾名思义，大数据分析就是指对规模巨大的数据进行分析。大数据分析包括5个基本方面：一是可视化分析，利用图表完整展示数据分析的过程和数据链走向；二是数据挖掘算法，从海量的、随机的、不相关的数据中构建数据挖掘模型，提取有价值的、隐含在数据内部的信息；三是预测性分析能力，根据可视化分析和数据挖掘的结果，做出预测性的判断；四是语义引擎，借助一系列的工具去提取、解析和分析数据，从“文档”数据中自动提取信息；五是数据质量和数据管理，通过标准化的流程和工具对数据进行处理，保证数据分析结果的质量。

4.审计思维模式的转变

大数据时代带来审计思维模式三大转变：一是实现审计全覆盖而非抽样审计，对公共资金、国有资产、国有资源和领导干部履行经济责任情况实行审计全覆盖[2]。二是审计数据的混杂性而非精准性。传统审计以财务数据为审计重点，其核心是结构化的报表和凭证信息，而大数据具有高度的数据混杂性，数据类型涵盖了结构化、非结构化和半结构化的数据，保留了最宝贵、最有价值的信息，其内涵具备更深、更广的洞察力。三是大数据主要反映事物的相关关系而非因果关系。大数据没有改变审计事务间的因果关系，而是注重对相关关系的开发和利用，使得数据分析对因果逻辑关系的依赖性降低了，甚至更多地倾向于基于相关关系的数据分析。

二、大数据审计的方式和途径

面对大数据时代对审计工作带来的挑战，审计方式和途径将实现以下4个方面的转变。

1.应用大数据分析技术，实现审计方法从数据验证性分析向数据挖掘性分析转变

传统的计算机审计，是通过电子数据采集转换对数据进行验证，通过构建查询分析、多维分析等方法模型进行数据分析，而应用大数据分析技术，则能够使审计数据分析逐步由传统的验证性分析向挖掘性分析转变。挖掘性分析是指采用大数据处理技术，利用数据仓库、数据挖掘和模型预测工具进行审计分析[3]，从大量数据中发现蕴涵的数据模式和规律，包括分类分析、聚类分析、关联分析和序列分析等。其中，分类分析按照数据属性，将数据分派到不同的组中；聚类分析根据数据的相似性原则，将数据划分为若干类别，使同类数据差别极小，不同类别数据差异尽可能大；关联分析可发现隐藏在数据间的相互关系，通过挖掘发现不同数据间的密切度或关系；序列分析可发现数据出现时间、出现序列的规律，分析数据间的关联性。

例如，在金融审计中，运用数据挖掘中决策树的关联规则和挖掘方法，可对不良贷款与正常贷款之间相互错分的规律进行研究，创建对不良贷款和正常贷款具有较强分类能力的条件属性指标，从而增加分类预测模型的可理解性，并在一定程度上揭示商业银行信贷资产风险等级分类的相关规律[4]；在税收征管审计中，利用聚类方法，根据聚簇规则，可将纳税户进行分组，使组内纳税户具有最大的相似性，组间纳税户具有尽可能大的相异性，从而产生聚类标准，并按照标准对纳税户进行分行业、分税种聚类分析，确定纳税群体的总体情况和特征，为审计目标和审计重点的建立提供依据。

2.应用大数据分析模式，实现审计方式从发现问题向风险预警转变

传统审计工作以发现问题为主，对经济形势进行预测分析，因而须等到相关事件发生并且形成一定规模后，再根据搜集到的足够数据进行分析研究，具有滞后性[7]。而大数据技术可通过对跨领域的大规模经济、社会行为数据进行分析，对经济社会相关异常动态实现早期关注，利用其对异常数据的敏感性实现早期预警。当前，审计可以运用大数据相关技术，对宏观经济社会风险问题展开初步分析。例如，可以综合利用政府债务审计数据、社保审计数据、宏观经济运行数据、金融市场数据等多种数据库构建大数据集合，运用数据挖掘等数据分析工具，结合多个数据库信息交叉分析与宏观经济社会运行相关的事件，通过基于个别领域、结构化的数据分析，不断将半结构化、非结构化的跨领域数据加入分析框架中，逐步提高大数据审计的分析能力。

3.应用大数据审计作业平台，实现单机审计向云审计转变

以审计大数据为中心建设“云审计”平台，实现远程存储和移动计算，使审计机关能够通过网络接入“云”实施审计，利用大数据分析、人工智能等信息技术，解决数据采集分析和管理中存在的问题，实现审计成果共享。其次，应完善联网审计系统，逐步建立预算、执行、财政、地税、社会保障、医疗机构、公积金等重要行业和部门的审计实时监督系统。再次，应建设审计数据综合分析平台，运用大数据技术，加大业务数据与财务数据、单位数据与行业数据，以及跨行业、跨领域数据的综合比对和关联分析，提高运用信息化技术查核问题、评价判断、宏观分析的能力。最后，应推广“总体分析、发现疑点、分散核实、系统研究”的审计模式。

4.构建专业的审计分析队伍，实现传统纸质账本审计向大数据审计转变

审计工作应实现“六大转变”，即由单点离散审计向多点联动审计转变、由局部审计向全覆盖审计转变、由静态审计向静态与动态审计相结合转变、由事后审计向事后与事中审计相结合转变、由现场审计向现场审计与非现场审计相结合转变、由微观审计向微观与宏观审计相结合转变。为此，需要在组织方式、人员结构、思维方式等方面与之相适应。在组织方式上，应尝试开展无项目审计，依托审计数据中心积累的数据资源，横向关联比对分析，纵向深入挖掘分析，从数据中发现审计疑点和线索。在人员结构上，应不断提升“四种能力”，即大数据分析能力、综合研究能力、创新能力和跨领域知识运用能力，不断加强对大数据先进理念和前沿技术的学习，掌握大数据分析方法，提升审计人员综合素质。在思维方式上，应培养“数据先行”意识，以数据为核心，使数据分析在审计工作开展前先行实施，根据数据分析结果，有重点、有步骤、有深度地在审计实施过程中进行核查验证、追踪线索、发现问题，全面深化大数据技术在审计工作中的应用。

三、大数据技术在审计中的应用

大数据技术在审计中的应用广泛，具体说来，主要表现在以下4个方面。

1.创新大数据工作模式，探索部门预算执行审计全覆盖

传统的以处（科）室为单位的孤立审计，已不适应大数据审计的要求，需要打破部门界限，以审计项目为管理主线成立大审计组，进行扁平化管理。大审计组分领导小组、数据分析组和问题核查组三个层面：领导小组负责审计方案的制定、领导决策等，由牵头机构组建；数据分析组由审计能手和计算机操作骨干组成，具体负责审计实施，筛查审计疑点和线索；问题核查组由审计一线人员组成，进行实地延伸核查。例如，在“同级审”项目中，采集各部门预算执行审计数据，通过对数据进行集中分析，发现是否存在部分预算项目缺乏科学论证、影响预算执行的问题；结合各预算部门的财务数据，发现是否存在预算项目因连年结转的情况下仍然安排新增预算、造成资金闲置的问题；通过对数据进行宏观整体分析，发现是否存在预算执行效率不高、分配下达预算不及时、拨付转移支付资金超期等情况。

2.应用数据分析作业平台，开展跟踪审计

通过建设审计数据综合分析平台，搭建关系国计民生的重点行业联网审计系统，用Hadoop等专业工具处理半结构化、非结构化数据，规范高效地汇集和处理大规模数据信息。例如，在地税审计中，可利用地税联网审计系统，集中进行全省地税数据整理分析，探索“数据集中采集、集中统一分析、疑点分布落实、资源充分共享”的大数据审计模式，实现全省联动审计；通过构建查询分析模型、多维分析模型，固化审计思路，对地税数据进行全面分析，重点选择税款征收、税款缴纳和税款管理等信息，在财政审计中，运用部门预算执行分析平台，将独立运行、分散存储的各部门预算编制、预算指标、部门决算、部门财务核算等业务数据，进行标准化清洗和整理，同时与组织预算执行数据进行整合，实现各类资金的横向关联，对资金分配结构、资金使用流向、资金管理情况进行总体分析，全面反映预算执行整体情况，实现对预算单位的审计监督全覆盖。

3.多领域数据融合，开展经济责任审计

运用关联分析，找出数据间的相互联系，分析关联规则，发现异常联系和异常数据，寻找审计疑点。在经济责任审计中，可利用财政、税务、社保、公安、工商、养老、房管、教育、培训等数据，进行纵向比对、横向关联分析。例如，可将城镇居民医保、城镇职工医保、新农合等信息进行综合分析，检查是否存在同时参保、重复报销、虚假报销、套取资金等情况；将小额担保贷款与人社部门行政事业单位人员信息进行关联分析，检查是否存在违规向行政事业单位人员发放担保贷款和进行财政贴息的问题；将职业技能培训补贴、创业培训补贴与企业法人和行政事业单位人员进行关联分析，检查是否存在向不符合条件人员发放就业补贴的问题；将人社、农业、扶贫、教育、民政管理的各项培训资金进行关联分析，检查是否存在虚报冒领财政资金的问题；将义务教育、中职中专、中学学籍数据与中职助学金发放、免学费补贴等信息进行关联分析，检查是否存在虚报冒领或者套取中职助学金、免学费补贴等专项资金的问题。

4.深入挖掘数据，开展宏观经济形势预测

利用数据仓库、数据挖掘和模型预测工具进行审计分析，运用回归分析等统计方法，分析趋势变动或数据关系，发现总体情况和规律，进而揭示体制机制性问题。例如，在“三公经费”专项审计中，可通过各预算单位财务核算数据提取“三公经费”预算编制和实际支出情况，结合单位人员花名册，构建统计分析模型，进行结构分析和时间序列分析，横向比对所有预算单位“三公经费”的支出规模、各项支出占比、人均支出金额与年度支出趋势等，分析其压缩控制比例是否符合要求，各项支出比例和人均支出金额是否存在异常和明显偏离，进而挖掘行业性、趋势性问题，并对离群点进行延伸，发现违规违纪问题线索等。再如，利用城镇或农村居民家庭人均收入指数和各地制定的最低收入保障标准进行分析，查找人均收入指数与最低收入标准间的差异，分析各地低收入标准制定是否科学，为政府制定宏观经济政策提供参考。

综上所述，大数据技术的发展对审计工作提出了新的、更高的要求，也为审计提供了新的工具。大数据审计应从数据、人才和技术等方面逐步积累基础资源，创新工作思路，研究技术方法，培养高素质人才，不断提升大数据技术在审计中的有效运用。

参考文献：

[1]

怀进鹏.大数据是国家战略资源[J].中国经济和信息化，2013（8）：49.

[2]秦荣生.《关于完善审计制度若干重大问题的框架意见》学习笔谈摘要[J].审计研究，2016（1）：3.

数据分析方向篇5

随着网络技术的高速发展，网络自媒体的数量庞大，网民人数的不断增多，互联网资源数量呈现指数型的增长，网络已经成为民众获取信息的最主要渠道。网络在传达社情民意方面的优势也逐步显现出来，成为反应社会舆情的主要载体之一，在表达民众心声、反映社会舆论方面发挥极其重要的作用。

在海量数据中，通过探测并发现网络舆情中的热点话题，有助于梳理舆情监控的思路，抓住纷繁的监控工作中的重点，从海量的互联网信息中找到目标信息，将有限的人力物力用到关键的地方，提高工作的针对性和有效性，更好地应对网络舆情。

而如何对网络舆情加以有效的监督和引导，积极化解网络舆论危机，使和谐的互联网环境为维护社会稳定、促进国家发展、构建社会主义和谐社会发挥重要作用，不仅具有重要的现实意义，也已经成为网络舆情工作面临的一个重要课题。基于上述分析，我们认为网络舆情数据越来越呈现出大数据特征。

1 问题与挑战

大数据环境下的网络舆情分析和挖掘方法具有如下挑战：

1.1 为了得到更准确的舆情信息，所需要的数据量大幅膨胀。随着数据生成的自动化以及数据生成速度的加快，自媒体时代的到来，为了获得准确的网络舆情信息需要处理的数据量急剧膨胀。一种处理大数据的方法是使用采样技术，通过采样，把数据规模变小，以便利用现有的技术进行数据管理和分析。

1.2 数据深度分析需求的增长。为了从数据中得到准确的舆情信息进而指导人们的决策，必须对大数据进行深入的分析，这些复杂的分析必须依赖于复杂的分析模型。所以对网络舆情信息的分析还需要路径分析、时间序列分析、图分析、What-if分析等。

1.3 自动化和可视化分析需求的出现。在TB级的复杂舆情信息环境下，网络舆情系统应该能根据网站的内容自动构造查询，自动提供热点推荐，自动分析数据的价值并决定是否需要保存。

2 大数据技术的主要进展

针对传统分析技术的局限性，研究者提出了一些试验性的解决方法和途径。R是开源的统计分析软件，IBM公司研究人员致力于对R和Hadoop进行深度集成，把计算推向数据并且并行处理，使Hadoop获得强大的深度分析能力，为应用开发者提供了丰富的数据分析功能。

针对频繁模式挖掘、分类和聚类等传统的舆情分析方法，研究人员也提出了相应的大数据解决方案。如，Iris Miliaraki等人提出了一种可扩展的在MapReduce框架下进行频繁序列模式挖据的算法[1]，Alina Ene等人用MapReduce 实现了大规模数据下的K-center 和 k-median聚类方法[2]，Kai-wei chang 等人提出了针对线性分类模型的大数据分类方法[3]。U kang等人使用“BP算法”处理大规模图数据发掘异常模式。Jayanta Mondal等人[4]提出了一个基于内存的分布式数据管理系统来管理大规模动态变化的图以支持低延迟的查询处理方法。Shengqi Yang等人[5]对基于集群上的大规模图数据管理和局部图的访问特征进行研究，为了在图查询处理中减少机器间通讯，提出来分布式图数据环境。Jiewen Huang等人提出了一个多节点的可扩展RDF数据管理系统，比目前系统的效率高出3个数量级。

3 网络舆情分析发展方向

3.1 实现更加复杂和更大规模的分析和挖掘是网络舆情分析未来发展的必然趋势。在大数据新型计算模式上实现更加复杂和更大规模的分析和挖掘是网络舆情分析未来发展的必然趋势，需要进行更细粒度的仿真、时间序列分析、大规模图分析和大规模社会计算等。

这些舆情主体间频繁联系、相互影响，在这个过程中涌现出一些大V，他们左右着其他主体的舆论方向，最终影响整个舆论场。同时，关注点相似的舆情主体间也自觉或不自觉地形成了一些联系相对紧密的子群体，在子群体中信息传播速度更快。要管理和引导网络舆情，就必须对网络舆情主体和舆论子群体进行研究，而社会网络分析方法就是有效的手段。

3.2 网络舆情信息的实时分析和挖掘。面对海量数据，分析和挖掘的效率成为网络舆情分析领域的巨大挑战。尽管可以利用大规模集群并行计算，但在数10TB以上的数据规模上，分析和发掘的实时性受到了严峻的挑战，而查询和分析的实时处理能力，对于舆情运用个体来说及时获得决策信息，做出有效应对是非常关键的前提。

3.3 关联不同领域数据进行舆情分析，非结构化大数据处理分析成为难点和重点。网络上的信息是千千万万的人随机产生的，从事网络舆情研究要从这些看似杂乱无章的数据中寻找有价值的信息。网络大数据有许多不同于自然科学数据的特点，包括多源异构、交互性、失效性、社会性、突发性和高噪音等，不但非结构化数据多，而且数据的实时性强，大量数据都是随机动态产生。网络数据的采集相对科学数据的采集成本较低，网上许多数据是重复的或者没有价值的，价值密度低。一般来说，网络舆情的数据分析及预测，比科学实验的数据分析更困难。所以我们不要一味的追求获取越来越多的数据，而是数据的去冗分类，去粗取精，从数据中挖掘有用信息，减少不必要的数据采集。

3.4 词汇理解的复杂性研究。既考虑词汇的情感倾向性，又权衡语义模式对评论的情感倾向值的影响，能比较全面地分析突发事件网络舆情的态势。但是词典的构建与语义模式的建设需要人工参与，个人的主观性影响比较大，机器学习的能力不强，准确度不高。另外，由于网络语言表达的灵活性，技术的发展速度跟不上社会话语变迁的复杂性。在国内的网络语境中，谐音、暗语是常用的表现手法，借古讽今、借外讽内是常用的叙事手段，隐喻、借代是常见的修辞。现有技术还不能完全准确地判定句子的情感倾向性，机器对词汇的理解能力需要进一步研究。

4 结束语

随着大数据时代的到来，我们要不断改进舆情的分析方法，将大数据思维及方法运用到网络舆情分析中去。首先要开始关注大数据分析，其次不再仅仅依靠语义分析，而是求诸于自动化的数据分析，再次要关联不同领域数据进行舆情分析，等等。总之，我们要突破传统，将舆情分析向大数据分析的方向创新。

参考文献：

[1]Miliaraki I，Berberich k，Gemulla R.Mind the gap：large-scale frequent sequence mining.SIGMOD’13，2013：797-808.

[2]Ene A，Im S，Moseley B.Fast clustering using MapReduce. KDD’11，2011：681-689.

[3]Chang K，Roth D.Selective block minimization for faster convergence of limited memory large-scale linear models.KDD’11，2011：699-707.

[4]Mondal J，Deshpande A.Managing large dnamic graphs efficiently.SIGMOD’12，2012：145-156.

数据分析方向篇6

Excel是微软公司办公软件Office的重要组成部分，具有功能强大的数据处理和绘图分析功能，能提供丰富的函数。数据透视表是Excel用于进行快速汇总大量数据的交互式表格，数据透视图是一种交互式的图表，它以类似数据透视表的方式通过图形化的方法来查看和重排数据。数据透视表和透视图集中展现了Excel强大的数据统计分析处理能力，灵活快捷地对数据库表从多个维度（字段）进行统计和分析，是数据透视表和透视图最大的特点。借助数据透视图可以解决如何在一张表或图中，对财务比率进行横向比较分析和纵向比较分析的问题。本文借助Excel数据透视图的强大功能，建立一个有效的比率分析数据透视模型，从而实现财务比率多维透视分析。

一、建立财务比率分析模型

财务比率分析始于企业财务比率的计算。目前的财务比率分析主要有盈利能力分析、短期偿债能力分析、长期偿债能力分析、资产管理能力分析、现金流量分析和市场比率分析等。在财务比率分析模型建设中，首先需要借助Excel建立单个企业的比率分析表。

（一）建立单个企业的比率分析表

在建立单个企业的比率分析表时，首先需要建立基础数据表（资产负债表、利润表、现金流量表、股票价格表等）。

在基础数据表的基础上，借助Excel计算公式定义的功能，可以建立财务比率分析表，如表1所示。在该表中，定义各个财务比率的公式，如每股收益=净利润/股本总额，在本例中，转换为Excel公式即为：D5=利润表！E35/资产负债表！E80。类似地可以定义全部的财务比率计算公式。

在建立单个企业的基础数据表和财务比率分析表后，将各个企业的基础财务数据输入或导入到基础数据表模板，就可以生成各个企业的财务比率分析表。

（二）建立行业比率分析表

数据透视表和图是对数据表的数据字段进行汇总分析，数据字段是数据表中的列名（数据表中的每一列同质数据作为一个字段）。要建立财务分析多维透视表和图，首先需要建立一个汇集行业各企业财务比率的Excel文件，将用于实现横向对比分析的同行业多家企业比率数据经过格式调整，放在同一张数据表中。该过程首先需要确定数据表的字段，以便于用来多维透视分析。在笔者建立的多行业比率分析表中，设定了5个数据字段：指标名称、指标类别、股票名称（公司名称）、时间、指标值，从而建立了如表2所示的行业比率分析表。

表2“行业比率分析表”与表1“单个企业财务比率分析表”在表格显示形式上最大的区别在于表2本质是一张二维表（由行和列构成的二维表，每行表示一个独立的数据项），而表1本质是一张三维表（由行字段——指标名称，列字段——指标时间和隐含的页字段——公司名称三维构成），每个指标值所占据的单元格都是由三维字段来约束的。三维的数据表无法在一张表上显示所有企业的指标数值，不便于进行数据透视和分析，所以必须先将单个企业三维模式的财务比率分析表转换为表2所示的二维模式下的财务比率分析表。然后再将各个企业二维模式下的财务比率分析表进行合并，从而完成表2“行业比率分析表”的建设工作，为财务分析多维透视表和图的建设提供数据来源。

在将单个企业三维模式的财务比率分析表（表1所示的格式）转换为二维模式的财务比率分析表（表2所示的格式）过程中，“指标名称”、“指标类别”、“股票名称”（或公司名称）、“时间”4个字段的数值的填充工作比较容易完成，最为繁琐的是“指标值”字段中数据的填充。每个公司的比率指标值数量为“指标名称数量”×“年份数”。如果每个指标值都通过人工来转换，工作量将是非常大的。解决这个问题可以借助Excel中的查找函数——Vlookup来实现。

在二维格式的“行业比率分析表”的基础上，就可以建立用来进行多维透视分析的源数据表。

二、运用透视图建立分析模型

（一）建立数据透视图模型

以“行业比率分析表”作为源数据表，通过借助Excel的“数据透视表和透视图”功能，就可以轻松建立一张数据透视图模型。利用“数据透视图向导”可以建立如图1所示的数据透视图模型。

在“数据透视图模型”中，首先有“数据透视表字段列表”，该列表是以源数据表的各列字段名（各列第一个单元格的值）生成的列表，选择任何字段都包含了要在数据透视图中进行分析的数据。可以将这些字段按照需要分别拖到“页字段”、“分类字段”、“系列字段”和“数据项”区域。页字段是用来筛选在数据区中要处理的源数据的。分类字段类似于图形的X轴，在Excel图表中是分类轴。系列字段类似于二维图形的Y轴，是用来建立数据系列的，在Excel图表中是值轴。

在行业比率分析多维透视模型中，需要从“数据透视表字段列表”中将“指标名称”字段拖动到页字段区域，以实现按指标进行数据筛选。将“时间”字段拖动到分类字段区域，以建立分类轴。将“股票名称”（或公司名称）字段拖动到系列字段区域，以建立数据系列。将“指标值”字段拖动到数据项区域，以告知Excel系统用来统计分析的数据项。同时需要借助Excel数据透视表工具栏的“字段设置”功能来设定“指标值”的汇总方式为“平均值”、“最大值”或“最小值”[实际上，在本文所建立的行业比率分析多维透视图中，由于任何一个数据项（某一时间某一公司某一指标的值）只有一个，所以无论是使用“平均值”还是使用“最大值”或“最小值”的数据汇总方式都是一样的统计结果，那就是显示指标值本身]，通过设定指标值的汇总方式可以展示指标数值本身。本文中，笔者采用了“平均值”作为数据项的汇总方式。

在设定完数据透视图的页字段、分类字段、系列字段和数据项字段及汇总方式后，“行业比率多维透视分析模型”就建立完成，可以通过Excel图表的一些格式设置来使得图表更为直观。建立完多维透视分析模型后，从页字段“指标名称”下拉框中选定任何一个指标，就可以得到如图2所示的单指标横向比较和纵向比较分析图。

（二）运用数据透视模型进行财务分析

本小节以多维数据透视分析模型为依据，对中医药行业上市公司（云南白药、同仁堂、康美药业、太极集团、紫鑫药业）的盈利能力财务比率之一——净资产收益率进行比较分析，说明多维数据透视模型在财务分析中的运用。

图2列示了近年来上述公司净资产收益率的变动趋势。以云南白药为例，2007—2009年净资产收益率呈下降的趋势，从2010年起净资产收益率开始反弹，并将增长趋势持续到2011年。再看太极集团，2007—2011年，该公司的净资产收益率持续徘徊在5%以下，2010年跌到了-9%的谷底，而在2011年又开始反弹。

图2还列示了竞争对手的净资产收益率，为进行竞争对手之间的财务比率比较分析提供了基本依据。从图2中可以看出，2007—2011年，云南白药的净资产收益率远高于其竞争对手。然而，太极集团的净资产收益率却远低于其竞争对手，并且差距逐渐拉大。是什么原因导致云南白药的净资产收益率一直处于最高水平？是什么原因导致太极集团的净资产收益率一直处于最低水平？要回答这一问题，我们可以从图3和图4得到答案。图3列示了影响云南白药净资产收益率的驱动因素，不难看出，云南白药持续较高的净资产收益率主要来自于其持续增长的销售净利率和较高的总资产周转率的影响。图4列示了影响太极集团净资产收益率的驱动因素。从图中数据，我们可以发现，太极集团持续较低的净资产收益率主要来自于其较低（甚至为负）的销售净利率和极高的权益乘数的影响。

三、结论

数据透视表和透视图的应用，展现了Excel强大的数据统计和分析处理能力。通过建立数据透视模型，灵活快捷地对数据图表从多个维度进行统计和分析，不仅打破了传统财务分析工具的局限性，同时也使财务分析变得更加立体化，从而实现了财务比率多维透视分析。

【参考文献】

数据分析方向篇7

目前发展大数据产业已经上升为国家战略，大数据的价值也得到了社会的广泛认可。众多研究[1-5]表明，大数据不仅为政府治理开辟了新思路，还是企业创新的重要源泉和高校科研的重要支撑。大数据交易平台是整个大数据产业的基础与核心，它使得数据资源可以在不同组织之间流动，从而让单个组织能够获得更多、更全面的数据。这样不仅提高了数据资源的利用效率，更重要的是，当一个组织拥有的数据资源不断丰富和立体化，有助于其通过数据分析发现更多的潜在规律，从而对内提高自身的效率，对外促进整个社会的不断进步。

在现有的大数据交易平台上，数据供应方和需求方各自供需信息，交易双方浏览这些信息，如果发现合适的交易对象，则进行大数据资源的买卖，交易平台只作为信息中介存在。这类大数据交易的本质，其实是单独的大数据资源交易，现有平台可以统称为第一代大数据交易平台。第一代大数据交易平台在供需平衡、数据定价和时效性三个方面都存在较大的不足。本文针对这些不足进行改进，设计了一种全新的第二代大数据交易平台，命名为：融合数据分析服务的大数据交易平台，该平台将数据资源交易与数据分析服务进行深度融合，实现了数据与服务的一体化交易。本研究不仅为当下正在建设的各类大数据交易平台提供有益的借鉴，也丰富了大数据交易的基础理论体系。

2.相关研究

目前大数据交易的相关研究中，比较有代表性的有：

（1）大数据的财产属性和所有权。王玉林等[6]对大数据的财产属性展开研究，认为大数据的法律属性会直接影响大数据产业的发展，而大数据交易实践本身就反映出大数据具有财产属性。但大数据与传统的财产权客体存在较大不同，它符合信息财产的特征，是信息财产权的客体，应受到相关法律的保护。齐爱民等[7]从宏观的角度分析了国家对于其主权范围内数据的所有权，剖析了个人拥有的数据权以及数据的财产权。

（2）大数据的定价问题。刘朝阳[8]对大数据的定价问题展开研究，首先分析了大数据的基本特征、价值特征等定价基础。接着讨论了效用价格论、成本价格论等定价模式。最后分析了大数据的定价策略，并对大数据定价的双向不确定问题进行了详细论述。刘洪玉等[9]认为在大数据交易过程中，由于缺乏足够的历史参考，其数据资源的交易价格很难确定，因此提出一种基于竞标机制的鲁宾斯坦模型，用于大数据交易双方进行讨价还价，以求达成一个交易的均衡价格。翟丽丽等[10]从资产的期权价值角度来评估大数据资源的价值，并指出数据在不断变化和更新，加上数据的非独占性等情况的出现，数据资产的价值可能会下降，最后综合这些因素构建了一个评估模型来计算数据资产的价值。

（3）大数据交易的安全与隐私保护。史宇航[11]认为非法的数据交易会对个人数据等高价值信息的安全造成影响，对非法数据交易的购买方和协助方都应进行处罚。提出应先明确数据的法律属性，再以数据交易所为平台进行交易，并对数据交易所的法律地位进行了分析。殷建立等[12]为应对大数据时代数据采集、交易等过程中的安全问题，综合考虑技术、政策和管理平台等方面的因素，构建了一种个人数据溯源管理体系，该体系可在数据应用时实现个人数据的追踪溯源，从而保护其个人隐私。王忠[13]认为大数据环境下强大的数据需求会导致个人数据的非法交易，为应对这种情况，应该建立个人数据交易许可机制，通过发放交易许可证、拍卖授予等措施实现隐私保护。

（4）大数据交易的发展现状与问题。杨琪等[14]认为我国的大数据交易还处于行业发展的早期，大量数据源未被激活，原因是大数据产业价值链的各个专业环节发展滞后，并且对数据交易中的安全问题和隐私泄露等有较大的担忧。应该对数据产品进行改造，使其更商品化，并且通过政府开放公共数据等措施逐渐消除数据流通中的安全顾虑。唐斯斯等[15]首先分析了我国大数据交易的发展特点、交易类型等现状，接着指出目前大数据交易存在法律法规相对滞后、行业标准不完善、交易平台定位不明确、数据质量不高等问题，最后提出应加快相关法律和标准建设，并推动数据开放，加强交易方式的创新。

除了上述四个主要研究方向以外，李国杰等[16]从理论的角度分析了大数据研究在行业应用和科学研究方面的重要作用，这从客观上反映了大数据流通的必要性。涂永前等[17]认为大数据时代企业管理和运用数据资源的相关成本会成为企业的主要交易成本，这会改变企业的组织结构，并导致企业边界的变化，企业会进行多方向的扩张，这为促进大数据产业发展的相关法律的制定提供了理论支持。总的来看，由于大数据交易本身属于较新的领域，因此相关研究总体上较少，已有研究也大多集中在上述几个研究方向上。实际上，大数据交易平台是实现大数据交易的重要载体，是大数据资源流通转换的主要节点，交易平台本身需要随着整个大数据产业的发展，不断的改进和升级，而现有研究中恰恰缺少对大数据交易平台本身进行创新的研究。由此，本文针对现有大数据交易平台的不足，结合实际设计了一种全新的融合数据分析服务的大数据交易平台，为实践和科研提供借鉴和参考。

3.现有大数据交易平台的不足

大数据本身作为一种新兴事物，当把它作为一种商品进行交易时，其交易平台的设计很自然会参照传统的商品交易模式，即：交易双方先供求信息，再经过讨价还价，达到一个均衡的价格则成交，卖方将大数据资源经过脱敏处理后，交付给买方。目前无论是政府主导的大数据交易所，还是企业或者高校创建的大数据交易平台，都是采用类似的交易模式，这也是第一代大数据交易平台的突出特点。实际上大数据与传统商品有很大的区别，照搬传统商品的交易模式会出现很多问题。本文将从供需平衡、数据定价和时效性三个方面分析现有大数据交易平台的不足。

3.1 数据供需的错配

现有大数据交易平台的第一点不足就是数据供需的错配，即：供应方提供的数据资源往往不是需求方所需要的，而需求方需要的数据在交易平台上找不到，即使有相近的数据资源，也存在很大的数据缺失或冗余，买回去也无法使用。对数据供应方来说，由于无法准确预知数据买方多样性的需求，它只能从自身角度出发，将可以公开的、并且自认为有价值的数据资源放到平台上待售。对需求各异的买方来说，供应方提供的标准数据很难与自己的应用方向精准匹配，这也是目前大数据交易还不够活跃的原因。当然，当供需双方建立初步联系以后，供应方甚至可以为需求方个性化定制大数据资源，但即使这样，供需错配的问题仍然无法解决，原因就在于单个的数据供应方无法提供多维的数据资源，只有多维的数据资源才具有较高的分析价值。

3.2 大数据资源定价困难

大数据资源定价困难是现有大数据交易平台的第二点不足。大数据资源和普通商品不同，普通商品可以直接消费或者作为再加工的原材料，其价值都可以通过最终的消费品价格得到体现。而大数据本身的价值无法直接衡量，需求方购买它的目的是作为数据分析的信息源，但是否能发现潜在的规律还未可知。因此无法在购买前，准确判断出待售数据资源的价值大小。此外，需求方在不确定某大数据资源是否能真正能给组织带来收益情况下，很难给出一个较高的价格，这在客观上会影响数据供应方的交易积极性，加大了供需双方达成交易的难度。

3.3 数据的时效性不强

现有大数据交易平台的第三点不足，就是数据资源的时效性不强。目前很多大数据交易平台上待售的数据资源都以历史数据为主，这是因为数据资源在交易前需要经历脱敏处理，将涉及政府信息安全、企业商业机密和个人隐私等敏感信息进行变换和替代。此外，供应方还需要对原始数据进行初步的清洗，整理成一定的数据格式集中存贮和交付，方便需求方进行数据分析。由于一般的数据供应方并不具备对大数据进行实时脱敏和清洗的能力，只能将采集到的数据资源，经过一段时间的离线处理后，再放到交易平台上，所以只能供应历史数据。随着社会节奏的不断加快，历史数据很可能并不能反映当下的真实情况，越来越多的数据分析都需要用到实时数据作为信息源，这是未来大数据交易必须克服的一个短板。

4.融合数据分析服务的大数据交易平台设计

本文提出将数据分析服务融合到目前的大数据交易中，以此来克服现有交易平台的不足，本节将首先对数据分析服务进行概念界定，再依次介绍平台设计的总体思路和核心模块的设计，具体如下。

4.1 数据分析服务的概念界定

数据分析是指运用各类数据处理模型和信息技术手段，对数据资源进行深度的挖掘，从而发现其中蕴含的规律，作为管理决策的依据。数据分析本身是一种能力，如果一个组织将其数据分析能力提供给其他组织或个人，并收取一定的费用，这就是数据分析服务。在大数据环境下，数据资源不仅体量巨大而且种类多，对数据分析能力的要求不断提高。在这种情况下，只有少数组织具备独立处理大数据的能力，其他的组织比如大量的中小企业，都需要从组织外部寻求专业的数据分析服务，来满足自身的需要。因此，数据分析服务和大数据资源一样存在巨大的市场需求。

4.2 平台设计的总体思路

本文将提出的融合数据分析服务的大数据交易平台，定位为第二代大数据交易平台，它将大数据资源交易与数据分析服务两者进行深度融合，在交易平台上实现数据与服务的一体化交易。大数据交易平台的角色也从原来的数据资源买卖的信息中介，转变为大数据综合服务商。在融合后的大数据交易平台上，数据需求方不再提交数据资源的需求信息，而是直接提出自己的应用方向和想要得到的结果，交易平台再根据需求方的应用方向，反向匹配数据资源和数据分析服务。这个匹配的过程不是单一的数据集或服务的查找，而是对全平台的数据资源进行有效整合，形成高价值的多维数据，再结合复合型的数据分析技术，得到最终的分析结果，最后将分析结果与基础数据一同交付给需求方。交付基础数据的目的，一是方便需求方进行分析结果的对照，为决策提供更精准的参考。二是需求方可以根据基础数据进行衍生挖掘，进一步提高数据的利用效率。平台设计的总体思路绘制成图1。

图1 平台设计的总体思路

4.3 核心模块的设计

融合数据分析服务的大数据交易平台共划分为四大模块，具体如图2所示。

图2 融合数据分析服务的大数据交易平台的主要模块

系统管理模块具体又分为用户管理、系统维护和安全管理。安全管理是系统管理模块的重点，主要包含三个方面的功能：第一，负责整个交易平台的系统安全，通过对交易平台进行实时监控，阻止外部的非法入侵行为，保障平台的正常运行。第二，对数据供应方提交的数据资源进行审核，如果发现是非法数据，则阻止其交易，并及时将有关情况反馈给相关的政府监管部门，由它们进行调查处理。第三，检查所有数据是否经过脱敏处理。如果发现部分数据存在未脱敏或者脱敏不合格的情况，交易平台将负责对该数据资源进行脱敏处理，从而保护数据中的隐私不被泄露。

大数据资源池模块、数据分析服务模块和协同模块是交易平台的三大核心模块，是数据与服务两者融合并实现一体化交易的关键，本文接下来将对这三个核心模块的功能进行详细设计。

4.3.1 大数据资源池模块

大数据资源池模块主要包含三个方面的功能：数据资源格式的整理、数据的多维度整合、大数据资源的云存贮。具体如下。

（1）数据资源格式的整理。由于大数据交易平台上的数据资源来自不同的数据供应方，因此其数据资源的格式会有较大的差异。如果不经过格式整理就直接进行数据分析，很可能会因部分数据无法准确读取，而影响数据处理的效率，严重者还会导致数据分析中断。数据资源格式整理的主要任务是将同一类型数据的格式进行统一，对部分缺失的数据属性进行补充，对错误的数据格式进行修正。

（2）数据的多维度整合。在上文3.1中提到供需错配的一个重要原因，就是单个数据供应方无法提供高价值的多维数据。所谓多维数据是包含用户或者行业多个背景和情境的大数据资源，这些多维数据使用户或行业多个侧面的信息产生了关联，有利于发现深层次的潜在规律。融合数据分析服务的大数据交易平台应该作为数据整合的主体，将单个数据供应方提供的零散的数据资源，进行多维度的整合，当缺少某一个维度的数据时，再向相应的数据供应方进行定向的采集，最后得到相对完整的多维数据，具有很高的分析价值。

（3）大数据资源的云存贮。大数据资源经过格式整理和多维度整合以后，已经可以作为数据分析服务的信息源。下一步就是将这些数据资源进行统一的云存贮，以便数据分析服务调用。以往部分大数据资源由于体量巨大或实时更新的需要，无法上传到交易平台上，或者只提供部分调用接口。融合数据分析服务的大数据交易平台通过建立云存贮中心，将整合后的多维数据进行统一存放和调用，有助于提高数据资源的存取效率。

4.3.2 数据分析服务模块

数据分析服务模块首先根据数据需求方的应用方向，匹配出合适的多维数据资源，再选择相应的数据分析模型分配所需的计算能力，最后将得到的分析结果反馈给需求方。本文将数据分析服务划分为三个大类：基础性分析服务、高级分析服务、深度定制的分析服务。具体如下。

（1）基础性分析服务。基础性分析服务是指那些常规的数据统计，比如：总体中不同对象的占比分析，基于不同属性的关联分析或相关性分析等。这些分析服务耗时较短，分析技术较为简单，只要数据资源本身完备，就可以迅速得到结果。基础性分析服务由大数据交易平台本身来提供，可以面对不同的需求方，实现快速交付。

（2）高级分析服务。高级分析服务是指那些较为复杂的数据分析服务，比如：精准的趋势预测、全面的用户兴趣画像、非结构化的信息挖掘等。这些分析服务需要大量专业的数据处理技术，比如：兴趣建模、视频分析，音频分析、深度语义分析等，必须由大数据交易平台对接第三方的数据分析服务商，由它们来提供高级分析服务。大数据交易平台在同一数据分析领域，应引入多家数据分析服务商，通过动态的竞争，来保证服务的质量。

（3）深度定制的分析服务。大数据分析目前还处在快速发展阶段，很多前瞻性的技术还在试验当中，应该说数据分析技术的发展相对于旺盛的现实需求来说是滞后的。当需要用的某一数据分析技术，在目前的市场上还找不到现成的提供方时，就需要大数据交易平台为其进行深度的定制，交易平台通过多方位的研发能力评估，寻找合适的技术主体来进行专门的技术攻关。

4.3.3 协同模块

协同模块主要包含两个方面的功能：数据分析服务之间的技术协同、交易各方的管理协同。具体如下。

（1）数据分析服务之间的技术协同。在面临较为复杂的数据分析任务时，可能需要用到多个领域的数据分析技术，这时单个的数据分析服务商可能无法独立完成。因为不同的行业领域，都有其行业技术的独特性，需要长时间的专业积累。在这种情况下，就需要多个数据分析服务商相互合作才能完成。数据分析服务之间的技术协同，就是通过一定的技术标准和操作规范，让多个数据分析技术提供方，能够在完成同一任务时，在技术上不冲突，能够相互并行的完成对数据资源的处理，按时按质的交付最终的分析结果。

（2）交易各方的管理协同。在融合数据分析服务的大数据交易平台上，交易的参与者一共有四类，分别是数据资源的供应方、数据分析服务商、需求方和交易平台自身。数据需求方在提交自己的应用方向和预期结果的同时，提交自己的交易预算。交易平台根据需求方提交的应用方向和预期结果，对数据资源和数据分析服务进行反向的选择。如果数据分析任务中只用到了基础性分析服务，则整个交易为平台方、需求方、数据资源供应方的三方交易。如果某数据分析任务，平台自身无法完成，需要用到第三方的数据分析服务商，则整个交易包含了全部四类参与者，是一个四方交易。交易的基本原则是实现参与各方的利益共享。交易各方的具体利益分配如图3所示。

图3 交易各方的利益分配

需求方希望在获得预期结果的同时，其支付的成本在可接受的范围内。交易平台在对数据和服务进行反向匹配后，会出现两种不同的情况：第一种情况是在原交易预算下，可以达到需求方预期的结果，则可成交。第二种情况是，原交易预算较低，在该预算下无法达到需求方要求的结果，这时交易平台会和需求方沟通，提出新的报价，需求方经过考虑后，与平台进行讨价还价，它们在价格上达成一致时才能完成交易。由于交易数据是整合后的多维数据，因此原始数据资源供应方的收益，由平台从总交易价中支付，具体的支付方式可分为平台一次性买断或按次数支付。同一数据资源对于不同的需求者来说，其价值是不一样的，融合数据分析服务的大数据交易平台根据最终的一体化交易成交价，反向对数据资源进行定价，相对于现有的大数据交易平台来说，是一种进步。交易平台的深度参与，会使数据交易的频率加快，原始数据资源供应方会获得更多的收益。数据分析服务商根据具体的数据分析任务，直接参与由平台发起的竞价，达成交易后由平台支付。交易平台本身的收益则是需求方支付额减去其他各方收益的差价。

5.融合数据分析服务的大数据交易平台的优势

本文3.1到3.3中指出现有大数据交易平台存在数据供需错配、大数据资源定价困难、数据的时效性不强三大不足。融合数据分析服务的大数据交易平台作为改进后的第二代大数据交易平台，可以很好地克服上述三点不足。除了这三个方面的优势以外，由于融合后可实现数据与服务的一体化交易，这将扩大交易对象的覆盖范围，提升交易的活力，具体如下。

5.1 直接面向应用，从根本上避免了数据供需的错配

在融合数据分析服务的大数据交易平台上，需求方对交易平台直接提出应用方向和预期结果。交易平台对全平台的数据进行多维度整合，如果缺失某个维度的数据，可以进行定向的采集和补充，最后形成高价值的多维数据。这些多维数据才是真正具有分析价值的数据资源，这是单个数据供应方无法提供的。在得到多维数据后，结合平台自身和第三方数据服务商的分析能力，得到最终的分析结果。交易平台最后交付给需求方的是数据分析结果和基础数据，这种直接面向最终应用的大数据交易方式，从根本上避免了数据供需的错配。

5.2 融合后定价更有根据

在现有的大数据平台上，数据需求方是将数据资源买回去以后自己分析，而在购买数据资源之前，不能预知数据分析效果的好坏，因此无法进行有效的价值判断，这是定价困难的关键点。在融合数据分析服务的大数据交易平台上，需求方不再直接对数据资源付费，而是对最终的数据分析结果付费，并且数据分析结果是根据需求方的要求反向定制的，是符合需求方利益的。需求方可以通过评估预期结果对自身的重要性或收益的改进程度，给出适当的交易预算。交易平台以该预算为参照，对数据和服务进行选择，若出现原预算约束下无法实现预期结果的情况，交易平台再与需求方进行沟通，双方讨价还价后达成交易。这样相对于现有的大数据交易平台来说，融合后定价更有依据。

5.3 融合后可提供实时数据

在融合数据分析服务的大数据交易平台上，数据资源采用云存贮的模式，由平台进行统一管理，这提高了数据资源的安全性。在数据安全有保障的前提下，由交易平台出面和数据资源供应方进行实时数据的对接，将实时数据纳入大数据资源池中。对于单个的数据资源供应方来说，实时的数据脱敏难度太大。但大数据交易平台不一样，它可以利用规模优势，组建强大的计算能力，对大数据资源进行实时的脱敏和清洗，极大地提高了数据资源的时效性。

5.4 融合后将扩大交易对象的覆盖范围，提升交易的活力

融合后可实现数据和服务的一体化交易，让很多自身不具备数据分析能力的组织和个人，也能方便地利用大数据，特别是大量的中小企业，这将大大增加交易对象的覆盖范围。

交易对象的增多会促进交易频率的增长，从而为数据资源供应方带来更多的收益，这样会提升它们参与交易的积极性，鼓励它们供应更多的数据资源，从而提升交易的活力，整个大数据交易行业就形成了正向循环的良好发展态势。

6结语

本文对大数据交易平台本身进行了改进与创新，设计了一种全新的第二代大数据交易平台，即：融合数据分析服务的大数据交易平台。该交易平台可以直接面向需求方的应用方向，实现数据和服务的一体化交易，不仅从根本上避免了数据供需的错配，还使大数据交易的定价更有依据，平台的深度参也让提供实时数据成为可能，这些将从整体上提升大数据交易的效率。融合后数据和服务的一体化交易降低了大数据应用的技术门槛，鼓励更多组织和个人参与，增加了交易活力。未来笔者将继续关注大数据交易平台的创新研究，为实际应用和学术科研提供更多有益的参考。

参考文献

[1]赵强，单炜.大数据政府创新：基于数据流的公共价值创造[J].中国科技论坛，2014（12）：23-27.

[2]徐继华，冯启娜，陈贞汝.智慧政府：大数据治国时代的来临[M].北京：中信出版社，2014.

[3]李文莲，夏健明.基于“大数据”的商业模式创新[J].中国工业经济，2013（5）：83-95.

[4]侯锡林，李天柱，马佳，等.大数据环境下企业创新机会研究[J].科技进步与对策，2014，31（24）：82-86.

[5]张峰，张迪.论大数据时代科研方法新特征及其影响[J].科学学研究，2016，34（2）：166-170，202.

[6]王玉林，高富平.大数据的财产属性研究[J]。图书与情报，2016（1）：29-35，43.

[7]齐爱民，盘佳.数据权、数据主权的确立与大数据保护的基本原则[J].苏州大学学报：哲学社会科学版，2015（1）：64-70.

[8]刘朝阳.大数据定价问题分析[J].图书情报知识，2016（1）：57-64.

[9]刘洪玉，张晓玉，侯锡林.基于讨价还价博弈模型的大数据交易价格研究[J].中国冶金教育，2015（6）：86-91.

[10]翟丽丽，王佳妮，何晓燕.移动云计算联盟企业数据资产评估方法研究[J].价格理论与实践，2016（2）：153-156.

[11]史宇航.个人数据交易的法律规制[J].情报理论与实践，2016，39（5）：34-39.

[12]殷建立，王忠.大数据环境下个人数据溯源管理体系研究[J].情报科学，2016，34（2）：139-143.

[13]王忠.大数据时代个人数据交易许可机制研究[J].理论月刊，2015（6）：131-135.

数据分析方向篇8

0 引言

数据的自动采集和分析是电子和软件技术发展的一个重要成果，它有效地替代了人们枯燥而重复的劳动。由于电控罗经和平台罗经的调试时间较长，并且需要实时记录数据，致使调试工作效率低、维修人员工作强度大。

为此，本文设计并实现了罗经姿态角信号自动采集和分析，提高了罗经调试工作效率，减轻了维修人员工作强度，同时也增强了调试数据的可读性与可保存性。

1 总体设计方案

1.1 技术性能需求分析

根据罗经姿态角信号自动采集分析仪设计需求，对国产和引进的各型船用罗经进行了广泛深入的调研，提出该分析仪必须具备以下功能：能够采集频率为50Hz、400Hz、500Hz的罗经姿态角信号，实时绘制姿态角信号曲线，分析罗经周期，计算方位稳定点，方位漂移率以及稳定点起伏误差，数据保存对比及编辑打印。

1.2 组成结构

根据技术性能需求分析，设计分析仪硬件、软件组成结构如图1所示。

数据采集仪对姿态角信号进行AD采集，并将采集数据通过RS-232串口通信传输至上位机；上位机通过运行数据分析程序完成数据分析，并输出结果。

2 数据采集仪设计

针对姿态角信号采集需求，设计数据采集仪组成结构如图2所示。

数据采集仪采用智能化方式设计，有微处理器，通道选择电路，专用轴角转换模块，电路和电源组成。数据采集仪的功能实现模拟信号的数字化，角度解算、显示以及向上位机发送姿态角数据。

2.1 微处理器

微处理器采用MCS-51系列单片机，该单片机广泛地应用于军事和工业控制领域，具有环境适应能力强，连续工作时间长，可靠性高等优点。

在数据采集仪中，单片机通过并口扩展来控制多个采集模块，并在收到信号采集模块传来的信息后，完成航向的解算，然后通过串口通信电路向上位机发送数据。

2.2 通道选择电路

通道选择电路在微处理器的控制下，选择数据信号的流向，从而使采集模块正确完成采集并送入微处理器进行解算。

2.3 数据采集

数据采集模块采用中国船舶重工集团716研究所生产的XSZ系列超小型自整角机/旋转变压器-数字转换器，具有体积小，重量轻，可靠性高的优点。

该转换器将模拟信号转换为计算机可接收处理的数字信号，转换精度可达0.001度，满足姿态角信号采集的精度要求。

2.4 键盘和显示

键盘和显示的主要功能是通道选择控制，航向初值装订，姿态显示。共有4个键盘，分别为通道选择、装订移位、装订数值以及确认键。

2.5 数据发送

数据发送采用单片机自带的串口通信，并使用EIA RS-232C标准。在数据传输过程中采用了数据纠错技术，确保了数据传输的可靠性。

2.6 单片机程序

采用51系列单片机汇编语言对单片机进行编程。单片机程序采用模块化设计，包含总控程序、中断程序以及各功能子程序；并在程序中设置看门狗，防止运行过程中可能出现的问题。

3 数据分析程序设计

数据分析程序流程图如图3所示，主要包含串口采集模块、数据保存模块、曲线显示模块及数据处理模块。

3.1 串口采集模块

串口采集模块包括电控罗经采集和平台罗经采集两部分。

Windows 平台下的串口采集程序通常可以使用三种方法实现：Windows API、封装好的串口通讯类（如CSerialPort类等）以及串口控件。

综合考虑性能、易用性等因素该数据分析程序采用的是Microsoft公司的ActiveX控件MSComm。

MSComm（Microsoft Communications Control）是Microsoft公司提供的简化Windows下串行通信编程ActiveX控件，通过串行端口传输和接收数据，为应用程序提供串行通讯功能。MSComm控件在串口编程时非常方便，编程人员不必花时间去了解较为复杂的API函数，而且在VC、VB、Delphi等语言中均可使用。MSComm 控件的几个常用属性如下：

CommPort 设置并返回通讯端口号；

Settings 以字符串的形式设置并返回波特率、奇偶校验、数据位、停止位；

PortOpen 设置并返回通讯端口的状态。也可以打开和关闭端口；

Input 从接收缓冲区返回和删除字符；

Output 向传输缓冲区写一个字符串。

3.2 数据保存模块

针对保存数据量较大的特点，该数据分析程序采用数据库的方法保存和管理数据。Microsoft Access是现今小型数据库中使用最广泛的一种，数据库以文件的形式存放于磁盘中，扩展名为mdb，一个文件中可以存放许多表，每一个表就是一个最小的数据结构单位，单一的表有固定的结构（键、主键、对应的数据类型等），表与表之间可以通过键（字段）发生联系。

在Delphi中可以以ADO方式动态建立Access数据库并进行操作，具体的方法是使用ADOX对象，CreateOleObject（'ADOX.Catalog'）函数可用来建立ADOX对象，返回一个OleVariant变量，通过此变量可以在磁盘上建立一个空的Access文件。

该数据分析程序在每次数据采集开始时建立一个临时的Access文件，然后建立临时的数据集、数据源，通过SQL语句（CREATE TABLE）建立临时表，数据采集过程中每收到一个数据就将数据写入临时数据集中，采集结束后如果需要保存数据，就将临时数据库文件拷贝到用户指定文件中并删除临时数据库文件，如果不需要保存数据则直接删除临时数据库文件。

3.3 曲线显示模块

对于一个实时采集软件来说，数据曲线的显示功能是极其重要的，必须清晰、准确、方便的让使用者得到数据的图形表示。Steema公司的TeeChart系列控件无疑是图表显示控件方面的领导者，它具有非常强大的功能，广泛应用于工程、金融等许多领域。

该数据分析程序采用TeeChart Pro 7.0 for Delphi，编程时首先必须为每一个Chart建立Series。Series的类型有很多，在该数据分析程序中使用的是TFastLineSeries，它比较适合显示大数据量的曲线，通过设置可以定义坐标轴、线型、颜色、图表工具、标题、图例等属性，通过AddXY函数可以在运行时添加数据。

TeeChart提供一个图表快捷栏，通过它可以对曲线进行缩放、移动、打印等操作，本软件对该快捷栏进行了扩展，加入了显示坐标功能，在鼠标指针移动到曲线上时显示坐标。

3.4 数据分析模块

数据分析模块包括分析罗经阻尼周期、计算方位稳定点、计算航向起伏误差等功能。罗经阻尼周期为第一个和第二个航向返回点之间时间的两倍。

罗经航向稳定在1°以内，每隔30分钟的航向小于偏差0.5°，最后间隔十分钟的二十个数据的均值为方位稳定点。航向起伏误差为罗经稳定后，继续试验两小时过程中所有航向之间的最大差值。

4 结论

本文所设计的罗经姿态角信号自动采集分析仪能够完成实时采集频率为50Hz、400Hz、500Hz的罗经姿态角信号、实时绘制航向和水平曲线、分析罗经周期、计算方位稳定点、稳定点起伏误差、数据保存对比及编辑打印等功能，信号分辨率

经多次试验证明，该分析仪技术性能可靠，可作为罗经修理辅助设备，能满足多种船用罗经调试需求，提高了装备维修的质量与效率。

参考文献

[1]祝常红.数据采集与处理技术[M].北京：电子工业出版社，2008.

数据分析方向篇9

事实上，目前国内的银行越来越重视数据分析类系统的建设，随着这类系统的持续投资、建设和完善，的确满足了相关领域所需要的一些报表及提供了部分数据分析的要求，然而也出现了报表重复实现、需求不能有效覆盖、用户对于分析需求来自何处缺乏清晰了解、报表陈旧等各类问题，导致银行抱怨虽然系统建设了不少，但是真正能满足需求的却不多。问题的出现，一方面是银行对数据分析服务规划缺乏整体定位，另一方面也缺乏对分析应用的有效管理。因此，无论是行业转型还是管理要求，越来越多的银行开始注重自身数据分析和服务的应用与管控体系建设，应对当前的变革浪潮。总体而言，需要满足以下两方面要求：

银行转型的要求

利率市场化带给储户更多的选择，无形之中抬升了银行资金成本，存款搬家将会成为常态，互联网金融的异军突起更是加剧了这一过程。这就要求银行未来在产品定价、客户营销上更加精准，财务管理与风险控制更加精细，用数据洞察真相，驱动决策，实现集约化经营。在1986年美国推进利率市场化改革后，富国银行逐渐钻研出一套服务于中小微企业的授信体系，对企业的所有制、行业、地理位置、区域经济、销售渠道与合作商、过往贷款使用情况和还款记录、担保人信用等因素进行监控分析，通过数据的积累，发现规律，设计出面向不同行业、不同群体差异化、富有弹性的产品及其相关的渠道、定价及服务策略。例如，通过分析历史需求，设计标准化产品，通过标准化产品可以进行自动化的不需要人工干预的贷款申请流程；基于客户行为评分，施行预防性贷后管理；基于客户细分群风险评价，动态调整贷款利率、贷款规模等。数据分析为该银行选择目标客户群体、控制风险、降低成本、服务好客户起到了至关重要的作用，从而吸引了一大批忠实的小额信贷客户群体。对于不同定位的银行或者是银行经营的其他领域，这都是很好的借鉴。

分析管控的要求

国内银行多年以来也投入了较多人力物力进行数据分析体系的建设，但大多收效甚微，却积累了越来越多的问题。例如分析模式的单一化（局限于报表，灵活查询少），应用针对性差、数据质量差、领导层的需求难以满足，报表的重复建设、变化频繁、分析系统繁杂等等。这些问题的背后凸显的是规范的服务与需求管理模式的缺位，在分析应用建设的同时，只有紧密地将管控与应用相结合才能服务好最终用户，促进分析能力的增长，实现银行的战略目标。

数据分析已经渗透到银行经营从市场定位到运营效率、风险控制、财务管理的核心价值链。构建数据分析手段，建立对业务的洞察及预判能力，也已经成为银行业的核心竞争力之一。要真正打造数据分析能力要求银行从自身经营特点及战略重点出发，制订数据分析蓝图，从管理决策要求明确分析内容，数据应用服务模式与管控机制，从而全面提升银行的数据服务分析能力。

数据分析与服务能力体系构建的关键拼图

数据分析与服务能力的构建首先需要回答：数据分析与服务包含哪些内容，这些内容是用什么样的方式服务那些最终的使用者。构建能力体系应包含三大要素：服务目录（内容）、服务模式（模式）与服务对象（用户）。服务目录是指对银行数据分析和服务内容的划分方式，为便于银行规范整个数据分析及服务体系的编制、查询、使用及管理而建立的分类体系。服务模式是指数据分析与服务呈现给最终用户的方式，呈现的方式往往也通过技术手段实现。服务对象则是数据分析与服务最终需要满足的用户，一般而言可按照不同的组织层级和业务线条或者对数据分析的功能要求等进行划分。

服务目录的构建与管控

数据分析前移是未来的发展趋势，但传统的开发模式往往难以满足临时性、突发的分析需求。然而无论是分析、查询、挖掘、报表等不同的服务模式，其核心都是基于不同分类数据的重新组织，这些数据既包括明细数据、也包括统计类指标或分析维度，因此从某种意义上讲，分析服务目录也是数据分类的目录。通过对常用业务场景的总结，构建不同的专题领域（如市场分析、客户分析、运营分析、财务分析、监管报送等等），明确该领域下所关注的数据清单及适用的服务模式，基于此数据清单及服务模式未来可进行灵活的组合分析。构建服务目录需要有以下考虑：

服务目录需要面向不同用户，形成从战略目标到经营分析的联动。战略决策层通过清晰的战略地图，指标分解，掌握战略目标、关键任务与KPI指标（Key Performance Indication，关键业绩指标）的关系，从而有效监控业务绩效、发现问题。战略目标及关键任务分解表现为分析主题，同时分析主题和KPI紧密相关；经营管理往往是战略目标的进一步分解，包括业务目标与战略目标的关联，关键任务与KPI指标的分解，经营管理层更强调分析主题的细化，因此分析主题也需要结合业务领域的特性进行分解；综合分析层的用户还会关注更细节的数据，例如客户账户、交易明细等，本级服务目录是基于不同分析主题丰富关注的基础数据（如交易、协议、客户等）及分析维度，便于未来进行灵活的查询及信息挖掘。通过分析主题在各层级关注要素的逐渐丰富，实现了数据分析从战略到执行层面的贯通。

服务目录需要面向分析应用。应用是数据分析与服务的最终落脚点，也是服务目录的最后一个环节。应用的规划要充分考虑业务关联性、整体的IT蓝图，应用架构与数据架构共同演进。

服务目录需要充分考虑应用管控。一方面由于建立了不同用户的关系并进行了服务目录分类，管理者以服务目录为核心可以很方便的掌握各个业务领域数据分析与服务能力的成熟度与覆盖度，监控各个使用者对具体服务的使用反馈，发现改进方向并持续优化。另一方面也需要对服务目录本身进行定期的评估，通过收集意见分析业务分类的合理性、覆盖度并进行更新；而使用者则可以使用以服务目录为载体的统一分析应用平台，便捷的获取所需要的报表分析应用或服务功能。

服务模式的规范化管理

服务模式需要考虑基于用户使用习惯考虑信息的展现。为了满足用户的不同偏好，对信息生成的规范管控是高效分析的前提，这里的规范包括各类展现模式下数据服务流程以及详细模板等。

信息展现模式是有迹可循的，与各层级用户的关注点、使用时间、数据时效性等因素相关。例如对于决策层、领导层而言，需要在短时间内将数据转化为业务洞察或产生决策，会偏好直观、一站式的指标分析以及文字型的经营分析报告，对信息推送的及时性、有效性有较高的要求；对于经营管理层而言，通过查看固定报表，掌握日常经营状况，或者基于业绩问题，进行原因下探、多维分析，亦或是编写专题报告向领导层汇报；对于专职的分析人员，借助灵活的查询、多维分析，满足上级领导或外部机构临时统计的需要，或者是专项领域的数据挖掘、预测，及时发现营销机会或交易风险，提升工作效率等等。

提升服务模式的管控。上述不同的展现模式在各银行或多或少均已存在，而不少银行反馈虽已提供了各类服务，用户仍反应不佳，这其中一方面与各银行的技术成熟度、用户意识有关，另一方面与针对性管控模式未形成也有关系。例如，对于全行广泛使用的固定报表，从报表需求的提出、数据口径定义、实施控制、报表台账等全生命周期的流程采用严格的管控，避免重复的报表并严控需求变更；对于个别部门使用的数据挖掘、灵活报表等服务模式则可采用提供基础数据由使用者自行加工甚至自行管理的方式进行管控。

数据分析与服务能力提升的有效路径

各银行、银行内部部门、各分支机构的数据分析与服务能力参差不齐，却积累了一些共通的问题，如建设了不少分散、各自孤立的一些分析类或者报表类系统，报表分布零落，缺乏整合性；业务人员过度依赖于系统，对分析用途、数据口径不理解，自主分析能力不足，只知道机械的生成、报送报表；需求评估、管理体系欠缺，数据标准、质量的要求未与数据分析相结合导致无法满足用户数据准确性的要求。基于此，结合数据分析能力构建的关键拼图，提出了以下四点改进的建议：

结合应用现状与用户需求，逐步向理想的应用规划方向演进。一方面，从战略、业务运营的优先级考虑选择最需要进行改进的方向实施，另一方面，向分析应用蓝图演进的前提同样需要充分斟酌数据与基础设施的完备性及对用户的影响性，可采用临时、过渡的方案，以免无法达到预期的效果。

加强数据分析的管控，充分培养人员的数据分析能力。逐步建立和完善各类数据服务的管理流程；同时强化数据管理理念，在分析需求的提出、系统开发与测试、使用过程中必须紧密的与数据管理要求相结合，遵循数据标准，建立数据质量的发现与改进机制，逐步将规范转化为习惯。数据分析与服务能力的提升不光是数据管理部门或IT部门的责任，业务人员应当深度参与，学习领先实践，由被动推送向主动分析转变。共同维护服务目录、标准定义，参与服务模式、服务内容的评估与优化。

数据分析方向篇10

一、大数据时代对高校毕业生就业指导的影响

人类进入21世纪，迎来了现代最新、最高雅以及最具时代化的信息化发展契机，伴随着互联网、云网络、云共享等海量数据以及数据加载模式呈现在人们面前。全球海量数据出现爆炸式的飞速发展，大数据时代引来的海量信息风暴影响着我们社会生活中的方方面面。高等院校作为高智能人才最密集，文化知识传播最广泛、网络技术传播最发达的革命知识阵营地，教师在教学模式、服务模式、管理模式以及学生的心理特征和学习生活方式，伴随着大数据时代的到来也受到了深远的影响。在2011年到2013年期间，我国全国高校毕业生数额从660万剧增760万人数，近年来高校毕业生数量急剧膨胀的形势下，就业难题变得更加严峻和突出。如何能够准确的了解大学生学业信息和就业情况以及掌握现代就业发展趋势是当前高校开展毕业生指导工作面临的主要困境。因此，通过大数据时代的发展背景下，充分利用互联网提供的海量数据进行分析现代大学生就业工作发展趋势，为其提供更具有专业性以及个性化的就业指导工服务，使高校毕业生能够根据自身学业特点和学习状况选择适合自己的就业发展方向和发展途径做好更佳的选择。

二、高校毕业生就业指导的大数据分析系统的构建

（一）高校毕业生海量信息数据的获取方式及分析方法

高校在做大学生就业指导工作时，在掌握大学生传统就业数据的基础之上，还要利用现代科技技术获取海量信息数据，从而进一步的拓展数据信息采集工作和采集路径，使所采集到的信息数据易于分析和提取，并且在一定的条件下，可以快速的索引出来，能够及时全面掌握学生的专业信息、学习成绩、个人爱好、培训经验以及就业意向等等。同时利用现代科技技术将就业数据中的信息逐一分析出来，例如当前就业形势分析、就业方向分析、就业政策分析以及就就业招聘会信息分析等整合资源信息，并根据大学生的个人信息、就业发展方向、未来岗位数据分析、基本要求、素质要求以及发展前景等建立大学生就业指导的大数据分析系统，根据聚集搜索的海量数据进行分析。

（二）大数据分析系统在就业指导中的重要性

通过运用大数据分析系统，能够简单、方便、快捷的掌握当前大学生的就业需求和就业方向，具体分析大学生选择就业岗位在经济市场上的质量和水准，在校招聘会的招聘工作人员及时提供重要的数据依据和参考。同时通过利用大数据分析系统分析毕业生就业信息和就业趋向，能够帮助高校就业指导人员实施个性化的就业指导，增强业务指导的有效性和针对性，加大就业指导工作力度，为大学生生提供多元化的就业指导方向以及行之有效地就业指导服务。

（三）加强就业指导中的思想政治教育工作

伴随着我国经济市场的深入变革，进一步的带动了毕业生在就业方式上的深入变革，从传统的毕业生安排分配岗位，发展到现代的双向选择以及自由择业。伴随着全国高校毕业生人数的骤增，而人数的增加致使就业市场竞争愈加激烈，大学生在就业方面产生一定的心理压力。同时用人单位也对当前大学毕业生的就业能力以及就业素质提出了更高的要求，因此，就业指导人员需要对高校大学生做更深层次的指导，而不单单的是在就业方面的指导，而是要加强学生职业道德的思想政治教育工作，同时引导学生正确认知自己，客观评价自己，给予学生在择业上树立自信心以及树立正确的就业观念，使学生能够全面了解掌握自己的同时，能够以积极向上的心态面对当前就业局势并能及时做好自我心理调适能力。

三、大数据分析在就业指导工作中的注意事项

面对当前大数据时代的浪潮，我们在发挥大数据分析系统的作用的同时，也要正确看待大学生的真正发展需求，我们所要面对的不是海量数据信息而是大学生本人，大数据系统的构建和分析并不是单纯指向数据，而是通过数据信息渠道及时掌握学生的就业动态、思维模式和学习状况，从而帮助学生树立正确的人生观、价值观以及世界观。同时大数据的分析主要是在实际应用中体现其价值，就是通过全方位、多角度的掌握学生的自身学习优势特性，了解当前经济市场的发展趋势以及用人单位的人才需求通过数据理论依据科学地指导大学生找出一条适合自身优势特点的个性化就业指导方向，从而满足于学生、学校及社会的共同期许。

四、结语

在现代大数据时展背景下，通过利用大数据系统分析能够帮助大学及时掌握现代经济市场动态，满足于大学生的就业需求。在建立大数据分析系统的基础之上，还要建立完整的动态运动管理机制，能够掌握大学生信息动态和社会市场经济的变化，优化整合数据采集信息，建立完善的信息反馈机制，从而使现代大数据分析系统更好地服务于高校毕业就业指导工作。

数据分析方向篇11

需求分析必须按自顶向下、逐层分解的方式对问题进行分解和不断细化。软件的功能域和信息域都能做进一步的分解，可以是同一层次上的横向分解，也可以是多层次上的纵向分解。

需求分析给出系统的逻辑模型和物理模型。逻辑模型给出软件要达到的功能和要处理的数据之间的关系；物理模型给出处理功能和数据结构的实际表示形式。

二、需求调研

在做需求时，分析人员和客户必须达到和谐的交流，融洽的沟通。通常采用以下几种调研方法：

1．会谈、询问：围绕软件目标提出具体问题；

2．发放调查表；

3．收集分析客户使用的各种表格、有关工作责任、工作流程、工作规范、相关数据标准、业务标准的各种文字资料；

4．收集同类相关产品的宣传资料、技术资料、演示程序或软件程序；

5．情景分析：利用情景分析诱导用户能够把需求告知分析员；

6．可视化方法：结合情景分析，利用画用户界面图、业务流程图、功能结构图、时序图等图形与客户进行讨论。

一般分为规划阶段和业务领域分析阶段：

在规划阶段，第一步要构建高层次的企业模型，包括：调查组织结构、建立组织关系层次图；调查企业的任务、目标、战略重点和关键成功因素并予以分类；识别每个目标和关键成功因素所需的信息；给出每个目标完成的度量标准；分析信息技术对企业业务的潜在影响；建立高层次企业模型；与企业中高层管理人员讨论，对所得信息和分析进行补充和确认。第二步对功能进行分解，具体是输出功能层次图、功能关系图、功能／组织矩阵；第三步进行实体分析，主要是输出高层实体关系图、实体类／信息需求矩阵、业务功能／实体类矩阵。第四步评估企业当前环境。第五步识别和确定预期的数据存储和业务系统，建立业务系统的结构图，确定和记录业务领域。

在业务领域分析阶段，第一步确定业务范围、建立组织、制订计划；第二步进行数据分析、建立详细的数据模型，即详细的实体关系图；第三步业务活动分析，包括分析业务过程细节、分解业务过程、分析过程间的依赖关系、分析业务交互作用、建立业务活动模型；第四步现有系统分析，具体指操作程序分解表、数据流图、用户感兴趣的字段集；第五步业务领域模型的确认，包括完整性、正确性、长效性。

在做需求时不仅要求分析人员要有很强的沟通能力、语言表达能力，还要有相应的调研策略。首先确定用户的软件开发目标，确定系统基本范围，然后围绕这一目标，确定要访问的部门和人员，要了解的业务，以业务为主线，搞清每个业务的每个环节的流程关系、涉及部门、输入输出项；以数据为主线，搞清数据采集方式、数据流向、数据之间的内在联系；搞清哪些业务或数据是已建系统的，它们和新系统的关系是衔接还是替换；应思考是否有新技术可以改进现有工作，用户提出的需求用现有技术能否实现。

三、需求分析过程

取得了需求之后，要对需求进行分析，分析过程是：

第一，问题识别。

解决目标系统做什么，做到什么程度。需求包括：功能、性能、环境、可靠性、安全性、保密性、用户界面、资源使用、成本、进度。同时建立需求调查分析所需的通信途径。

第二，分析与综合。

从数据流和数据结构出发，逐步细化所有的软件功能，找出各元素之间的联系、接口特性和设计上的限制，分析它们是否满足功能要求并剔除不合理部分，综合成系统解决方案，给出目标系统的详细逻辑模型。

常用的分析方法有面向数据流的结构化分析方法SA、描绘系统数据关系的实体关系图E-R图、面向数据结构的Jackson方法JSD、面向对象分析的方法OOA(主要用UML)。对于有动态时序问题的软件可以用形式化技术，包括有穷状态机FSM的状态迁移(转换)图STD、时序图、Petfi网。

上述每―种分析建模方法都有其优势和局限性，可以兼而有之。以不同角度分析，应该避免陷入在软件需求方法和模型中发生教条的思维模式和派系斗争。一般来说结构化方法用于中小规模软件、面向对象方法用于大型软件。

结构化方法分析步骤是：画出数据流图；设计数据流图必须逐步求精；决定哪些部分需要计算机化和怎样计算机化；描述数据流细节，大型软件可以使用数据字典描述所有数据元素；定义处理逻辑；定义数据存储，即定义每个存储的确切内容及其表示法；定义物理资源；确定输入输出规格说明；确定硬件所需有关数值；确定软硬件接口和环境需求。

UML方法分析步骤是：调研、识别系统需求；分析问题领域：确定系统范围和系统边界、确定系统的约束、定义活动者、确定系统的综合要求、确定系统的数据要求、建立USE CASE模型并绘制、绘制主要交互图等；建立静态结构模型：对象类图、数据库模型、包图；建立动态行为模型：顺序图、协同图、状态图、活动图；建立系统物理模型：组件图、配置图；

第三，编制需求分析文档。

需求分析文档便于用户、分析人员和设计人员进行理解和交流。用户通过它可在分析阶段即可初步判定目标软件能否满足其原来的期望，设计人员将它作为设计的出发点。

第四，需求评审。

在将需求分析文档提交给设计之前，必须进行需求评审。一般以用户、分析人员和设计人员共同参与的会议形式进行，包括以下评审标准：正确性、无歧异性、完全性、可验证性、一致性、可理解性、可修改性和可追踪性。

四、需求管理

需求分析过程是一个由粗到细、渐进明晰、持续完善的过程。在指导后面系统设计和编码阶段时都应当不断完善修改需求文档，因此需求管理非常重要。

需求管理包括在工程进展过程中维持需求约定集成型和精确性的所有活动，它是CMM模型二级中的首要KPA(关键过程域)。这些活动包括：定义需求基线(需求文档的主体)；评审提出的需求变更申请、评估每项变更可能的影响，从而决定是否实施变更；以一种可控的方式将需求变更融入到项目中；使当前的项目计划与需求保持一致；分析变更所产生的影响并在此基础上协商出新的约定；使每项需求都能与其对应的设计、源代码和测试用例联系起来以实现跟踪；在整个项目过程中跟踪需求状态及其变更情况。

数据分析方向篇12

移动电子商务（M-Commerce）是由电子商务（E-Commerce）衍生出的新生概念。随着互联网的不断发展，移动电子商务正在全世界范围内的普及和发展。移动电子商务本质上是电子商务技术的一种创新，基于移动无线网络，依托手机等个人移动通信设备，使用户能够减少时间和空间的限制并进行活动，是电子商务的一种新形式，并改变了电子商务的传统格局。

据艾瑞咨询最新统计数据显示，2016年移动购物市场交易规模约3.3万亿元，占网络购物总交易规模的70.2%，继2015年超过PC端之后，成为电子商务的主流渠道。同时，根据最新的一季度报告预测，2017年第三季度左右，全球移动电子用户将达50亿左右。

二、移动电子商务中的数据分析与应用

数据分析是移动电子商务重要的组成部分，同时也为产品决策提供重要参考。针对移动产品，数据分析就是利用挖掘数据的分析方法与技术手段，在手机用户大量的交易数据中总结产品流量和顾客转化率之间的规律和特点，分析消费者的消费特点。具体则是通过网络和交易信息提取客户、市场、产品环节的数据，然后建立相关模型，在更加动态化的商业环境下，能够更有效的优化产品及商业模式。

1.数据挖掘

通过自动化或半自动化的工具，数据挖掘可以挖掘出数据内部隐含的模式，并从中发掘信息或知识，同时从已有的数据中提取模式，提高已有数据的内在价值，并且把数据提炼，转化成为知识。在移动电子商务的运营之中，针对大量繁杂的客户消费及使用稻荩需要应用多种数据挖掘技术来分析客户特征，获取用户关注点，培养用户忠诚度，并在此基础上制定有效的营销计划来吸引优质用户。

在数据挖掘中最常使用的四种分析法：分类分析，关联分析，序列模式分析和聚类分析：

（1）分类分析可以定义区分数据类或概念的模型和函数，以便能够使用模型预测未知类标记的对象类。

（2）关联分析通常利用数据关联规则进行数据挖掘，其目的是挖掘隐藏在数据间的相互关系。

（3）序列模式分析同样也是为了挖掘数据之间的联系，但侧重于分析数据间的前后序列关系。

（4）聚类分析，是指根据“物以类聚”的原理，将本身未有类别的样本聚合成不同的簇，并对每一个簇进行描述的过程。

2.数据处理

（1）数据收集

一款移动电子商务产品的分析团队在处理数据前，首先要解决的问题是数据源的收集。数据收集可以分为二大类。第一类是直接能获取的数据，通常为内部数据。第二类则称为外部数据，是需经过加工整理后才能得到的数据，如手机应用平台的下载数据。

（2）数据清洗

数据清洗是数据处理中的重要部分，通过工具或编程，如Excel，Python，对数据进行筛选、清除、补充、纠正，其目的是从大量杂乱无章、难以理解的数据中抽取并推导出对解决问题有价值、有意义的数据。清洗后保留真正有价值的数据，为数据分析减少障碍。

（3）数据对比

对比，是数据分析的切入点。如果参照缺失，数据则无法确定定量的评估标准。分析过程通常采用二点切入法进行数据对比分析：横向对比与纵向对比

①横向对比，是与行业平均数据，以及竞争对手的数据进行比对，以市场为轴心。

②纵向对比，则是和产品自身的历史数据进行对比，以时间为轴心。

（4）数据细分

数据对比发现了问题后，需要用到数据细分来确定问题数据的范围，根据移动产品的差异对数据异常的范围和精度进行分析，随后进行测试与修正。数据细分通常情况下先分纬度，再分粒度。

三、数据分析

数据分析是指用适当的比较或统计方法对收集来的第一手和第二手资料进行分析，以求最大化地开发出数据资料的功能并发挥数据的作用。为了提取有效信息和形成结论，通过分析手段，可以对数据加以详细研究和概括总结。在进行正式的数据清洗，确保了数据可靠性与完整性后，可对所获取的数据进行多层面的具体分析。根据不同的数据分析层面和结果导向分类，在移动电子商务的数据分析中常应用两种分析类型。

第一种，传统电子商务营销管理中的常用分析：SWOT、4P、PEST、5W2H、Userbehavior等；第二种是统计分析：描述统计、假设检验、相关分析、方差分析、回归分析、主成分与因子分析、决策树等。

1.数据分析方法

对于第一种类型的数据分析，常可以采用比较分析法来确定基本的分析方向以及产品导向。比较分析法分为两种类型，同比与环比。

为消除数据周期性波动的影响，同比将移动产品本周期内的数据与之前周期中相同时间点的数据进行比较，计算同比增长率。而环比则反应数据连续变化的趋势，将本期的数据与上一周期的数据进行对比。同环比能为产品整体运营的发展状况提供有力的参考，但必须建立在一定的基础上和环境上。

对于统计分析，最常用的是相关分析以及回归分析。相关分析研究的是现象之间是否相关、相关的方向和密切程度，一般不区别自变量或因变量。而回归分析则通过分析现象之间相关的具体形式，确定因果关系，并用数学模型来表现其具体关系。举例来说，对一个移动电子团购平台的产品来说，从相关分析中可知“质量”和“用户满意度”变量密切相关，但只有通过回归分析方法才能确定这一对变量之间到底是哪个变量受哪个变量的影响，以及影响程度如何。

2.数据分析应用

在移动端电子商务中，APP数据分析对于开发者或运营者都是十分重要的环节，主要数据分为4个方面：用户来源、用户属性、转化率及用户忠诚度。

（1）用户来源

对于移动产品平台来说，获取用户的渠道很多，如CPA广告、交叉推广、限时免费等等。开发者从多个维度的数据来对比不同渠道的效果，比如从活跃用户、次日留存率、使用频率、使用时长等角度对比不同来源的用户。通过渠道对比，可以高效地找到最适合产品发展的渠道，以便不断完善推广策略。为了追踪App渠道来源，可以用到两种不同的方法：

①Android渠道追踪方法

国内Android市场被数十家应用商店所割据，Android渠道追踪主要围绕其中几种渠道展开。具体来说就是开发者为每一个渠道生成一个渠道安装包，不同渠道包用不同的渠道ID来标识。当用户下载了App之后，运营人员就可以通过渠道标识查看各渠道的数据。

②iOS渠道追踪方法

不同于Android的开放生态，iOS是一个完全封闭的系统。在苹果的唯一性原则以及严格的审核制度下，Android打包的做法在此则无法生效，可以通过Cookie追踪渠道更为高效的追踪数据。

（2）用户属性分析

在吸引用户下载使用之后，产品运营及开放方要尽可能地详细了解用户的设备型号、网络及运营商、地域、用户性别等宏观层面的用户特征。这些特征数据可在产品改进、应用推广和运营策略的制定上提供有力的方向性依据。

①同期群分析是一种基于同期群的核心数据及行为的对比分群方式，按用户的新增时间将用户分群，得到的每个群就叫同期群。

②获取成本分析，是指获取到一个真实的新用户所付出的平均成本。同时也要注意用户回报弥补获取成本的速度，尝试不同的渠道并跟踪用户的行为，使用如K因子传播作为降低获取用户成本的手段。

③用户终生价值分析，是指用户平均会在平台、产品上贡献多少价值。最大化用户营收的方法就是根据用户频度制定不同的定价方案，针对高频用户通过广告、精品内容收费，对于低频用户则采用单次收M模式。

（3）转化率

对移动电子商务来说，产品转化率至关重要，直接关系到开发者的产品收入。如一款移动电子游戏应用，开发者可从道具购买量、关卡和付费人群等多个维度进行交叉分析，从而查看用户付费行为动机和特征，也可以通过漏斗模型进一步分析关键节点的转化率，提高付费转化，增加收入。

（4）用户忠诚度

了解用户在一个产品应用内做了什么，并确保用户喜欢该产品，是移动产品优化产品生命周期的根本。开发者可以从留存用户、使用时长、使用频率、访问深度等维度评价用户粘度，以及RFM（Requency，Frequency，Monetary）来评估用户系数。例如，通过检测每月新增用户在初次使用后某段特定时间内的留存率来对用户进行评估。

统计留存用户的时间粒度很细，主要有次日留存、7日留存、30日留存。

四、数据分析对移动电子商务的意义

无论是公司或个人，在这个新时代，具有数据分析思维是一种更高层次的元认知能力。由于移动互联网的出现，用户数据大量积累，营销方案的制定都是基于数据分析结果来决策。作为移动电子商务公司的数据分析师，必须有对繁杂枯燥的数据进行数据分析的本领，更要有商业敏感性。

随着大数据时代的到来，以数据分析为思维的经营和管理思路将成为移动电子商务市场中消费行为及市场分析的依据，而在这种以数据为主体的决策制定中，企业获取的分析数据是直观、动态、及时的，相比咨询公司或调研公司的滞后分析具有大数据和全样本的优势。利用数据来分析用户的行为习惯，进而揣测用户的心理，深入挖掘用户需求，可以精确得出产品定位及活动，进行决策。

数据分析方向篇13

企业名称：甲骨文

业务方向：主要面向大企业等市场

在2011年10月初召开的Oracle OpenWorld 2011大会上甲骨文正式推出了Oracle大数据机。对于那些正在寻求以更高效的方法来采集、组织和分析海量非结构化数据的企业而言，该产品具有很大的吸引力。

企业名称：谷歌

业务方向：面向各类企业市场

BigQuery是Google推出的一项Web服务，用来在云端处理大数据。该服务让开发者可以使用Google的架构来运行SQL语句对超级大的数据库进行操作。BigQuery允许用户上传他们的超大量数据并通过其直接进行交互式分析，从而不必投资建立自己的数据中心。