大数据专题
? ?
考察具有代表性的新兴公司后,我们进一步总结大数据这种代表未来的技
术,它的产业链构成。
大数据的产业链自底向上有主要三层构成。第一层是企业内部交易数据和企业外部的用户行为数据、物联网数据等等。这一层的主要任务是数据的采集、传输、采集等工作;第二层次是信息层,去芜存菁,提炼形成价值密度更高的信息。信息层,可以产生诸如数据包销售、租赁等业务模式。也会诞生一批靠搜集各类数据为主业的公司。如网络信息爬虫、区域数据提供商等等;第三个层次是知识层。对于知识利用,则需要人工介入,主要需要融合行业信息。Opera公司的业务就是在知识层。
图表41:大数据产业链
来源:公司资料,国金证券研究所综合整理
?
广联达公司在信息层面,销售初级的数据产品。Opera公司在知识层面,已经介入其客户的业务流程中。类似广联达业务模式的公司还有TMT研究员如数家珍的超图软件、四维图新、高德软件等。
新兴的技术类公司提供大数据的采集、存储、传输等技术。这类公司也是海外PE追逐的对象。具体情况参见下表。
?
- 26 -
敬请参阅最后一页特别声明
大数据专题
图表42:大数据时代的新的平台技术、服务、传输渠道新平台技术?基于SQL语言:面对OLAP的传统行和列数据入口/汇聚图表43:新兴大数据产业链公司融资情况一览表
不同范围的服务新的传输方案?前提:传统交付模式-单片或基于设备的解决方案公司名称 Opera Solutions MapR Zettaset Cloudera ParAccel DataStax
Neo Technology Datameer MISO GoodData
?云:能够充分利用物理设施的?不基于SQL或map-reduce的: 由谷歌率先发起数据平台弹性,以实现处理快速增长数据的能力?数据流:基于运行商数据直接生成任意图形分析“数据库将演变成一个虚拟的,基于云计算,超级可扩展的分布式平台。”-Forrester analyst Jim Kobielus最新融资时间 2011/9 2011/11 2011/6 2011/11 2011/9 2011/5 2011/12 2011/8
融资额($) 8400万 2000万 300万 4000万 2200万 1100万 1060万 925万 400万 1500万
轮次 A B C B A B B A
来源:麦肯锡,公开资料,国金证券研究所
- 27 -
敬请参阅最后一页特别声明
大数据专题
图表44:新兴大数据相关公司简介
信息深度分析 数据挖掘相关技术及服务
Opera Solutions Quantivo ACXIOM MapR Technologie
s Zettaset Cloudera HStreaming Microsoft SAP ParAccel VERTICA
数据采集、传输和存储
PERVASIVE
公司简介
为政府和工业提供大企业和政府组织解决方案、垂直解决方案两种主要产品
Quantivo是为各种规模的企业提供大数据解决方案的领先供应商
简单来说,主营业务是数据库营销
MapR通过创新显著提升了Hadoop平台的性能,让Hadoop更加可靠、便宜、易于管理并方便 Zettaset平台是一个企业的数据分析套件
CLOUDERA业务领域涵盖企业信息化系统、商务智能等多种IT产品与服务 专业提供大数据分析平台 全球最大的电脑软件提供商
SAP是目前全世界排名第一的ERP软件
提供快速、选择性查询和列存储数据库,并基于大规模并行处理优势特点的产品
分析及数据管理软件公司Vertica的技术用于帮助客户“以必要的速度和规模货币化数据
为需要高度弹性、迅速实施以及低实施成本的中小型企业设计符合需求的数据基础建设软件 产品是建立在云计算基础上的数据分析服务平台,有一些saas应用程序
EMC公司是全球信息存储及管理产品、服务和解决方案方面的领先公司
全球性的资讯科技公司,主要专注于打印机、数码影像、软件、计算机与资讯服务等业务
全球最大、专注于数据仓库,大数据分析和整合营销管理解决方案的厂商
Kognitio自定义为业界速度最快,最具可扩展性,最实惠的的数据库分析平台
FirstRain是一种商业信息搜索和监测工具
大数据产品介绍
计算机系统可以一次性采集数十亿条数据,分析这些数据,并从中获得有关消费者、市场等见解
推出云计算为基础的分析平台从多种来源组合业务数据,能帮助用户提出正确的问题,以获得最佳答案 结合消费者数据和分析,提供咨询解决方案
MapR主要作用是使Hadoop变为一个速度更快、可靠性更高、更易于管理的分布式计算服务和存储平台 主要帮助帮助用户进入数据库,进行数据分析
发布了一款可用来搭建云计算平台,处理海量数据的免费软件
Hstreaming实现了基于Hadoop分布的不间断实时分析 通过推出Apache Hadoop和相关的SQL Azure Hadoop服务,宣布进入大数据领域 SAP正式发布了HANA产品
其平台支持一系列针对各种复杂、先进应用的工作负载报告和分析
开发了用于存储和查询数据库的数据管理解决方案其产品包括Vertica分析数据库、云和分析数据库应用等 Pervasive产品能执行Oracle、DB2、Sybase及SQL Server等不同数据库间的大量数据转移,能整合SAP等不同应用系统
企业客户还可把GoodData的方案嵌入自己的云计算产品,然后直接访问业务面板和更为先进的数据仓库 EMC推出了自己的Hadoop软件工具,Greenplum 惠普收购了Vertica——提供高效数据存储和快速查询的列存储数据库实时分析平台
Teradata推出Teradata Aster MapReduce平台,推进大数据分析的应用
Kognitio WX2提供内存分析能力和快速的访问能力 除了拥有一套关键的公司信息数据库外,其能够从新闻、博客、行业、政府、科研和大学资源等开放网站上挖掘和整合信息
公司产品系统性能要高于传统数据库厂商相应系统的 10-100 倍,而其成本却是他们的三分之一
开发了业界首个基于云的自动化分析平台 RA.Pid,此平台简化了数据的收集及处理过程
GoodData EMC HP Teradata Kognitio FirstRain
NETEZZA Rosslyn Analytics
来源:国金证券研究所
Netezza从事存储和分析数据软件与硬件的集成,也是为数不多的已经获得客户的数据存储公司之一 通过先进的数据分析技术为顾客创造不可替代的价值
- 28 -
敬请参阅最后一页特别声明
大数据专题
图表45:大数据产业的发展阶段
客户集群一客户集群二
圆圈面积表明市场空间
智慧
知识
交通
金融
服务业
报表
政府
数据驱动
组织变革
房地产
教育电信
挖掘行业内部数据
来源:国金证券研究所
整合行业外部数据
?
大数据的产业链可以粗略的划分为三个阶段,第一阶段是内部数据整合及分析挖掘;第二阶段是企业内外部数据融合及用户行为模式分析与数据挖掘;第三阶段是数据驱动的以消费者为中心的组织变革。北美部分企业已经处在第二阶段早期。国内金融行业开始第一阶段的深化应用。
Gartner发布的 2011年技术成熟度曲线中,大数据处于高速发展期。在产业角度看处于高速成长期。
?
- 29 -
敬请参阅最后一页特别声明
大数据专题
图表46:Gartner 2011年技术成熟度曲线,大数据处于高速发展期
来源:Gartner 国金证券研究所
投资要点
?
在数据成为资产这一历史趋势中,有三条投资主线。第一,类似广联达、
四维图新、超图软件在开展业务过程中,天然产生大量行业数据的公司;第二,具备数据建模、分析、处理能力的公司;第三,提供大数据技术或者建设大数据平台的公司。其中第三条投资主线在A股市场缺乏标的。VC机构可以参考前文列举的海外新兴公司。
数据成为资产后,必将带来安全问题、数据展示等问题。因此还有两条投资辅线。第一提供数据安全的公司。如卫士通。第二提供统一展示公司。久其软件、微创股份。久其提供报表软件,而微创股份提供大型显示设备。
?
- 30 -
敬请参阅最后一页特别声明