CEITC 2018丨梅宏:大数据治理体系建设的若干思考(深度长文)(大数据的管理,关键词优化)

时间:2024-05-04 16:46:04 作者 : 石家庄SEO 分类 : 关键词优化
  • TAG :

    CEITC+2018%E4%B8%A8%E6%A2%85%E5%AE%8F%EF%BC%9A%E5%A4%A7%E6%95%B0%E6%8D%AE%E6%B2%BB%E7%90%86%E4%BD%93%E7%B3%BB%E5%BB%BA%E8%AE%BE%E7%9A%84%E8%8B%A5%E5%B9%B2%E6%80%9D%E8%80%83%28%E6%B7%B1%E5%BA%A6%E9%95%BF%E6%96%87%29

聚焦信息技术领域 为产业发声

导读年4月21日,在苏州举行的第十三届中国电子信息技术年会上,梅宏院士应邀作题为“大数据治理体系建设若干思考”的大会报告。在报告中,梅宏院士回顾了大数据技术与产业生态的发展历程,指出大数据治理成为当前发展的热点方向;介绍了大数据治理相关研究与实践的现状,分析了尚存在的问题,并介绍了一种多层次、多维度的大数据治理体系框架。以下为梅宏院士发言实录。

尊敬的各位领导、在座的同行们大家上午好!非常感谢电子学会给我这样一个机会来谈一谈对大数据的认识,我还是非常认真地做了一次准备,这次所有的内容是全新准备,第一次亮相。过去我谈技术和应用比较多,最近我想结合最近的一些思考,谈谈大数据治理的问题。这方面我自己也是一个外行,还在学习当中,所以说这中间如果说有什么不对的地方,仅仅是个人观点,供大家批评。

我想谈两个方面,如果我们要回顾一下大数据的发展和现状,然后就大数据治理体系谈一些认识。

大数据的发展和现状

我想以这张图,把Gartner从2011年开始,整个对技术的预测来回顾一下大数据的技术发展。大家知道Gartner新型技术成熟度曲线图,顶点就是炒作的高峰,然后逐步回归底线。2011年,大数据还在山腰爬坡,最左边的那张。然后到2012年的时候,快爬到坡顶,2013年到了顶峰,2014年下来,2015、2016年就不存在了,为什么?整个平面图就说明一件事情,对大数据的认识已经趋于理性,大家在喧嚣以后找里面真正的东西。

再以另外一张图来展示,就是大数据产业生态图。这个图是最早2012年彭博社发展的。这张图是把大数据整个的产业,就是小的已经隐掉了,就是一些企业,将这些企业分为基础设施类、分析类、应用源的跨基础设施分析的,还有开源项目,这里面涉及的很多。时间关系,大家后面再看,我不做一一地解释。我这里将它列出来,可以看到2012年是风险投资人Matt Turck绘制了1.0的版本,然后10月份正式发布了大数据产业地图。

从这张图可以看到这是第一次出现大数据基础设施是当时的研发重点。有了大数据基础设施,主要是指以信息技术为支撑的,怎样处理和管理大数据相关的基础设施。基础设施相关的业务和企业发展是比较快的,生态系统正在逐步地形成,同时也在快速的演化过程中。2014年出了新的版本,这时候大数据分析就成为了生态系统里面最火热的部分。我们看到分析成为热点,有大批的公司成立并快速发展,风险投资大量涌入。应该说这个时候生态系统还处于一个初级阶段。

2016年大数据应用成为发展的重点,面向行业和领域的应用型企业发展迅猛,生态系统逐步形成,向更为成熟的程度发展。年又出现一个新的重点,年的重点是把数据治理、数据安全,我这里看到,这里面的数据治理还是相对狭义的治理,数据治理、数据安全首次纳入基础设施的范畴。数据资源、数据安全成为重要的基础设施,整个生态系统发展全速推进。大家看到右下角出现的东西,是以前图里面没有的,就是关于RD资源,将研发资源当成重要的生态系统的环节出现。

从当前来看,IDC有一个报告,2014年全球大数据市场规模是285亿美元,同比增长50%。2015年,达到384亿,同比增长34.7%,年是市场规模达到721亿,未来五年,行业的年均复合增长率在40.98%,2021年,全球大数据规模将回答道2347亿,这是他们的估算。还有一个对数据总量的估算,这也蛮有意思,2014年IDC的报告。说2020年前全球数据量将保持每两年就翻一倍的速度增长,预计2020年全球数据量将达44ZB。

结果在年4月,IDC发布了《DATA Age2025》报告,预计,2020年全球的数据量要晁盖50ZB左右,又超出了6个ZB,6个ZB什么概念?说明这件事情数据量的增长本质上是超出我们的预期。当然因为它这个估算只是按照它自己存储设备的量来算,这种算法我们大量的数据都是重复的,拷贝存在的,还有大量的实际上没有用的数据。

2025年,大数据量将达到160ZB。在他新的报告里面有一句话我一直在琢磨“Do not Focus on Big data;Focus on the data that is Big!“我们不要在抽象层面上或者是宏观层面上再去讨论大数据,大数据未来就是无处不在。我们每个人生活中所遇到的都是大数据,所以我们关注的是数据本身,至于数据大了怎样将它分析好、应用好,这里面就体现了一个非常关键性的变化。

这张图也是易观智库发表的我们国家大数据生态状况图,2015年从三个技术层次主要是被5—8家国际厂商主导,国内厂商多出现在数据使用层当中的数据可视化领域,极少数涉及到数据的升级和管理。国内的大数据生态系统,也在向着细分的大数据服务方面发展,可以看到基础技术和系统方面缺乏原创,分析方法与算法应用牵引不足,研究实用性和易用性偏弱,互联网大数据的应用水平和效果接近国际先进水平,其他行业和企业的大数据应用水平和效果是明显落后。

这是2016年的,我们可以看到大数据领域,国际上仍然占主导,基于物联网的数据采集与数据管理初现,各内容类互联服务竟相成为数据源,垂直化与行业化应用发展迅猛,应该说我们水平提升,开始积累大量的原始数据,已经成为数据的收集和管理,已经成为我们国家大数据产业发展的重要和关键的点。总书记讲数据经济,数据是关键的资源,所以这块大家的重视度日益增高。

从国家总量来看,2015年,中国大数据市场规模达到115.9亿元,同比增长38%;2016年是168亿,同比增长45%。但是预计年会达到280亿,未来五年年均复合增长率约为27.29%,2022年将达到735亿元。IDC给出中国的量,2020年按照44ZB来算,中国会占到18%。从2013年的指数,我们以一个iPad装的数据累积起来大海就这么一点点,到2020年可以到月球上一下,这是打一个形象比喻。

前面我们回顾了一下大数据的发展,主要是从产业角度来看。应该可以看到从产业地图展现和技术研发走向是有这样一个趋势和阶段,从基础技术和系统,以及大数据基础设施的构建,分析方法和算法,到领域行业应用,现在涉及到大数据资源管理安全的成为一个新的热点,由于大数据作为战略资源的地位越来越重要,我们管理、安全隐私、开放共享成为当前的重点,因此要建立数据的治理体系,成为当前一项紧迫的任务。

对大数据治理体系的认识

下面我谈谈对治理体系现状和未来的一些认识。

先说说相关的概念,我也在学习,什么是治理,什么是管理?治理本身是源自于拉丁文的“掌舵”一词,它是指政府掌握和操作的某种行动。它是联合行动的过程,强调协调而不是控制,治理是存在着权力依赖的多元主体之间的自治网络,治理的本意是服务,通过服务来实现管理的目的,治理是决定谁来进行决策,管理了就是制定和执行,这中间还是有细微划分。

在大数据治理里面,当前可以看到有很多的实践。但是我梳理了一下,不管是从微观、中观、宏观层面,我们谈到的这件事情它的定义内涵是一致的,从微观层,主要是从策略和程序角度定义。有一个定义是说大数据治理是描述数据怎样在它的生命周期内有用,和经济管理的组织策略和程序。

而从中观层面,大数据治理是企业数据可获得性、可用性、完整性和安全性的部署和全面管理。从信息治理计划,过去有一个IT治理、信息治理的说法,广义信息治理计划的一部分,制订与大数据有关的数据优化、隐私保护和数据变现的做法。从体系框架角度也有,说是对组织的大数据管理进行评估,指导和监督这样一个体系框架。通过制订战略方针,明确公等待实现大数据的安全可控、价值提升提升创造,并提供不断创新的大数据服务。大家看到各种各样的都有它的道理,但是他们的内涵是不一致的,也就是在这个领域认识不一样。

总结来看,他们的具体落实是落在组织层面,我们是讲一个群体,不管是企业还是法人代表。这是国内和国外总结的东西,第一个是从大数据类型、产业与功能、治理来定义大数据治理框架,他讲企业可以根据框架,制订自己的准则。另外一个是从原则、范围、实施与评估三个维度。

实际上我们可以看到现在的工作基本上是在企业层面。如果真正地来看,大数据这件事情作为一个国家的战略资源,单靠企业、单靠组织层面实际上是不可能构成一个完整的体系,所以说我们梳理了一下,这是个人的观点。我认为现在的大数据治理有很多很好的工作,但是仅仅落实在企业层面是远远不够的。而且它中间很多方面本质上也没有覆盖到一个整体多方位、多源。

我梳理一下是有几个问题,第一,我认为大数据的治理体系涉及到组织,也涉及到行业,更涉及到国家,至少这三个层面。在这三个层次,我们怎样去定义构建一个完整的曲线,大家想一想国家层面没有法律法规的沟通,你下面任何的治理体系都完不成。

第二,大数据治理体系需要完善的法律法规,全面的标准体系支撑,是否需要围绕“数据”为主体来制订制度法规和标准规范,现在我们信息安全、全世界研究的包括数据的隐私,探讨的很多。前段Facebook事件给大家一个警醒,很多人都开始关注隐私的问题。在这一问题,这些东西的层面上,我们有没有必要围绕数据这件事情来构建一套相关的体系,实际上现在全世界也都没有。

第三,大数据的治理的重要性已得到较为广泛的认识,已有不少成功实践,但是我们可以看到现在的实践还尚不足支撑一些共识的形成,还是盲人摸象,或者是自己站在自己的点上讲道理。

第四,大数据治理体系技术支撑需要涵盖大数据管理、存储、质量、共享与开放、安全与隐私保护等多个方面,当前相应的技术研究关联性和系统性还存在欠缺,都是在点上,整个将技术关联起来还有问题。

第五,大数据资产地位得到广泛认同,但是如果没有有效的管理和应用,这种数据实际上会成为负担,这对任何层面都是一样的。

第六,大数据管理的相关方法与技术已有不少成熟产品与技术,但还是缺少完善的多层级的管理体制和高效的管理机制。单有技术,没有管制体制和机制也完不成。

第七,大数据共享与开放已经成大数据成功应用的关键,怎样将技术和标准有机结合,能够建立在不同层级上的良好的大数据的共享与开放环境。像政府现在做的就是推广政务的工作。

再就是大数据安全与隐私保护意识不断加强,除了向卷技术需要不断发展以应对各种新型攻击挑战外,因为技术发展,各种不断的黑客技术为我们发展带来挑战。但是单靠技术本身是不可能解决安全问题,我们还需要企业、组织机构的安全保障的制度完善以及行业治理的监管也成为关注的重点,所以我们很多企业没有将这个作为重点,国家层面在弄,但是国家层面立法出来相对是比较慢的,所以从这一程度上来讲,我斗胆地提出大数据管理体系应该是这样的。

大数据治理体系的内容涉及到数据资产地位的确定,相应的管理体制和机制,共享和开放的原则和机制,安全与隐私保护的政策和相关的东西。那么它的层次呢?涉及到每一个法人组织,也涉及到相应的行业。比如说我们的同盟,我们协会召集了这么多的企业。还有是国家层面,三项层次四项内容,同时做好这个事情是四管齐下,涉及到制度法规、法律法规是国家层面的,制度是企业行业的,涉及到标准规范,我们一定要有共识,涉及到应用实践,在实践当中来回磨合,还有一个我们必须要有技术支撑,没有技术支撑这些东西做不到,所以我认为这个体系是这样的状况。

治理体系我们简单说一下国家层面,资产地位确立,需要国家法律法规层面明确数据资产地位。管理体制机制,需要建设良好的管控协调机制,促进数据产业的健康发展。去年制订数据开放共享的政策,建设政府主导的数据共享平台,还有需要出台数据安全与隐私保护的法律法规,保障国家、组织和每个个人的数据安全。

实际上这在现在已经有很多的工作可以做,数据资产的确定,什么叫资产?上面有一个定义,能够产生价值的东西就叫资产,明确将数据作为资产,就可以将数据的归属、估值、交易、管理等纳入到人类社会的一般资产管理体系,这样对确权、流通、交易、保护就具有支持性的东西。

本文:CEITC 2018丨梅宏:大数据治理体系建设的若干思考(深度长文)的详细内容,希望对您有所帮助,信息来源于网络。
上一篇:延安生态文明建设:发挥革命精神 引领绿色经济下一篇:

14 人围观 / 0 条评论 ↓快速评论↓

(必须)

(必须,保密)

阿狸1 阿狸2 阿狸3 阿狸4 阿狸5 阿狸6 阿狸7 阿狸8 阿狸9 阿狸10 阿狸11 阿狸12 阿狸13 阿狸14 阿狸15 阿狸16 阿狸17 阿狸18