现在的位置:主页 > 期刊导读 >

我国政府数据开放度及开放质量研究(3)

来源:大数据 【在线投稿】 栏目:期刊导读 时间:2020-10-05

【作者】:网站采编
【关键词】:
【摘要】:(三)数据意识欠缺,数据融合较少 可以看出中国地方政府对于数据缺乏直观的认识,对于数据的开放制度,很大一部分原因可能是国家顶层设计方面的

(三)数据意识欠缺,数据融合较少

可以看出中国地方政府对于数据缺乏直观的认识,对于数据的开放制度,很大一部分原因可能是国家顶层设计方面的要求。政府部门对于数据的运用处于表层,既然数据开放会产生一些问题,就少开放或者不开放减少工作的失误。工信部作为电子政府以及信息化推动的最重要部门。应该综合协调各个部门之间的关系,加快政府数据信息平台的整合。

[1]吴旻.开放数据在英、美政府中的应用及启示[J].图书与情报,2012(1):127-130.

[2]陈涛,李明阳.数据开放平台建设策略研究——以武汉市政府数据开放平台建设为例[J].电子政务,2015(7):46-52.

[3]LEHD:工作单位和家庭住址的纵向动态系统,是通过整合美国人口普查局、社会保障局和州政府劳工部门三方的数据形成的查询系统.

[4]涂子沛:《数据之巅 大数据革命,历史、现实与未来》,中信出版社2014年5月第一版.

一、引言西方国家如美国一直非常重视数据分析及应用。20 世纪90年代以后,美国联邦政府积极推动各部门数据开放,以利于公众使用数据,奥巴马曾形容政府数据开放工作是“前所未有”的事业。近年来伴随着大数据技术的发展,数据开放在世界范围内盛行,2011年开放政府联盟(OGP)成立,致力于推动各国政府的信息公开和数据开放工作。截止2013年底,会员国从8 个扩大到50 多个,其中还有不少发展中国家,例如肯尼亚、爱沙尼亚、东帝汶等。在我国,2015年国务院印发《促进大数据发展行动纲要》指出,“大力推动政府信息系统和公开数据互联、开放共享,加快政府信息平台整合”。各省市政府加快建设政府数据开放平台,上海市、北京市等一线城市不断完善原有的数据平台,推进各政府部门向社会开放政府数据资源。其他省、市在学习借鉴的基础上,也纷纷建设特色政府数据开放平台。如贵州省在多方企业的支持下,建立的“云上贵州”服务平台。本文定量测度我国政府的数据开放度及开放质量。以政府开放数据中的“人口数据”作为切入点,以美国LEHD 项目和中国政府数据开放平台在数据开放量与开放质量进行比较研究。二、研究设计及方法当今世界,美国政府开放数据建设处于全球领先地位。本文参考选用涂子沛《数据之巅 大数据革命,历史、现实与未来》一书中部分内容。把匹兹堡市数据开放情况作为标杆,与国内上海市、武汉市和贵阳市三个数据开放平台比较,得出在政府数据开放层面的差距。在研究方法上,使用比较研究法(Comparative Research)为主要的研究方法。林聚任、刘玉安认为:比较研究方法,是指对两个或两个以上的事物或对象加以对比,以找出它们之间的相似性与差异性的一种分析方法。在数据收集方面主要是通过搜索相关政府文件,检索统计年鉴以及查阅相关书籍的方式收集有关人口数据开放的情况。在研究对象上,国外研究对象选择美国匹兹堡,根据《数据之巅 大数据革命,历史、现实与未来》,在美国,公民可以通过LEHD 系统查询政府开放的各个方面数据。而考虑到地方政府数据开放的成熟度,国内的研究对象选择了武汉市、上海市、贵阳市三个地区。上海代表着一线城市,是中国政府数据开放最早、最好的一部分城市;武汉代表着中部大城市的政府数据开放,数据开放时间晚于上海等一线城市;贵阳市的选择,主要考虑到“云上贵州”是时下热点,是在联通、阿里巴巴、中软、浪潮等企业的支持下,全国第一个实现省级政府、企业和事业单位数据整合管理和互通共享的云服务平台,社会关注度较高。本文选择人口数据作为研究的切入点。对于任何一个地方政府来说,掌握人口数据可以为在制定政策中发挥重要的作用,做出合理的预期,调整政策的变化,并且最终会使每个参与普查的人受益。企业通过政府开放的人口数据,可以准确了解地区的经济发展前景以及投资潜力,做出合理的发展决策。三、定量分析(一)开放量分析以人口数据为切入点,在各个数据开放平台上收集就业人口的年龄、性别、收入高低、行业分布(部分)的信息,统计数据量的开放情况,其中1 表示有该方面数据开放,0表示无此方面数据开放。在性别、平均工资、从事职业分类上,四个政府都开放这方面的数据。但在工资范围上,国内的三个政府没有公开这方面数据。相比较国内的三个政府,上海在年龄、种族的分类数据开放上比武汉和贵州做得要好得多。各个分类数据的开放只有两种结果,发布与不发布。假设每次试验中,事件1 发生的概率为p。根据二项分布,在n重伯努利实验,用X 表示7 重伯努利试验中事件1 发生的次数,则X 的取值为0,1,…,n,且对每一个k(0≤k≤n),事件{X=k}即为“n 次试验中事件A 发生k 次”,根据伯努利模型,有根据上述公式,可以得出每一个政府在七种分类中,事件0 发生(数据不开放)的概率。由此可以得出政府数据开放的情况。概率越大,说明政府数据开放越差。武汉市和贵州省的政府数据开放性差,在选择的七个分类中,有三项没有开放,概率为27.34%,远远大于匹兹堡市和上海市的5.47%。(二)开放质量分析数据开放粒度是标示数据开放质量的指标。上面所列举的数据,是以城市为单位进行的数据量分析,但对于数据使用者来说,最重要的是数据开放的粒度。在LEHD 中,可以按照地区、邮编、选区、学区、人口普查的片区等各层级单位对人口数据进行层层下钻,甚至连一个居民街道的人口情况都能分析出来。比如帕罗奥多市的一个苹果店,市民在OntheMap 上定位之后,可以轻松的查询到店面所在街区的工作人口、人口流动、工作人口的来源及其距离分布、居住地到工作地的距离分布等信息。在此基础上,LEHD 系统还可以时间为跨度做纵向分析,显示城市某个地区在近几年的人口变化以及就业形势趋势的状况。这些人口数据的开放质量是国内政府难以达到的。而国内的三个政府数据开放平台在数据开放质量上的划分都是在行政区的基础上,比如上海市只是将各个区的人口数量以及农村和城市人口做简单划分。但是在区以下,比如说街道的人口数据就查询不到。在三个政府数据平台上,也没有行政区之间的人口流动信息,无法比较出各个地区的发展状况。对于民众来说,从这方面的信息可得出就业趋势的变化,寻找到工作的几率上升。在行政区的人口变动上,四个数据开放平台都发布了年度人口数据,可以得出这部分的数据,但相比较国外完整的分析系统,还存在很大的差距。(三)综合分析由万维网基金会所组织开展的“开放数据晴雨表”(Open Data Barometer)和英国开放知识基金会(Open Knowledge)组织开展的“开放数据指数”(Open Data Index)]是得到各国政府、国际组织及国际开放数据社群广泛认可的两项开放政府数据评估项目。国际研究组织基于这两个评估项目总结提炼出了开放数据的通用评估框架(Common Assessment Framework)。包括环境(数据开放背景环境)、数据(开放数据集的本质和质量)、使用(数据被谁使用,如何让使用以及产生的后果)、影响(开放特定数据带来的收益)四个方面。结合此评估框架,并考虑到我国的政府数据开放处于起步阶段,本文选择在数据开放层面、粒度分析、数据来源等方面建立评价模型。(参见表1)表1 政府开放数据的分析根据表1,可以发现:在开放量上,国内的三个政府在人口数据的开放上与外国没有多少差距,所选取的七项数据量上,上海市和匹兹堡都开放了六项,作为起步晚的城市,武汉市和贵州也开放了四项。甚至在一些方面做得还要更好。比如在受教育程度上,国内的三个政府都有这方面的数据开放,而匹兹堡政府数据方面并没有。但是在开放质量上和国外存在很大的差距,匹兹堡方面数据可以层层下钻,得到详细的地区人口发展信息。在国内的政府数据开放平台上,只有城市下行政区的人口数据,并没有更详细的数据。数据开放层次上,国内的政府都是以城市为单位,基本上没有再层层划分下去而这也是中国政府开放问题最突出的地方。政府享有数据却不充分利用,数据开放只是简单的数据公示,更深层次方面的数据不愿意去研究。没有粒度与纵向分析,使得数据被闲置在一边,造成资源的浪费。匹兹堡的数据开放在城市的基础上,层层下分地区、选区、片区、街道。在数据使用方面,国内政府的数据多数在政府机构之中,普通民众可以直接获取的数据量较少。国内的一些数据咨询公司出于自身需要,会直接向政府协商购买部分数据库,接触民众所收集不到的政府数据。在国外,政府的数据开放主要是针对民众开放,社会可以容易的获取。在数据更新上,国内的三个政府,上海市做得最好,可以做到按月更新。武汉和贵州的数据多为年度数据,数据更新缓慢。这一点和外国的实时更新相比,存在不少的差距。四、研究结论通过对上面的各个政府数据平台的数据开放度和数据开放量的分析,本文得到以下几点结论:(一)数据开放多为宏观层面,缺少微观粒度分析就社会公众来说,最关心的是与自身利益息息相关的数据信息。从上面的数据分析可以看出,政府数据平台的开放,数据过于宏大与简单,往往是对统计年鉴中部分信息的初步处理与完善。如武汉的市政府公开数据服务网所提供的统计年鉴。总体而言,在数据量层面中国与外国并没有多少的差距,除了一些敏感的数据,都可以查询到。对于公众,最需要的是在政府开放数据中那些更加微观的数据。政府开放数据,不应该就仅仅是数据的公开,更加重要的是这些数据可以带来价值增值,能创造更多的财富。数据就如原材料,把它交给社会,是建造成什么,用于何种用途,取决于社会的需要。所研究的这些国内数据平台,以城市为基础发布整个年度的数据,这并没有太大的价值,不应该只是让人了解到城市的整体运行,更需要公众对自身所处城市地区、街道、乃至于社区都能有一个直观的认知,这就要求微观粒度上的数据开放,让数据来自社会,反馈给社会,去进行更大的数据价值增值。(二)数据开放的价值量较小总体上,目前各地政府所开放的数据集数量和价值离社会需求仍有很大差距,无法满足经济发展与社会创新领域的需求,大量高价值且不涉及到国家安全、商业机密和个人隐私的数据未能开放。其主要服务目标是让公众知情而非增值利用,其实质并不符合开放政府数据的原则和要求。信息公开是保障知情权,公开的大多是一些文件、政策,也公开了一些数据,主要是为了保障知情权,而数据开放则是强调利用权,可以自由的下载和研究这些开放的数据,不仅仅是政府让我们知道的,还要有我们应当知道的。(三)数据意识欠缺,数据融合较少可以看出中国地方政府对于数据缺乏直观的认识,对于数据的开放制度,很大一部分原因可能是国家顶层设计方面的要求。政府部门对于数据的运用处于表层,既然数据开放会产生一些问题,就少开放或者不开放减少工作的失误。工信部作为电子政府以及信息化推动的最重要部门。应该综合协调各个部门之间的关系,加快政府数据信息平台的整合。参考文献:[1]吴旻.开放数据在英、美政府中的应用及启示[J].图书与情报,2012(1):127-130.[2]陈涛,李明阳.数据开放平台建设策略研究——以武汉市政府数据开放平台建设为例[J].电子政务,2015(7):46-52.[3]LEHD:工作单位和家庭住址的纵向动态系统,是通过整合美国人口普查局、社会保障局和州政府劳工部门三方的数据形成的查询系统.[4]涂子沛:《数据之巅 大数据革命,历史、现实与未来》,中信出版社2014年5月第一版.

文章来源:《大数据》 网址: http://www.dsjzz.cn/qikandaodu/2020/1005/1068.html

上一篇:无所依 组诗
下一篇:制药企业确保数据完整性的措施探讨

大数据投稿 | 大数据编辑部| 大数据版面费 | 大数据论文发表 | 大数据最新目录
Copyright © 2018 《大数据》杂志社 版权所有
投稿电话: 投稿邮箱: