
四川数据开放指数报告(2019)
发布日期:2020-12-28
四川数据开放指数报告(2019)
前言
当前,数据已经成为极具价值的资产,大数据产生价值的前提在于将数据开放,让更多的企业、机构和个人能够深度参与到数据的挖掘与分析,从而将数据资源转化为数据资产,为社会创造财富与价值。政府掌握全社会80%的数据资源,如何释放政府手中庞大的数据资产价值,已经成为全世界各国政府高度重视的问题。2009年起,全球发达国家掀起数据开放的浪潮,推动政府数据不断走向透明化、公开化,通过对开放数据的分析、挖掘、创新,所创造的巨大经济和社会价值也逐步显现。
党中央、国务院高度重视大数据战略发展及数据整合、开放、共享工作。国家、相关部委相继出台《促进大数据发展行动纲要》《关于推进公共信息资源开放的若干意见》《公共信息资源开放试点工作方案》。2020 年4 月9 日公布的《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》中,数据作为五大要素之一被写入文件,明确提出要“加快培育数据要素市场,推进政府数据开放共享”。
全国各省区市全面贯彻落实国家发展战略及相关政策精神,大力推动开放数据,释放数据红利。截至2019 年10 月,我国地级及以上的政府数据开放平台由2017 年的19 个增加至102 个,政府数据开放平台已逐渐成为一个地方数据政府建设的“标配”。
为全面了解我省各市(州)数据开放现状,我们参照《全球数据开放晴雨表》《全球数据开放指数》《中国开放数林指数》相关指标体系设置,结合我省总体情况,从平台建设和数据发布两个维度对我省21 个市(州)数据开放水平进行了分析评估,并在此基础上形成评估报告,旨在为我省各市(州)有效提升数据开放的能力与水平提供可行参考意见,推动我省数据开放工作,释放数据生产要素潜能。
一、全省数据开放总体情况
近年我省公共数据开放工作进展良好,截至2019 年底,21 个市(州)均已建成公共数据开放平台,并逐步面向社会公众提供数据服务。
(一)开放平台建设。
2017 年,国务院办公厅印发的《政务信息系统整合共享实施方案》指出要“推动开放,加快公共数据开放网站建设”“推动政府部门和公共企事业单位的原始性、可机器读取、可供社会化再利用的数据集向社会开放”。2018 年,四川省人民政府办公厅印发《2018年全省政务信息系统整合共享工作重点任务》明确提出,要“开通上线省级公共信息资源开放网站,面向社会公众提供数据服务”, 我省数据开放平台建设正式提上日程。
2018 年中旬,成都市率先开通上线“成都市公共数据开放平台”,2018 年底“四川公共数据开放网”基本建成上线试运行,2019 年底“四川公共数据开放网”正式上线运行,泸州、绵阳、广元、遂宁、内江、雅安等市级公共数据开放网站陆续开通上线,标志着我省公共数据开放工作迈出了重要的一步。
目前,“四川公共数据开放网”已发布45 个省级部门和2 个市(州)的开放数据集1160 个、开放接口89 个、开放应用23 个,开放数据总量达9285 万条,涵盖多个主题,涉及教育文化,医疗卫生、公共安全、城建住房、生活服务、社会救助、社保就业、信用服务、交通运输、生态环境、法律服务等方面多个主题。21 个市(州)开放数据集总量达3407 个,其中成都市发布开放数据集1692 个,居全省首位。
(二)数据开放现状。
目前,我省数据开放总体架构基本建成,依托公共数据开放网
面向社会公众提供数据开放服务的总体态势初步形成,但在开放平台服务能力、数据发布总量和数据质量方面尚有较大提升空间。2019 年底,刚刚上线的四川公共数据开放网首次列入“中国开放数林指数”排名1,位列全国省级平台的第11 名;同时参加排名的四川市(州)还有成都(地级第6 名)、内江(地级第69 名)、广元(地级第75 名)、绵阳(地级第76 名)、雅安(地级第77 名)、泸州(地级第81 名)、遂宁(地级第83 名)。这一排名肯定了四川在数据开放中取得的成效,同时也让我们更清醒地认识到当前数据开放的总体水平,与四川作为人口大省和经济总量居全国第六的经济大省的位次不相匹配,我省数据开放水平尚处于起步阶段,数据开放与应用能力还有很大提升空间。
进入数字经济时代,生产要素和产业结构正发生深刻变化。数
据以其可复制、可共享、无限增长、无限供给和边际成本几乎为零的特点,成为联接创新、激活资金、培育人才、推动产业升级和经济增长的关键生产要素。新冠肺炎疫情给我省经济发展带来冲击和挑战,同时也为推动重构全球供应链和产业优化升级带来新的机遇。我省应顺势而为,加快推进数据开放。
二、各市(州)数据开放现状及评估
本报告对我省21 个市(州)建设完成的公共数据开放网站进行采样,从平台建设和数据发布两个维度,对省内各市(州)数据开放水平进行了系统分析和综合评估。
(一)总体情况。
考虑到各市(州)公共数据开放平台建设大多处于起步阶段,本次评估更侧重对平台建设及数据情况的评估(评估满分分值100分,平台层总分60 分,数据层总分40 分,详细指标权重见附件)。
总得分与排名情况如图1。
图1 四川省各市(州)数据开放总体情况
图1 所示,成都市开放指数最高,评估得分为83.48,位列第二
至第四名的依次为宜宾市、攀枝花市、达州市,得分分别为76.06、73.14、71.50。除上述四地外,其余17 个市(州)开放指数均低于60 分,得分最低的泸州只有17.03 分,与最高分相差66.45。数据显示,我省各市(州)数据总体开放水平不高,各市(州)差距明显,还有较大的提升空间。
(二)平台建设。
“公共数据开放网站”是政府数据提供方与需求方沟通互动的桥梁,平台的功能设置、用户体验将直接影响数据开放和利用的效果。通过考察账户体验、界面体验、数据发现、数据获取、工具提供、互动反馈6 个方面,对我省21 个市(州)公共数据开放平台建设情况作出总体评价,如图2。
图2 四川省各市(州)公共数据开放平台建设情况
总体而言,我省各市(州)开放数据平台基本满足用户注册、登录、查找数据、下载数据的基本需求。平台建设得分最高的是宜宾市,为50.98,21 个市(州)平均得分为34.76,低于全省平均水平的共有12 个市(州)。分析显示,我省各市(州)平台层建设整体水平有待提高。
1. 账户体验方面。
各市(州)平台账户体验指标总体表现较好,多数都有账户分类注册功能,注册相对简便且能够成功登录。但相比企业类应用的账户注册而言,开放数据平台的账户注册略显麻烦,信息必填项过多,存在无效必填项等。例如,个别平台账户注册时用户名、昵称、真实姓名均为必填项,最终登录后显示真实姓名,未使用昵称;个别平台必填项除手机号、邮箱号、用户名(昵称、真实姓名)、验证码,还需职业、性别、用途、地址、身份证号等诸多真实信息。此外,多个平台存在注册时要求阅读并同意《服务协议条款》,但实际并无条款内容或无法查阅条款内容。
2. 界面体验方面。
各市(州)平台整体表现较好,各平台版块分类清晰、响应速度快、提供图文式分类。
3. 数据发现方面。
我省各市(州)平台整体表现良好,基本都为用户提供了统计数据展示和数据导引功能,但仅有6 个市(州)提供了数据集预览功能,不利于用户了解数据集情况。
4.数据获取方面。
各市(州)平台均提供数据免费下载服务,但所有平台均需要在注册并成功登录后才有数据下载权限。
5.数据应用方面。
仅5 个市(州)为用户提供开发者中心,其余市(州)平台仍需完善服务。此外,多地虽在平台上发布数据应用,但数据应用的下载使用情况不理想。
6.工具提供方面。
各市(州)平台基本上都为用户提供了数据检索工具、图表分析工具、地理空间工具。但这些工具缺乏实用性与使用性,无法真正为用户提供帮助。检索工具只具备最初级检索工具,基本都不具备二级检索和高级检索功能。图表分析工具和地理空间工具多数处于不可用状态。
7.互动体验方面。
多数市(州)平台为用户提供了意见建议和需求提交功能,但仅有成都市、广元市在平台上公开回复意见建议。
(三)数据发布。
“数据”是开放数据的核心,是开放数据发挥价值的基础。通过考察各平台发布的数据量、数据质量、数据标准综合评价各市(州)数据发布情况。
图3 四川省各市(州)平台数据发布情况
各市(州)数据发布情况均有待提升。得分最高的成都市仅为
33.39,排在第二至第四位的是宜宾、达州、攀枝花三地,得分依次为25.08,25,23.48。其余市(州)得分均低于20 分,且泸州市因平台上未提供任何有效数据服务,得分为0。从得分区间看,得分位于[0,10]的共有11 个市(州),得分位于(10,20]的共6 个市(州),得分位于(20,30]的共3 个市(州),得分位于(30,40]的仅有1个市(州)。从得分情况可见,成都市在数据层开放指数上表现一枝独秀,其他各市(州)数据层开放指数主要集中于[0,20],数据开放力度、深度及广度都亟需提升。
1.数据量方面。
仅有成都市数量达到千个(截止2020 年1 月3日开放数据集总量为:1692),8 个市(州)数据集开放量达到百个。
数据总量方面,仅有成都市数据量过亿条,达州达千万条,攀枝花、宜宾、广元、绵阳四市开放数据量超万条,其余均低于千条,甚至为零。数据显示,我省各市(州)公共数据开放平台数据开放量过低,严重制约了公众和社会对数据价值的应用开发。
2.数据质量方面。
仅有成都、宜宾、达州三地为用户提供多样化的数据下载格式,且具有较强的可访问性,方便用户下载与使用。其余市(州)基本只提供一种下载格式,且多个市(州)提供机器不可读的doc、docx、pdf 等格式的文件。此外,从数据覆盖面指标上看,我省各市(州)部门参与程度较低,且常用的14 个主题2数据集开放总量偏低。
2 14 个基本主题为:财税金融、经贸物流、交通出行、机构团体、生活服务、医疗卫生、教育科技、文化体育、资源环境、城建住房、公共安全、社保就业、农业农村、信用服务。
图4 四川省整体部门数据开放参与情况统计图
通过对我省21 个市(州)公布的各部门开放的数据集统计,排名前21 的部门数据集开放总量如上图所示3。数据显示,总体上我省各相关部门参与程度最高的为统计局,开放数据集总量为497 个。开放数据集总量超过100 个的部门共8 个,整体而言,我省各部门数据开放参与度与积极性仍有待提高。
3 注:市(州)间部分职能部门的名称存在差异,本报告为方便数据统计对相关职能部门的名称进了统一或简化,仅供本报告参考使用
图5 四川省各市(州)数据开放主题分布图
当前我省市(州)开放数据涉及最多的主题为财税金融和教育科技,相关数据集总数分别为465 个和424 个。涉及资源环境的数据集共358 个,其余11 个主题相关的数据集均少于300 个。
3.数据标准方面。
在开放许可或授权上,成都、攀枝花、南充、
宜宾四地为用户提供了明确的开放授权说明,但也存在授权说明不规范之处,例如,有授权协议中写明该协议条款最终解释权归XX 公司所有。在技术开放性上,提供API 服务的市(州)API 开放性表现普遍较差,普通用户不能调用或不能成功调用。描述说明方面,我省各市(州)在API 和元数据的说明方面表现均有待提升,尤其是普遍存在核心元数据的缺失。
三、我省数据开放存在的问题与建议
分析显示,我省数据开放总体架构已基本建成,数据开放水平处于起步阶段,数据开放能力亟待提升。
(一)存在问题。
我省数据开放主要存在以下问题。
一是数据开放平台功能与性能不足。
我省各市(州)开放数据平台建设上水平差距较大,网站功能与性能存在诸多问题。例如,泸州市开放数据网站存在响应时间过长(网页跳转时间至少需1 分钟);乐山市开放数据网站无用户注册入口;多个网站存在无法找回密码、无法收到验证码,从而导致注册失败和注册成功后无法正常登录等问题。
二是开放数据资源目录编制不规范。
多个市(州)信息资源目录名称不规范,资源类别不清晰,用户不能通过查看目录直观理解资源内容。多市(州)可能对数据开放与数据共享的理解存在偏差,直接复用政务信息资源共享交换目录体系,核心元数据的共享方式和共享类型未发生改变,未按照对公众开放的角度重新梳理目录资源,部分数据资源获取仍需走线下流程,不利于公众使用。
三是开放数据数量和质量需提升。
在开放数据总量上,我省虽在短短两年间发布开放数据集3407 个,但部门覆盖面相对较少,还有大量政府数据处于未开放状态。在开放数据质量上,目前仅成都平台提供了一定比例的优质数据,多个市(州)存在开放数据资源名目下实际无数据或下载数据为空表的情况,数据质量欠佳严重影响公众对平台信心。
四是数据创新应用水平不高。
在促进数据利用上,仅成都市举办过类似开放数据创新应用比赛,且几乎未实现赛事成果转化。在利用成果产出上,各市(州)共发布数据应用57 个,下载使用情况不理想,切实有效服务社会、服务民生的应用很少。
(二)对策建议。
为进一步提升我省开放数据整体水平,针对本次评估结果所反
映的问题,提出以下四点建议。
一是政策引导,建立全省数据开放应用新格局。
尽快研究出台针对数据开放的地方性法规、政府规章或规范性文件,推动数据开放工作标准化和规范化,建立完善切实有效的数据开放目录标准、数据资源分类标准,形成数据脱敏指南和数据开放技术规范。引导政府部门有序开放数据资源,为参与数据开放的部门建立切实可行的数据开放路径,提升政府工作人员开放数据的决心,减少不必要的数据安全责任负担;保障公民数据使用权利与义务,规范数据使用范围,确保数据不被非法传播。
二是渠道保障,完善全省公共数据开放平台建设。
以用户体验为出发点,完善现有公共数据开放平台功能、提升运行性能、丰富网站工具,建立省级平台与市(州)平台联动机制。注重改善影响用户体验的细节性网站问题,加快解决无注册入口、无法找回密码、无法成功注册、无法成功登录、页面布局不合理、网站响应过慢等问题。
三是机制建立,定期进行数据开放能力评估分析。
不断完善数据开放评估方案,加强对全省各部门、各市(州)数据开放能力与水平的评估分析,帮助发现数据开放存在的问题、数据应用存在的难点并提出改进措施。合理区分信息公开与数据开放,将政府数据开放与应用纳入政府绩效考核范畴,鼓励各部门有序开放数据。
四是推广应用,充分挖掘政府数据开放资源价值。
加强数据开放宣传,引导公众、企业、高等院校、科研院所合理使用和传播公共数据开放网站数据;通过举办数据创新应用比赛,挖掘政府数据价值,为数据产品创新应用提供公开竞技场所,加快培育四川本土数据创新应用人才,推动大数据在经济社会发展中全方位的应用创新,提升我省综合竞争力。
附件:
指标体系说明
一、指标设置说明
本报告鉴于我省各市(州)开放数据平台建设整体处于起步阶段,在吸收借鉴《开放数据晴雨表》与《全球开放数据指数》全球权威评估体系的基础上,重点参考当前国内较为权威的数据开放评估体系《开放数林指数》中的核心指标,最终构建了“平台”“数据”2 个一级指标、10 个二级指标、30 个三级指标的评估框架,并采用专家打分和层次分析法最终确定各级指标权重。
具体打分方法如下:
(1)有无判定法:指标判定为“有”时,该指标得满分;指标判定为“无”时,该指标不得分。
(2)标杆法:将指标中数量最多得最优值设为标杆,得分计算公式如下:
该指标得分=(指标值/标杆值)*满分(保留小数点后两位)。
(3)功效系数法:
①设置五档标准值。各项指标的评价档次分别为优、良、中、低、差五档。
②对五档标准值分别给定五个标准系数:1、0.8、0.6、0.4、0.2。
③按以下方法对每个指标打分:
上档基础分=总分*上档标准系数;
本档基础分=总分*本档标准系数。
尚普华泰咨询 北京总部:北京市海淀区苏州街3号大恒科技大厦南座6层
联系电话:010-82885729 82885739 联系邮箱:service@sunpul.cn
Copyright © 2020 S&P Consulting, All Right Reserved.
京ICP备19054263号-1 涉外调查许可证:2104号