网站地图 加入收藏 设为首页 原创论文网,覆盖经济,法律,医学,建筑,艺术等800余专业,提供60万篇论文资料免费参考

大数据技术应用于立法后评估的必要性与可行性

作者:原创论文网 时间:2018-11-03 16:23 加入收藏

摘要

  Abstract:In the era of big data, there are many problems existing in the traditional post-legislative evaluation system, such as the single assessment subject, data omission, data distortion and the obsolete form of assessment report, which need to be solved urgently. It is feasible to evaluate the change of data types and the development concept and effect of big data for the application of big data technology to traditional post-legislative evaluation system. Data mining technology, prediction technology, visualization technology and sharing technology of big data have great advantages in evaluation activities, which can help solve the difficulties of traditional evaluation activities. The big data technology as the legislative technical front of evaluation system requires the construction of three information data processing platforms of "assessment information mining and analysis", "information sharing with the public" and "assessment information cleaning and application".

  Keyword:Big data; Post legislative evaluation; Legislative big data sharing platform; Legalization; Data sharing;

  当前社会正处于以数据为驱动的时代, 大数据技术的发展速度超乎想象, 涉及的行业极为广泛, 从金融、医疗、教育等传统行业到电子商务、智能设备等新兴产业, 背后都有着大数据技术的影子。一方面大数据改变了各学科的认识论和研究范式, [1]另一方面大数据使得数据的获取、分析、存储不再是限制传统学科的难题, 各学科之间传统知识与新型数据之间的矛盾日益突出, 传统领域必须对传统理论和方法进行革新, 有效利用新兴的大数据技术, 以及时适应新时代的发展。随着“立法后”时代的来临与立法工作重心的转移, [2]尤其是2015年《立法法》的修改, 设区的市有了立法权, 地方立法的数量急剧增加, “法律冲突”、“照搬上位法”、“无用立法”的现象频繁出现, 对现有立法进行评估更受到立法部门的重视。新一轮信息革命与人类活动的融合, 不仅引发数据总量的爆发式增长, 数据形式也由传统的文字类结构化数据向图片、视频、音频等半结构化、非结构化数据转变。[3]再加上立法实践的增多、涉及事务日渐复杂等诸多因素, 仅仅依靠传统人力已经很难及时准确地完成立法后评估任务。如何在互联网时代将新兴的大数据技术应用到传统的立法后评估中, 帮助解决人力时代尚未或无法解决的瓶颈, 具有及其重要而紧迫的理论和现实意义。

大数据技术应用于立法后评估的必要性与可行性

  一、大数据背景下立法后评估存在的问题

  立法后评估又称“立法回头看”, 一般是指在法律法规制定出来后, 由立法部门、执法部门及社会公众、专家学者等, 采用社会调查、定量分析、成本与效益计算等多种方式, 对法律法规在实施中的效果进行分析评价, 针对法律法规自身的缺陷及时加以矫正及修缮。[4]立法后评估在我国已经有十几年历史, 经过十几年的理论研究和实践操作, 我国的立法后评估机制已有了比较成熟的评估流程和配套措施, 取得了令人欣喜的成效。[5]但从全国的总体水平看, 立法后评估仍处于试点、探索和创新的初级阶段, 在当前大数据时代背景下, 评估主体、数据收集、评估程序以及评估回应等方面更是存在亟待解决或可以进一步优化的问题。

  1. 评估主体单一

  我国现行的立法评估主体一个重要特征就是评估主体的单一性, 单纯由国家机关或内部机构评估, 是典型的“内部评估”。这种评估类型固然在数据获取、经费保障、结论采纳等方面有着得天独厚的优势, [6]但同时也存在不可避免的缺陷。首先, 作为评估主体的国家机关有时会将立法后评估与“政绩”挂钩, 评估结果受到个人利益或部门利益的影响, 难以保证立法后评估的客观公正。其次, 内部评估缺乏监督, 评估活动容易流于形式。第三, 作为评估主体的国家机关人员来说, 往往缺乏专门的技术理论, 容易让人们对评估结论产生怀疑。针对内部评估主体的缺陷, 有学者提出了构建多元化的立法后评估主体, 包括完善内部评估主体、拓展“利益相关者模式”、培植第三方评估主体以及扩大公众参与评估。[7]在地方立法实践中的确经常会采用实地调查、专家打分、第三方评估以及利益相关者协商等方式, 但这些方法尚需继续完善。第三方评估机制一是在我国引入时间尚短, 仍处于初始探索阶段, 并未被广泛化、常态化运用到立法后评估中;二是缺乏具有强制力的、具体的、可操作的规范;[8]三是在评估过程中, 评估数据获得困难与评估结果的应用困难。至于利益相关者模式尤其是公众参与的有效实现要依赖于参与技术水平和行政管理过程 ([3], pp.9-10) 这使得公众参与可能陷入参与形式上“作秀”[9]或是参与主体单一[10]的困境, 制约着公众参与的效果。另外, 利益相关者协商模式下难以解决各个利益主体的价值计量性。在大数据背景下, 面对激增的评估数据和日益复杂的各类事务, 无论是传统的国家机关主导的内部评估模式, 还是第三方评估模式, 或者是利益相关者模式都无法真正做到真实高效的独立评估, 因此如何构建一个多元化的、不受“人为操纵”干扰的、可以获取大量真实完整信息数据的第三方评估制度, 通过互联网手段扩大立法后评估中的公众参与, 真正表达弱势群体利益的评估主体成为大数据时代立法后评估活动的关键所在。

  2. 评估数据收集失真和遗漏

  立法后评估活动作为一项实践性极强的系统工程, 拥有一套较为成熟的完整规范体系, 一直以来, 既有的理论引导和地方实践, 多提倡通过问卷调查、基层走访、召开听证会、论证会等方式, 利用纸质、语言来收集意见和资料, 以此来权衡并确认评估结果。这些方法各有特点和应用范围, 在实践中已被立法评估工作者熟练应用, 在纸质时代可以互相配合, 充分保障获取数据的准确性、广泛性和系统性。[11]但是在进入大数据时代后, 短时间内会形成数量巨大、形式多样的舆情数据, 传统的调查方法获取的数据存在的问题开始逐渐显现。首先, 限于评估工作者的工作素养与现实基础, 很大部分数据的来源真实性无法得到确保。其次, 收集的样本量有限, 以立法后评估活动走在前列的上海市为例, 《上海市历史文化风貌区和优秀建筑保护条例》这一部条例的评估活动就长达八个多月, 除开实证调研活动外, 期间评估小组召开了20多场座谈会, 收集了883份调查问卷, [12]即使花费大量人力物力, 也无法统计到全部样本数据。样本抽样方式收集到的数据往往难以突破自身单一化和片面化的弊端, 其固有局限会“稀释”存在的问题, 出现“数据失真”的情况。再次, 随着我国数据结构性改革工作的推进, 社交手段不断发展, 公众参与评估法规范性文件的方式途径变化多样, 这就决定了数据形式的多样性。传统的评估方式工具更集中在结构化的文本语言资料上, 较少关注半结构化、非结构化数据, 这种无意的“数据遗漏”以及传统数据管理对数据质量问题的关注主要从数据内容视角出发, 强调的是数据是否为干净数据 (clean data) /脏数据, [13]这会导致评估结论因缺乏完整的“数据证据”支撑或因“失真数据”诱导与现实情况出现偏差。立法后评估制度作为立法完善和资源配置的重要手段, 在面对大数据时代海量的数据信息和多种数据类型时, 驱动评估活动运行的力度明显不足, 整体制度的预期功能往往达不到良好的发挥。众多经过立法后评估却仍出现问题的法规范文件表明, 传统经验式的信息收集方式已经逐渐难以处理数量激增的半结构化、非结构化数据。最后, 传统人力收集调查方式持续时间长, 数据缺乏时效性, 出现错误时纠错成本大。[14]即使是比较先进的CATI调查方式, (1) 也要花费大量时间, 通话时间要持续一个小时以上, 出现错误时需要花费大量精力纠错, 而且由于整个立法后评估过程会持续很长时间, 收集来的数据无法得到及时更新, 在一定程度上会对评估结果有所影响。

  3. 评估报告形式和公布方式窠臼

  评估主体在对收集的评估数据分析、对照和比较之后形成评估结论, 但这并不意味评估工作结束, 还要将评估结论以书面报告的形式反映出来, 实现立法后评估的回应, 以此终结整个立法后评估程序。评估报告是整个评估活动的结晶, 也是评估结果的展现, 更是回应主体对评估活动评判的重要参考标准。当立法后评估的回应受到阻碍, 就可能丧失了评估行为的初衷和目标, 使其成为一种浪费资源的行为。[15]美国学者邓恩总结了评估结果被决策机关采纳与否的五个因素[16]:信息特色、评估报告、问题结构、政治和官僚结构、利害关系人的互动。立法评估报告的内容和表现形式对决策者做出的回应有着最直接的影响。立法后评估报告的表现形式有很多种, 基本形式有文本形式、图表形式、混合形式。随着法规范文件数量和收集到的评估数据量不断增长、评估技术的不断完善以及决策者对评估活动重视程度加深, 评估报告所需展现的内容必然会越来越多, 会直接影响决策机关的判断, 如2016年公布的《杭州市港口管理办法》立法后评估报告字数已多达65000余字, [17]并单纯的以传统文字形式予以展现。再如《上海市住宅物业管理规定》立法后评估研究报告长达40页, 并夹杂大量图表、数据, [18]评估数据的展现不仅要求评估小组的成员有较强的文字水平, 还对阅读者的综合能力与法律理论知识提出了更高的要求。除了评估报告本身的撰写, 评估报告的公布也是影响评估活动的重要一环, 评估委员会应当尽最大的努力, 使评估报告的内容为人们所知晓。立法后评估报告的公布完全不限于法律公布方式的正式性, 在互联网社交技术迅猛发展之下可以有所创新。

  除了评估主体单一、数据失真遗漏、评估报告形式和公布的创新问题外, 立法后评估还存在一些其他问题。如立法合宪性评估或审查的范围不全面, 需要将其他属于法的规范性文件纳入审查范围;利益表达机制不健全;[19]评估数据共享问题, 评估活动受立法评估技术的影响, 促进先进的评估经验共享也是促进立法后评估制度发展的重要途径等诸多问题。

  二、大数据技术应用于立法后评估的必要性分析

  大数据应用于立法后评估制度的必要性有两点, 一是评估对象对大数据技术的应用使评估活动应用大数据技术变得必要, 随着大数据技术逐渐渗透现代社会的各个领域, 各行各业开始运用大数据发展自身, 在立法活动中运用大数据技术也已经为未来地方立法的趋势。[20]立法活动运用大数据技术, 立法会后评估活动也必须随之应用大数据技术才能更好的完成评估任务。二是传统立法后评估制度存在的困境已经限制了其良好运行和发展, 需要引入大数据技术予以克服。对于立法后评估制度的发展, 大数据带来的不仅是技术上的革新, 更多的是将这一制度常规化、规范化的机会, 大数据将改变传统的立法后评估制度的信息收集方式、拓宽评估主体模式、优化评估结果展现形式、增强评估活动价值。大数据从量的方面建立起具体个别性的整体, 通过抽象进而达到普遍整体性, 大数据特征给与我们的是以量化的方法描绘师姐图景的方法。[21]大数据技术是一系列收集、存储、管理、处理、分析、共享和可视化技术的集合。根据麦肯锡的研究, 大数据的关键技术有三四十种, 不同的技术在不同的领域中起着不同的作用, 选择适合的大数据技术可以专业、深入地对立法后评估起到积极作用。在立法后评估活动中, 大数据信息挖据技术、整合分析技术、可视化技术、预测技术可以帮助完善立法后评估制度。

  1. 大数据高新技术助力构建多元化评估主体

  相比于传统的由国家机关内部主导的立法后评估模式, 让利益相关主体特别是公众参与或者委托第三方机构参与立法后评估活动, 构建多元化评估主体模式具有其自身合理性并已成为当下理论界和实务界的共识。然而, 利益相关者和公众在实际操作中并不能真正作为主导力量独立进行立法后评估活动, 除了分散性、不确定性、利益衡量以及认知水平以外, 参与技术也是制约因素之一。互联网的发展为利益相关者尤其是公众参与立法后评估提供了手段, 大数据技术为全样本处理提供了可行性。公众在网络平台一般都不会使用真实姓名, 通过线上匿名表达自己的意见, 可以避免一些特殊行业、地位的群体和个人因自己的身份不愿表达意见的问题。将大数据处理技术引入立法后评估后, 在一部法律要进行评估时, 参与的公众主体可以是全国各地对此感兴趣的任意群体和个人, 参与方式也可以是灵活多样的, 只需在公开场合或软件中发表过相关意见即可被大数据企业收集分析, 这就可以打破传统利益参与者模式存在的主体和参与方式的限制, 更好的达到把握民意、汲取民智的本意。

  对于构建独立的第三方评估模式来说, 评估数据获得性困难是独立第三方立法后评估制度首要面临的问题。因为独立第三方评估主体独立与国家机关, 它的信息相当多的来源于国家机关, 可能存在法律法规制定者与执行者不愿公开一些信息, 这势必会影响评估结果的有效性与客观性。2015年9月国务院印发的《促进大数据发展行动纲要》提到, 到2018年底前要建成国家政府数据统一开放平台;2020年底前, 逐步实现信用、交通、医疗、卫生等民生保障服务相关领域的政府数据集向社会开放。[22]政府大数据的全面开放, 对立法后评估的第三方评估模式来说有者质的帮助。

  2. 大数据挖掘技术革新评估数据收集处理方法

  数据收集是评估的前提和基础, 真实有效的数据既可以说是评估的最初判断标准, 也可以作为最后的评估尺度, 甚至可以说立法后评估的整个过程就是收集数据、处理数据的过程。将大数据应用于立法后评估制度中, 体现出数据资源的优势, 关键在于有效的挖掘和分析数据, 从各种类型的数据中发现有价值的与立法相关的数据。基于大数据的立法后评估机制的运行必须要以这些海量数据为前提, 信息数据挖掘要同时结合线上和线下的数据资源, 整合不同部门、人群、利益群体之间的半结构化、非结构化数据, 其收集到的评估数据会具有“全样本化”的特点。大数据信息挖掘技术可以拓宽立法后评估的信息收集渠道, 提升处理评估数据的速度, 建立起覆盖全社会的信息网络系统, 最大限度的避免数据的遗漏、失真, 以确保评估结果的真实性和全面性。随着数据的爆炸式增长和计算机数据处理技术的发展, 数据挖掘 (data mining) 出现了, 简单地说, 它就是从大量的数据中“挖掘”出想利用的数据。[23]评估数据挖掘可以通过成熟的Hadoop平台、SQL Server等数据挖掘工具对基于LBSN (1) 的评估平台、基于公众评价数据等领域重点挖掘来取得更精准的数据。立法后评估数据挖掘的越充分, 就越能获得完整、通常的信息流, 其下一步的数据分析也就越科学。在评估数据准备充分的基础下, 要实现评估数据的效用, 关键在于通过大数据分析方法和数据建模对评估数据进行科学分析解读。数据分析方法可以选择神经网络分析、相关分析、回归分析、时间序列分析和聚类分析等事前预测法。

  将大数据信息挖掘技术应用到立法后评估中至少在4个方面完全超越传统的信息收集。一是大数据挖掘是用数据的整体代替传统评估主体的抽样数据样本, 具有更高的客观性:数据量越多越大, 其得出的结果就越有价值。这是传统人力时代以调查问卷、实地调研主要手段的评估数据收集难以跨越的鸿沟——即使花费再多的人力和精力也无法做到全样本采集。大数据挖掘技术的全样本采集能力可以有效帮助解决“数据遗漏”问题。二是大数据处理技术具有处理海量信息、数据的能力:大数据挖掘能够处理复杂的非结构化数据, 以确保整合出更具有价值的信息。如今微信、微博等具有LBSN的公众参与平台逐渐兴起, 与传统表达意见的方式相比, 公众更喜欢通过这些社交软件表达自己对某个法律草案、立法活动或法律事件的意见, 这些数据的类型不仅仅局限于文字, 还有大量的音频、视频、超链接以及图片等传统人力评估难以统计分析的信息。而大数据的文本和多媒体挖掘、Web挖掘、语音挖掘、图像识别以及空间数据挖掘技术, 可以采集这些多类型数据并自动分类、自动排重、常识校对。三是大数据挖掘技术处理海量数据的速度远不是传统立法后评估所运用的数据分析所能匹及。四是由于立法后评估指标体系的静态性特征, 传统评估数据采集的抽样限制也使得评估数据存在难以避免的时效性局限, 这会降低对长期趋势和波动幅度的可预测性。[24]利用大数据挖掘技术可以获取持续的、周期性的评估数据, 以无限接近法规范文件实施后的社会真实状态。这4个方面的优势体现了大数据挖挖掘与人力或传统数据分析之间的本质区别。简而言之, 大数据的数据挖掘是智能的、海量的、高速的、动态的信息处理系统, 深入挖掘并揭示立法规律, 将其引入立法后评估制度是突破当前评估工具局限的可行路径之一, 将大幅提高评估活动的信息收集能力和信息处理效率。

  3. 大数据可视化技术优化评估报告的形式和公布方式

  在大数据时代, 数据量变得非常大, 而且非常繁琐, 想要发现数据中包含的信息或知识, 数据可视化是最有效的途径之一。可视化技术通过创建图片、图表或动画等, 方便对大数据分析结果的沟通和理解。[25]可视化运用在立法后评估活动上, 可以从两方面对评估报告进行优化。一是可以优化评估报告的数据表现形式, 运用计算机图形学图像处理技术, 将其中的数据转换为图形或图像在屏幕上显示出来, 并进行交互处理。当前的立法后评估报告一般以纯文字形式为主, 辅以少量的饼状图、折线图等图表, 但是当数据量逐渐增大到大数据级别时, 传统的电子表格等技术已不能清晰展现海量数据的特点, 因此需要研究适用于大数据时代下评估报告的可视化手段。例如时空数据可视化技术, 充分结合地理制图学以及数据可视化技术, 展现法规范文件在不同的空间和时间下的实施效果和可操作性等问题;再如多动态多维可视化技术, 在制作PPT时为了打破二维数据的局限性, 可以使用时空立方体, 利用三维模式展现空间、时间、事件。目前这些技术在其他领域已经出现了一些成功案例, 例如大众点评网通过流式地图的方式向用户呈现每一天全国各地餐厅最火的菜品以及人均消费, 为用户的消费提供参考。这些成功的案例都为立法后评估报告利用可视化技术提供了宝贵的经验。二是扩大评估报告的受众, 可视化技术作为人和数据之间的界面, 结合其他数据分析处理技术, 为广大使用者提供了强大的理解、分析数据的能力, 使得大数据能够被更多人理解、使用, 将评估报告的使用者从少数决策者和专家扩展到更广泛的大众。再结合互联网社交技术, 除了像法律一样采取广播、电视、报刊等大众传媒加以公布传播外, 因为评估报告毕竟不具有法律的适用性, 结合可视化技术降低了理解难度, 它的公布方式可以不需要权威性和规范性。如今各种大数据共享平台不断建立, 在立法领域也需要建立一个安全成熟的立法大数据共享平台, 应该是一个包含法律法规数据库、立法文件数据库、公众立法意见数据库、立法评估数据库、立法机构及工作人员数据库、立法疑难数据库的综合性大型数据共享平台。这不但可以解决大数据存储、处理与查询的需求问题, 还可以解决数据信息的整合与共享问题。

  4. 大数据预测方法强化评估指标体系的预测功能

  立法后评估的指标体系价值之一就是预测功能, 能够为各地区进行立法后评估提供客观依据。[3]同时, 法律固有的稳定性要求立法者要有一定的预测能力, 在立法中对社会经济发展予以前瞻。在日新月异的今天, 各种新事物层出不穷, 大大增加了立法预测难度。传统立法后评估的预测方法主要有两种:一是定性预测方法, 立法者依靠熟悉立法理论知识、具有丰富立法经验和综合分析能力的人员与专家, 依据已经掌握的立法资料和直观材料, 运用个人经验和分析判断能力, 对法律事实的运行情况做出判断, 然后再通过一定形式综合各方面的意见, 作为立法预测的主要依据。二是定量预测方法, 是立法者根据已掌握的比较完备的统计数据, 运用一定数学方法进行科学加工整理, 借以揭示有关变量之间的规律性联系, 用于推测法规范文件未来发展变化和运行情况。定性预测方法容易受心理因素或知识水平等主观因素影响, 并且处理过程复杂且花费时间较长;定量预测方法除了受评估者分析水平影响外, 最主要受收集到的数据真实性和全面性的影响。而大数据的核心价值在于预测, [26]通过对过去和现在的数据对比分析, 在海量的数据信息中, 挖掘和整合出大范围、全方位的数据, 推演出事物之间的相互关系, 依靠对这些关系的把握, 做出对未来的判断, 从而更好地进行成本——收益分析。大数据之所以重要, 关键点之一就在于人们对因果关系的把握从既存结果推展到潜在结果, 从过去时推测到将来时。[27]将大数据的预测方法引入立法后评估中可以强化评估指标体系的预测功能, 使立法者清楚地看到立法预期与立法实施效果之间的差距以及立法技术等方面的欠缺, 进而吸取经验教训, 及时调整法律规则, 促使立法从“事后诸葛亮”向“事前诸葛亮”转变, 改变立法滞后的弊端, 让立法有先知先觉的功能。在大数据时代, 对数据的重视程度远大于理论, 这种观点越来越多, 但是对于预测来说, 这种态度绝对是错误的, 在数据如此杂乱的情况下, 有了理论性思考, 统计推理就要可靠的多。[28]

  5. 大数据清洗和应用技术筛选评估数据的真实性和实用性

  随着计算机与网络技术的快速发展, 公众任何时间都可以在互联网上传播发表意见, 这就造成了数据量的爆炸式增长, 这一现象一方面丰富了评估活动可以收集到的信息量, 另一方面, 伴随着海量数据的是垃圾数据的出现, 在数据挖掘技术收集到的数据中, 垃圾数据占据很大一部分, 这给评估者直接应用所需的信息造成了极大不便。很多大数据研究者都明确表示“作为一堆原始海量的信息, 大数据不是自明的”。[29]大数据清洗和应用技术可以快速从海量的数据中剔除出有缺陷的、重复的、错误的数据, 筛选出真实、有用的信息, 从而提高数据质量, 克服“数据丰富, 信息匮乏”的矛盾, 减少垃圾数据对立法后评估活动的影响。数据清洗主要是根据一定规则和策略, 通过检测、统计、匹配、合并等方法, 并利用有关技术, 将垃圾数据转化成满足数据质量要求的数据并输出。就现有的大数据技术水平来看, 将大数据清洗技术应用到立法后评估可以提升两方面功能, 一是将评估数据分析结果可视化处理, 被挖掘到的大量信息很难被评估者直接利用, 只有通过可视化技术对评估信息进行直观化处理, 以形象化、可视化的方式展现出来, 让整个评估流程可以重复验证, 才能取得评估者的认可并有效的进行应用;二是将清洗后的数据在进行共享、公开后重新纳入信息挖掘——整合——分析——清洗——应用的流程, 进行评估数据再循环, 可以更准确地为立法后评估活动提供实时、动态的数据。

  三、大数据技术应用于立法后评估的可行性分析

  目前大数据的深刻影响已经被各行各业认识, 学术界也从各种视角对大数据的内涵进行了分析阐释, 大致可以分成五种观点:技术本体论、数据本体论、工具论、社会关系论和信息资产论。[30]本文所说的大数据主要指的是技术本体论和工具论, 即认为大数据是对海量数据进行收集、检索、挖掘、分析、应用的新技术, 或者将大数据视为一个可以分析巨量数据的, 能够对全部数据进行处理并作出明智决策的, 对解决社会问题、科学研究以及实现商业价值都有重大帮助的强大工具或方法。大数据发展理念及阶段性成效与立法活动的契合为其应用提供了外部条件, 评估数据变化及大数据技术特点的契合提供了内部基础, 内外契合使大数据运用到立法后评估制度中具有了充分的可行性。

  1. 大数据技术与立法后评估制度的外部契合

  在大数据飞速发展的几年间, 上到国家, 下到法律实务工作者、法学学者都对此报以极大的关注。在国家大力发展大数据的理念推动下, 大数据立法研究和法律大数据库建设等几个方面都取得了令人欣喜的成效。这些阶段性成果为大数据应用于立法后评估制度奠定了坚实的基础。

  第一, 法律法规方面。2009-2013年是我国大数据市场的萌芽期, 大数据概念在国内获得极大关注, 大数据产业进入了高速发展的时期。在大数据发展政策法规方面, 2015年是大数据政策顶层设计年, 2015年9月国务院发布了《促进大数据发展行动纲要》, 将大数据提升到国家战略层面。2016年是大数据政策细化落地年, 大数据政策从全面、整体逐渐向各个领域细化。[31]2016年1月15日, 贵州省十二届人大常委会第二十次会议通过了《贵州省大数据发展应用促进条例》, 这是我国首部关于大数据的地方性法规, 将大数据产业纳入法治轨道, 实现了大数据地方立法“破冰”, 随后《贵州省政务数据资源管理暂行办法》等相关法规文件也相继出台。[32]这是大数据在地方立法实践上的一次重大突破, 不仅填补了我国在大数据方面的法律空白, 更为大数据应用于立法后评估制度提供了法律上的保障。

  第二, 法律云服务平台建设方面。2014年11月18日, 由南京邮电大学牵头, 北京大学法学院、清华大学信息科学技术国家实验室、中国政法大学企业法务管理研究中心、亚太网络法律研究中心等多家机构共同参与发起的“中国法律大数据联盟”正式成立, 目的是探求大数据推动下的立法研究、法律应用和法律服务的转型升级, 共同推动大数据在法律各个领域内的应用。法律大数据联盟将联合成立中国法律大数据研究中心, 编制《中国法律大[3数3]据蓝皮书》, 组织构建法律大数据与云服务平台。

  第三, 法律大数据库建设方面。2015年11月27日, 福建君友大数据技术有限公司提出了构建我国的法律大数据库的号召, 并建立了法律法规数据库, 法律文件、文书数据库, 案例分析数据库, 司法机构及其从业人员数据库。[34]1998年北京大学法制信息中心独立开发了“中国法律检索系统 (浏览器版) ”, 将新产品定名为“北大法宝”, 在大数据快速发展时期扩展成七大数据库, 在国内取得了绝对优势的市场占有率, 并在2018年推出了“北大法宝智能立法支持平台”, 利用其专业法律资源数据库做支撑, 为智能立法平台提供大数据和功能支持。法律大数据库与智能立法平台的建立为立法后评估活动中的合法性评估、合理性评估的全面性和科学性提供了技术支撑。

  第四, 大数据与立法研究方面。2018年1月20日, 浙江省立法研究院暨浙江大学立法研究院在浙江大学成立, 目的在于整合浙江大学内的资源, 推动立法学科研成果转化, 一方面持续关注互联网等新兴领域的立法实践及发展大数据、人工智能、互联网等带来的法治生态建设;另一方面, 探索运用大数据技术打造“智能立法”, 做到各个立法领域和环节都有数据意识和数据支撑。[35]依托于高校和科研机构的法律大数据研究中心为大数据应用于立法后评估制度提供了理论上的保障。

  2. 大数据技术与立法后评估制度的内部契合

  进入互联网、大数据时代后, 各个领域的数据都发生了变化。立法后评估作为立法领域的重要一环, 自然不可避免。一般认为, 大数据有四个方面 (4V) 典型特征。 ([19], p.87) 一是数据体量巨大 (volume) , 大数据的特征首先体现在数据体量大, 这与立法后评估活动需要进行大量数据收集极为相似。二是数据类型多 (variety) , 三是价值密度低 (value) , 四是处理速度快 (velocity) 。大数据处理技术的四个基本特征与立法后评估活动的数据变化与需求极为吻合, 这使得将大数据技术应用到立法后评估中有了极大的可行性。

  (1) 数据体量巨大。“后立法时代”我国立法工作的重心由原来强调法的创制向法的修改、补充、废止转变, 加上2015年设区的市有了立法权后法规范文件数量骤增, 使得国家越来越重视对现有法律的评估。另外, 立法后评估有一定的周期性, 根据时间安排可以分为短期评估、中期评估和长期评估, 即使是短期评估也要以一年为限, 长期评估更是要在五年以上。而立法后评估活动需要公众的广泛参与, 随着公众法律意识不断提高, 政治热情日益高涨, 特别是在与公众切身利益相关的评估活动中, 公众参与的热情更加高涨。这些参与主体虽然包括公民, 但不仅限于公民, 还有广大的利益团体、社会组织, 他们会因不同的立场、地位、价值信仰、利益倾向等不同, 对法律的实施会有不同的感受。客观的立法后评估结果必须建立在大量真实的信息基础上, 一般来说, 参与的主体数量越多, 收集的信息量越大。多重原因下, 评估机关收集到的信息数据越来越多, 达到传统人力难以整合的地步, 此时运用大数据处理技术就能方便有效地解决。

  (2) 数据类型多。以往评估信息数据尽管数量庞大, 但通常是事先规定好的以文本为主的结构化数据。相对于结构化数据, 如今评估活动中收集到的非结构化数据大量存在。立法后评估活动并不是单纯的指标量化计算, 其指标体系包括:法规的贯彻执行情况、法规与上位法抵触情况、法规可操作性、立法技术评估、成本效益评估。[3]其中的很多评估指标并不是可以简单的通过数字表达清楚, 可能会以音频、视频、图片等多种表现形式呈现出来, 这些都属于非结构化数据, 具有分散、无序、难以统计等特点。在公众利用这些社交平台时, 如北大法宝、中国裁判文书网等会产生大量的非结构化数据, 这些数据能实时、动态地反映公众对法律态度和需求的变化趋势。广泛的数据来源, 决定了数据类型的多样性, 目前整个社会中的非结构化数据已占数据总量的75%。[36]

  (3) 数据价值密度低。价值密度的高低与数据总量的大小成反比, 评估小组在进行数据收集时, 有时为了获取事物的全部细节, 会直接采用最原始的数据。纽约大学丽莎·吉特尔曼 (Lisa Gitelman) 教授认为原始数据是一个矛盾体, 在每一个不同学科和学术机构中都有着不同的标准和规范。[37]在立法领域, 由于公众的信息量和知识限制, 关注更多的是自身利益, [38]提供的意见虽然数量很多, 但科学、合理、可行的意见数量不多。加上评估者水平不一, 对数据筛选程度不同, 会导致评估价值密度偏低。这种特性用大数据处理技术亦可简便有效解决, 通过强大的算法迅速地完成数据的价值“提纯”, 使评估数据得以整合分类。

  (4) 数据处理速度快。数据的增长速度和处理速度是大数据高速性的重要体现, 也是立法后评估活动的一大需求, 在海量的数据面前, 处理数据的速率格外重要, “1秒定律” (1) 的存在将大量提升立法后评估的效率。

  大数据技术的阶段性成效和立法后评估的数据变化分别为两者的有效结合提供了外部条件与内部条件, 使大数据技术应用到传统的立法后评估制度具备了可行性。要构建基于大数据作为技术支持的立法后评估机制, 在技术层面上必须要建立评估数据的价值实现流程, 以保障立法后评估活动内在的科学性, 这就需要搭建包含“评估数据挖掘与分析”、“信息协同共享与公开”和“评估数据清洗与应用”三大信息数据处理平台, 还需要增设地方大数据立法部门, 促成与大数据企业的合作。

  四、结语

  大数据技术作为立法后评估制度的技术性支持, 目的是解决立法后评估中评估数据的真实性、完整性和准确性问题, 为整个评估活动提供科学的“数据证据”。然而, 将大数据应用到立法评估领域可以为立法工作带来诸多便利, 但必定是一条曲折的道路, “数据说话”的可靠性、客观性、准确性、有效性以及“数据异化”等问题都需要立法评估者警惕。首先, 我们应该清楚地认识到, 大数据理论层面的研究中仍存在一些误区或曲解, 如很多人误以为“因果关系”不再重要, 转而将研究重点局限在“相关关系”;片面追求数据规模;过于强调计算架构和算法等。[39]其次, 在技术层面上, 在实际应用过程中, 必然会出现种种“数据风险”。利益与风险成正比, 这种风险存在于数据的收集、清洗、分析和应用等整个全过程, 表现为“数据混乱”、“数据失真”、“数据依赖”等多种“数据异化”现象。以网络数据收集为例, 网络的民意数据绝不可以成为全部的民意数据, 网络的开放性使得网络舆论容易受到非理性因素的影响, 在评估者过分注重网络数据时会得出表面肤浅甚至错误扭曲的结论。来源多元的各种信息掺杂在一起会加大数据混乱的程度, 使得“错误发现”的风险增加, 在立法后评估活动中, 如果评估是建立在失真数据的基础上, 就会对立法工作做出错误的判断, 甚至对城市治理带来灾难。而“数据依赖”则会导致数据崇拜和数据独裁, 评估者认为掌握了数据就掌握了立法后评估的所有, 这种对数据的高度依赖反而使其有了更大的易攻击性和脆弱性, 在大数据时代的立法评估离不开数据支撑, 但仅仅依靠数据得出评估结论却是万万不能的。最后, 跨学科的大数据技术课程体系建设和人才培养问题, 不管是立法活动还是大数据处理, 都存在着人才短缺的问题, 更遑论将两者结合的跨学科人才, 还有信息安全和个人隐私问题、数据开放问题、收集到的数据权属问题等等。大数据的出现使得评估数据的收集分析变得迅速、准确, 但立法后评估并不是简单的技术性问题, 评估最终还是要依靠大量的评估工作人员来实现, 评估者丰富的理论知识和实践经验仍是不可替代的, 需要国家、政府、立法机关、企业、专家以及公众等并肩作战, 共同努力。我们在为大数据技术带来的高科技便利欣喜时, 也应该时刻保持警惕, 避免引起盲目的技术信任带来的弊端。

  参考文献
  [1]Kitchin, R.'Big Data, New Epistemologies and Paradigm Shifts'[J].Big Data&Society, 2014, 1 (1) :1-12.
  [2]汪全胜.法律绩效评估机制论[M].北京:北京大学出版社, 2010, 17.
  [3]李朴民.进一步做好大数据分析应用工作[J].宏观经济管理, 2016, (6) :9-10.
  [4]汪全胜.立法后评估研究[M].北京:人民出版社, 2012,
  [5]马发明、王邺.建立法规跟踪问效制度初探[J].中国人大, 2005, (13) :33-34.
  [6]席涛.立法评估:评估什么和如何评估 (上) --以中国立法评估为例[J].政法论坛, 2012, (5) :59-75.
  [7]汪全胜.论立法后评估主体的建构[J].政法论坛, 2010, 28 (5) :42-49.

大数据技术应用于立法后评估的必要性与可行性相关文章
重要提示:转载本站信息须注明来源:原创论文网,具体权责及声明请参阅网站声明。
阅读提示:请自行判断信息的真实性及观点的正误,本站概不负责。
别人都分享了,你还在等什么?赶快分享吧!
更多