大数据法律保护之困
山西恒驰律师事务所 迟菲
摘 要
并不是一定数量的数据集合就叫大数据。只有同时具备大数据三个必要条件的才可能称之为大数据。目前,大数据在具有巨大的经济价值的同时,法律保护处于空白状态。这造成了大数据的法律属性难以确定,大数据的权利归属、开发利用以及交易都处于法律空白状态。本文力图通过对这些困境的分析,为研究大数据法律保护提供一些思路。
正 文
大数据这个词,可能是目前人们说的最多,懂得最少的一个词。各行各业都在说大数据,都在宣称自己的服务或产品基于大数据技术。而这些所谓的大数据高科技企业中,却有很多并不懂什么叫大数据的人。甚至部分企业把基于传统数据库这样小数据开发的产品,换个名字自称为大数据技术。在大数据行业一片混乱的情况下,大数据的法律规制、法律保护更是一片空白。在大数据行业内部,大家对法律层面保护大数据的重要性和必要性没有正确的认识;在法律业界内,对如何规制大数据,如何保护大数据,也还是未知数。大数据本身跨专业性与在各专业中的高技术性阻碍了多个学科在大数据研究上的普遍合作。同时,大数据技术目前仍在不断改进与拓展过程中,商业模
式也在不断出新,造成大数据研究始终难有定论。本文希望通过对目前大数据法律保护问题的困境的分析,为各位律师在研究大数据法律问题时提供一些思路与借鉴。
一、大数据法律属性之困
(一)什么是大数据
大数据这个词,不同学科从不同角度、不同目的进行了解读,这些解读各有侧重,大多是为自身学科的需要进行的分析与研究。从法律角度考量,至今还没有一个对大数据较为权威的解读。
“名不正则言不顾,言不顺则事不成”,要弄清大数据的法律属性,必须先对大数据进行定义。
考察目前各种大数据的定义,抛开各种用途各具特色部分,我们可以抽象出构成大数据的三个必要条件:
大数据的“大”首先是表现在数量上。对于数据来说,大无疑要求数据具有相当的数量,几十个,几百个数据不能形成趋势,自然不能称之为大数据。但大与小是相对的,到底需要有多少数据才能叫大数据,少于多少就叫小数据,也并没有一个数量级作为界限。大数据中所谓的“大”是一个相对的概念,要结合大数据具体的用途来确定。对于一定数量的数据来说,只要这些数据多到足以让数据的使用者可以通过大数据分析手段对数据进行规律性分析的程度,就可以称之为大数据。(至于大数据分析手段,应当属于大数据的充分条件,本文不予展开讨论)
大数据的“大”还表现在范围上。大数据是对某一类数据的整体进行分析处理,所谓的整体是指数据收集后形成的全部信息,包括了各种极端数据以及错误数据。与大数据相对应的是传统统计学或数据库方法处理的“小数据”,传统统计学或数据库方法是将数据进行筛选分类,去掉数据中含错的数据,不符合统计学规律的极端数据后,研究剩下那部分更具有代表性的数据。
最后一个大数据的必要条件是必须原生态性。大数据技术必须是对数据的原始状态通过大数据分析手段进行利用。而不是通过对数据分类、排序等方式进行结构化之后再通过提取字段等方式进行分类分析。换句简单的话说,传统统计学的小数据是把一堆数据进行精准化后,用精确分析的手段进行分析利用;大数据是在数据原生态状态下,以模糊分析的手段对数据加以分析利用。
以上三方面是构成“大数据”的必要条件,只要不符合上述任何一项的,就不是大数据项目。(同时具备三项的,是否是大数据还要结合分析利用方法等综合判断,本文囿于篇幅,不对大数据的充分条件进行分析)
(二)大数据的法律属性之困
大数据的必要条件决定了大数据就是一大堆零散混乱的数据,这些数据本身没有任何的人类智力成果,数据所含的信息都是一些客观事实。数据的形成可能是人工收集的结果,例如由人工对某一类数据进行采集;可能是长期经营或运营形成的数据集合,例如某大型零售企业的客户信息;还可能是计算机系统自动形成的数据集合,例如电
大数据法律保护之困
山西恒驰律师事务所 迟菲
摘 要
并不是一定数量的数据集合就叫大数据。只有同时具备大数据三个必要条件的才可能称之为大数据。目前,大数据在具有巨大的经济价值的同时,法律保护处于空白状态。这造成了大数据的法律属性难以确定,大数据的权利归属、开发利用以及交易都处于法律空白状态。本文力图通过对这些困境的分析,为研究大数据法律保护提供一些思路。
正 文
大数据这个词,可能是目前人们说的最多,懂得最少的一个词。各行各业都在说大数据,都在宣称自己的服务或产品基于大数据技术。而这些所谓的大数据高科技企业中,却有很多并不懂什么叫大数据的人。甚至部分企业把基于传统数据库这样小数据开发的产品,换个名字自称为大数据技术。在大数据行业一片混乱的情况下,大数据的法律规制、法律保护更是一片空白。在大数据行业内部,大家对法律层面保护大数据的重要性和必要性没有正确的认识;在法律业界内,对如何规制大数据,如何保护大数据,也还是未知数。大数据本身跨专业性与在各专业中的高技术性阻碍了多个学科在大数据研究上的普遍合作。同时,大数据技术目前仍在不断改进与拓展过程中,商业模
式也在不断出新,造成大数据研究始终难有定论。本文希望通过对目前大数据法律保护问题的困境的分析,为各位律师在研究大数据法律问题时提供一些思路与借鉴。
一、大数据法律属性之困
(一)什么是大数据
大数据这个词,不同学科从不同角度、不同目的进行了解读,这些解读各有侧重,大多是为自身学科的需要进行的分析与研究。从法律角度考量,至今还没有一个对大数据较为权威的解读。
“名不正则言不顾,言不顺则事不成”,要弄清大数据的法律属性,必须先对大数据进行定义。
考察目前各种大数据的定义,抛开各种用途各具特色部分,我们可以抽象出构成大数据的三个必要条件:
大数据的“大”首先是表现在数量上。对于数据来说,大无疑要求数据具有相当的数量,几十个,几百个数据不能形成趋势,自然不能称之为大数据。但大与小是相对的,到底需要有多少数据才能叫大数据,少于多少就叫小数据,也并没有一个数量级作为界限。大数据中所谓的“大”是一个相对的概念,要结合大数据具体的用途来确定。对于一定数量的数据来说,只要这些数据多到足以让数据的使用者可以通过大数据分析手段对数据进行规律性分析的程度,就可以称之为大数据。(至于大数据分析手段,应当属于大数据的充分条件,本文不予展开讨论)
大数据的“大”还表现在范围上。大数据是对某一类数据的整体进行分析处理,所谓的整体是指数据收集后形成的全部信息,包括了各种极端数据以及错误数据。与大数据相对应的是传统统计学或数据库方法处理的“小数据”,传统统计学或数据库方法是将数据进行筛选分类,去掉数据中含错的数据,不符合统计学规律的极端数据后,研究剩下那部分更具有代表性的数据。
最后一个大数据的必要条件是必须原生态性。大数据技术必须是对数据的原始状态通过大数据分析手段进行利用。而不是通过对数据分类、排序等方式进行结构化之后再通过提取字段等方式进行分类分析。换句简单的话说,传统统计学的小数据是把一堆数据进行精准化后,用精确分析的手段进行分析利用;大数据是在数据原生态状态下,以模糊分析的手段对数据加以分析利用。
以上三方面是构成“大数据”的必要条件,只要不符合上述任何一项的,就不是大数据项目。(同时具备三项的,是否是大数据还要结合分析利用方法等综合判断,本文囿于篇幅,不对大数据的充分条件进行分析)
(二)大数据的法律属性之困
大数据的必要条件决定了大数据就是一大堆零散混乱的数据,这些数据本身没有任何的人类智力成果,数据所含的信息都是一些客观事实。数据的形成可能是人工收集的结果,例如由人工对某一类数据进行采集;可能是长期经营或运营形成的数据集合,例如某大型零售企业的客户信息;还可能是计算机系统自动形成的数据集合,例如电