大数据是依确定目的而挖掘、处理的大量不特定主体的数字信息。大数据的本质属性是财产性而非人身性。大数据发展的指向应该是开放而不是封闭,在个人权益与社会福利间谋求均衡。
相较于债权、知识产权这两种路径,把大数据确定为物权的制度效率高。具体要研究、确定大数据在挖掘阶段、存储阶段、分析阶段、应用阶段的权利内容。
目前学界将“大数据”、“数据”与“个人信息”混为一谈,将注意力集中到人身权、隐私权研究,既忽视了财产性才是大数据的根本属性,又忽视了大数据在挖掘、云存储、云计算和应用等方面与一般数据的诸多客观区别。
大数据是信息时代的新产物,在法律性质、权利内容、权利归属方面存在着诸多制度空白,进而导致了公地悲剧、市场垄断和逆向选择等负外部性的出现,阻碍社会福利最大化的实现。需要通过法律经济学对大数据确权进行比较制度分析,以解决大数据初始产权的界定问题。
目前大数据讨论中存在着似是而非的理解
法律视角中,什么是大数据?大数据和普通数据有什么区别?目前理论、实务界与立法者出于现实考虑,默契一致地选择回避正面回答“什么是大数据”,而是采用了描述性的概念界定即众所周知的“4V标准”,将“大数据”定义为“大量(普通)数据的集合”。这样定义,导致大数据在世界范围内被拖入隐私权争论的泥淖之中。
不清楚大数据在法律上是什么,何谈确权?如何流转?如何保障?
笔者认为,大数据是依确定目的而挖掘、处理的大量不特定主体的数字信息。
不具备“特定目的挖掘”主观要件和“挖掘、处理”客观要件,而只是静置、沉睡的数据,种类和数量再多、处理速度和本身准确性再高也不会产生这种精准预测力,也不是“大数据”。
“数字信息”是“大数据”与“个人信息”的核心区别。目前,国内由于“大数据”提法的兴起与贩卖个人信息活动日益猖獗的周期高度重合、同步,使得国内舆论与研究者也将除大数据应用之外的主题放到了隐私权保障上,《个人信息保护法》的呼声也日益高涨。但这和大数据的关系似是而非。大数据要分析和处理的是海量数字化信息,在大数据存储、分析的整个流程中,“个人信息”都不再以初始形式存在,大数据的内容是计算机语言表述的数字信息。
大数据发展的指向应该是开放而不是封闭,在个人权益与社会福利间谋求均衡。
把大数据界定为物权是较好选择
探讨大数据的权利性质,就是要研究,将目前法律性质不明的大数据界定为物权、债权还是知识产权的交易成本低、制度效率高。由于不同的法律性质意味着不同的保护模式,也就意味着不同的交易成本与制度效率。
由于“大数据”是依确定目的而挖掘、处理的大量不特定主体的数字信息,显然不是天然存在而是人为加工的一种财产。那么大数据应该属于何种财产权?已颁布的《民法总则》在第五章“民事权利”列明了财产权利的三个主要组成部分,物权、债权和知识产权。从法律经济学来看,大数据的权利性质确定过程可以被视为一种制度选择的过程,在物权、债权、知识产权这三种路径的制度竞争间进行“成本-收益分析”,得出效率最高的制度效率。
债权路径带有明显的负外部性后果,促使垄断和不正当竞争的形成。债权路径中主要的是通过契约意思自治来实现大数据确权,这是当前现实中普遍的形式,比如贵阳和中关村的大数据交易中心所内进行公开交易以及企业间或企业内部进行的非公开数据交易。大数据确权存在制度空白的情况下,通过市场机制进行大数据交易的法律风险过高,进而导致交易成本高。故而大数据企业选择企业机制,在关联企业内部流转大数据形成市场替代。总的来说,如果过度依赖契约路径与放任大数据产权不明晰状态的持续则将产生市场失灵,其主要形态是垄断。届时小型互联网公司将不得不对大数据托拉斯缴纳高昂的市场进入税,直接损害社会福利。
从制度需求的角度看,知识产权法主要保护的是实现大数据的外在技术,而对于大数据本身的解释力有限。其解释力主要在于大数据分析和大数据应用,因为此阶段确实包含了大数据工程师的智慧成果。但是在大数据挖掘方面则很难解释,比如Cookies(电脑上网缓存)与网络痕迹,并不包含明显的智慧加工。故而在大数据挖掘方面知识产权性体现的不明显。
相较于债权、知识产权这两种路径,“物权路径”的制度效率较高,理由在于两方面。
第一是需要克服的制度禀赋难度低、制度改进成本小。若将大数据解释为一种物权客体,则现有物权体系中的无体物基本能够相融,从而更容易被立法者接受,克服制度禀赋难度较小。具体来说,物权的占有、使用、收益、处分四大权能较好对应大数据流程,占有对应大数据挖掘和大数据存储,使用对应大数据分析和大数据应用,收益和处分对应大数据交易,这方面明显优于知识产权路径。
第二是抑制制度负外部性,降低交易费用。这又具体分成三个角度,首先是物权路径不会直接导致因过度意思自治带来的垄断和不正当竞争以及其他市场失灵情形,甚至可以有效抑制垄断从而优于债权路径;其次是物权路径权责明晰,大数据产权的所有者与应用者即相关法律责任的承担者,相较于债权路径而言降低了因合同相对性与内外双重效力导致的“侵权无责”伤害社会福利的情形;最后是流转顺畅,相较于知识产权路径而言将大数据理解为一种无体物动产则没有复杂的登记与公示,更有利于大数据流转和信息的传播以及由此带来的激励创新等正外部性的产生。
大数据的权利内容
大数据的权利内容即哪些具体权利应该被法律明确规定、保障?
从产业链条上时间先后顺序来看,大体包含大数据挖掘阶段、大数据存储阶段、大数据分析阶段、大数据应用阶段的权利四部分内容。当然,并非大数据的所有权利内容都适宜通过《民法分则》、《个人信息保护法》或其他法律部门予以规制。以下说明的是通过成文法尤其是民法典予以规制更具制度效率的大数据基本权利内容。
概括地说,大数据挖掘阶段的权利内容主要包括有Cookies辅助数据、网站爬行数据和旁路采集数据等。大数据存储、分析阶段的权利内容主要包括清洁数据、区块链数据、Hadoop的MapReduce分散节点数据、用户行为模型数据等方面。大数据应用阶段主要包括LBS数据、CRM数据等。
大数据的权利归属
在物权路径下更为具体的制度选择中,物权由占有、使用、转让、收益、处分等权能构成,故而在大数据各流程中又面临着哪些主体对大数据享有完整物权权能或不完整权能这两种路径之间的制度竞争问题,需要进一步分析。
挖掘阶段的大数据权属
大数据挖掘阶段选择完整物权权能路径更有效率,应将Cookies辅助数据、网站爬行数据和旁路采集数据等大数据的物权归属于大数据挖掘者所有。
从占有权能的角度说,此阶段数据挖掘者占有大数据交易成本更低。对此,目前学界和社会公众中比较流行的看法是“大数据时代个人信息应归个人所有,用户对自己不愿意公开的信息享有被遗忘权”。应该看到,用户确实是个人信息的产生者和所有者,但是并不是被数字化、匿名化以及其他大数据技术处理后的个人信息的产生者与所有者。将挖掘阶段大数据的占有权归属于个人用户的制度设计是明显无效率性的。
从使用、处分权能的角度说,由于信息成本过高,挖掘阶段的使用权人应该是大数据挖掘者而不是用户。相较于将挖掘阶段的大数据确权给自然人,确权给有挖掘能力及有效率的企业与政府则更有利于这一技术正外部性的拓展与实现。
从转让与收益的角度说,相对于用户而言,大数据挖掘者享有转让与收益权更有利于降低交易成本和促成私人谈判。
存储、分析阶段的大数据权属
该阶段权利应归委托人所有或依据契约进行产权确认。大数据存储、分析阶段也即“云计算”阶段,此时由于个人信息已被清洁和数字化,从而不再涉及用户所有权问题。故而制度选择方案即是在“云计算委托人”和“云计算受托人”之间进行确权。
“云计算”的核心资产是大型、超级计算机,核心竞争力是“4V”标准项下的“大量、多样、快速、准确”地运算。国内外提供云服务的企业主要包括Google、IBM、阿里、腾讯以及华为等互联网寡头,这些企业大都本身拥有10亿级别的大数据运算需求,所以本身都拥有自己的云服务软硬件。云服务是在满足自身大数据运算的过程中发现的对主营产品的替代商品,将“剩余运算能力”出售给其他公司实现企业资产配置效率的最大化。总而言之,现在“云市场”中云服务的主要生产者与消费者高度统一。
应用阶段的大数据权属
应用阶段的大数据应被界定为公有产权,属于全体社会成员所有,但需要法律对其边界加以具体限制。
从占有的角度来说,LBS数据、CRM数据等应用阶段的大数据事实上已归属于政府和运营商占有,而这种占用基于法律行为而产生,且目前并未产生足以降低社会福利的负外部性影响,故而暂时不需要调整。
从使用的角度来说,应用阶段的大数据不应私有化。主要原因在于这将抑制正外部性溢出并催生垄断。从供给侧改革的角度来看,应用阶段大数据若归属于少数大型互联网公司则意味着法律为价格歧视和无谓损失提供温床。从“大众创业,万众创新”的角度来讲,应用阶段的大数据确权将对无偿公开大数据成果产生负面激励,抬高企业创新与科学研究的成本,阻碍正外部性的产生与技术溢出。
从转让、收益和处分的角度来说,将应用阶段大数据界定为私有产权将导致交易成本陡然增加。
总而言之,应用阶段的大数据从社会总体福利的角度来讲应该参考土地制度,界定为公共所有并交由政府管理。具体方式可以通过成立“中央大数据银行”对大数据市场实施“统而少治”。一方面限缩大数据的流动规模以保护国家信息安全和防治大数据的“新型国有资产流失”,另一方面限制大数据发展中的市场失灵,比如大型互联网企业大数据托拉斯的形成。