暂无
在不久前举办的2023西湖论剑·数字安全大会论坛上,中国工程院院士方滨兴发表题为“破解数据要素流动与隐私保护相冲突的局”的主旨演讲,提出为平衡数据要素流动与隐私保护的冲突,需要采用数据使用权和所有权相分离、数据可用不可见、数据不动程序动,分享价值不分享数据四个核心方法,通过模型加工厂这一只分享价值的可信平台,充分释放数据价值。
他表示,数据是生产力,通过数据能推动经济发展,国家也制定了一系列政策,尤其是在“十四五”规划中特别强调数据要素流动,这都说明数据在生产力中发挥的作用。与此同时,数据里可能会反映出隐私信息,可能会涉及到一些国家利益、社会安全利益。这就产生了一种矛盾,我们到底是要数据要素流动还是要数字隐私保护,这是一悖论。
方滨兴谈道,作为科学工作者要解决问题,尽量做到隐私保护,又尽量让数据要素流动,并主要将解决方案分成了四类:以李风华教授为代表的隐私计算,以姚期智教授为代表的安全多方计算,以杨强教授为代表的连邦学习,以及他自己提出的模型加工厂。
什么是“模型加工厂”?他解释称,把数据聚集在一起,作为可信平台,该可信平台需为政府部门主管,将数据放到政府部门后,如何流动呢?数据不动程序动,我们提出一个概念叫“AI靶场”,即做一个仿真环境,所以我们把它叫仿真靶场。
新梳理发现,方滨兴的“仿真靶场”主要包括以下四个核心要素,“一是数据不动程序动,程序可以运行后取走结果,但带不走数据。二是辅助模式,数据可用不可见,我给你准备数据,准备的数据原则上是生成数据,生成方式可以是AI训练出一批特征相同的数据,这样就不涉及隐私。三是给数据加密,这样你可以把模型参数等‘价值’拿走,但拿不走原始数据,拿走了也解不开,可以保证只分享价值,不分享数据。四是将数据交易改造成使用权交易,并通过加密或远程控制来保证使用权交易,这样可以推动数据要素流动。”
方滨兴表示,上述4种方法也需要注意一个问题:高度依赖可信的单位,单位不能自己把数据拿走,因为原始数据都在单位里。此外,数据平台需要有一套可信的访问控制系统以及管理体系,以防自己人偷偷把数据拖走。