暂无
为进一步促进数据高效流通和数据要素市场高质量发展,推动隐私计算产业健康快速发展。2023隐私计算大会暨首届“星河杯”隐私计算大赛颁奖典礼活动于7月26日在青岛成功举办,吸引了过万人次关注。
大会上,中国信通院云计算与大数据研究所副所长魏凯正式发布“可信数网(TDN) 框架”,袁博、王思源分别解读了数网的两项成果“可信数网测试床”和“隐私计算互联互通第二批试点项目”,并联合项目共建方一同启动了成果的发布仪式。
可信数网(TDN) 框架
党的二十大报告和《关于加快建设全国统一大市场的意见》都提出了要培育统一的技术和数据市场,破除要素市场分割和多轨运行的情况。现有的去标识化技术、隐私计算技术、区块链技术等等为数据安全流通提供了有效的解决方案,但是,技术融合不充分、互操作性不足又导致了在打破数据壁垒解决“数据孤岛”的同时,容易造就“数据群岛”的局面。因此,亟需加快我国可信数据流通基础设施的建设,包括形成可信数据资源目录、搭建可信流通网络和提供多场景的可信数据服务。
数据流通的本质是数据怎样安全、高效、合规地从提供方流转到需求方的过程,其中涉及数据加工、治理、算法、算力、APP服务、IT基础设施等多个中间方,以及需要对流通全过程进行存证、监控,满足监管方的要求。在此条件下,可信数据流通网络(TDN,简称可信数网)就应运而生。它是数据流通中各个参与方在互认、互信、互联的原则下,通过“织点成域、联域成网”,形成的跨区域、跨行业、跨主体的数据流通基础设施。它为解决数据供给不充足、机构相互不信任、安全流通无范式、数据使用不可控等问题提供一种新的解决路径。
我们认为采用分层次的网状结构,通过枢纽节点、顶级节点建设数网有助于推动实现公共数据、企业数据和个人数据的流通。
——底层子节点是企业自身的流通平台,依据数网的标准规范建设,可以提高其流通业务可信水平;
——中间层是枢纽节点,考虑到公共数据或行业数据的特性,比如公共数据的开放或运营基本按照省、市、县进行开展,而通信、金融、能源等行业数据,数据量巨大且跨地域分布,因此通过建立省级或市级的公共数据枢纽节点、行业数据的枢纽节点,有利于统一规范地提供数据登记、一系列可信流通服务、交易结算等功能和满足监管要求。
——顶层是国家级节点,主要是面向全国提供数据流通服务,包括数据资源或产品登记、可信认证、交易结算和监管等管理能力,从而解决数据的跨区域流通,推动全国统一大市场。
可信数网TDN作为数据流通基础设施,基于统一的标准规范能够高效地覆盖各种节点、实现各类数据可信接入、数据流通安全可控、过程可溯源可审计和数据价值共享可度量。下面详细介绍其“六横两纵”的功能框架。
——底层的基础设施层提供了流通所有环节需要的存储、网络、计算的基础能力,包括基础的数据软件系统(如数据库)、通信网络、硬件算力、各类云服务等等。
——中间是流通环节核心的四层,包括资源接入、流通计算、流通控制、流通服务。在资源接入中,关键的是数据或算力资源如何统一对接、并根据不同的角色类型进行权限控制;在流通计算中,主要提供数据加工、分析和挖掘的能力,包括面向不同敏感程度的数据进行不同方式的加工计算,例如提供明文数据包或数据接口、多方失真数据计算或多方密态数据计算;在此基础上,仍需要保障数据全流通的使用进行可控可管,包括根据不同角色的权限制定不同的使用控制策略、对全流程进行监控、身份管理和合约管理;最后在流通服务中支撑开展包括数据服务、算力服务、使用资源的计量计费、过程的存证审计等内容。
——顶层的业务应用层,则是给出了几个常见的数据流通应用场景,通过下面的流通计算和服务来支撑风险管控、数字营销,智慧医疗和智慧城市等等业务场景。
——左右两侧,一个是互联互通,一个是监督管理。为避免形成“数据群岛”,可信数网将通过统一的标准规范来促进不同技术平台、不同可信域在数据、计算、服务和应用上的互联协同,从而实现数据资源的合理优化应用。此外,可信数网也将在流通前、流通后开展监督管理工作。例如在流通前对各机构进行资质认证、各项数据服务能力进行检测评估,在流通后对各方开展贡献评估、收益分配、信誉评价等内容,进一步提高流通全流程的安全可信水平。
可信数网的应用,首先从其中最小的单元平台建设说起。各机构在构建不同模式的可信数据流通平台时,可以参考TDN的功能框架及规范要求,避免建成即落后、互联互通困难等问题。针对公共数据流通、企业数据流通和数据交易三种典型的场景,我们通过广泛调研各地方各企业的建设情况,结合TDN的能力给出了一些建设指引:
——在公共数据方面,一体化政务大数据平台都已落地,但是为充分释放公共数据价值、实现公共数据统一的、专业化的运营,促进数据融合,未来更需要建设公共数据运营支撑平台,提供数据加工运营、开发服务、资产评估和应用服务等能力。
——在企业数据方面,央国企作为数据要素市场重要的参与方,现有数据共享流通能力和资产化水平亟待提高。不同的场景需要不同的技术和能力来支撑,我们认为可以分为企业内部(子公司或产业链上下游)之间的数据共享和企业外部(跨行业跨主体)的数据流通两大类场景。在内部的高信任场景,更注重数据的可控利用,而在外部的低信任场景,则要更需关注数据的开发、隐私保护和价值分配。
——在数据交易方面,除了基础的数据产品登记上架、交易撮合、支付结算等功能,未来部分交易平台也会扩展数据加工服务、算力调度等功能。
除了数据流通平台的建设,可信数网也会面向技术提供方、行业应用方和流通过程的各种参与主体,构建标准体系,为规范保障和能力评估提供依据。包括TDN的总体框架、枢纽节点或顶级节点的建设要求、数据流通技术的应用要求、数据流通产品的应用场景、数商的服务能力等等内容。
可信数网是在通信网络、算力网络的基础上,建立的一张数据流通网,由此来提供可信赖、高效率的数据服务或算力服务,支撑多种场景的区域级或行业级的数据流通。
在数据安全流通体系建设方面,枢纽节点一方面承接顶级节点可信根服务,建立安全认证体系,另一方面也通过统一的数据运营或流通接口,打造区域可信数网,实现数据安全流转。
在数据业务应用场景方面,可信数网可以高效支撑风险管控、数字营销、智慧医疗和智慧城市等场景。通过行业龙头企业互联互通建立枢纽节点,有利于扩大数据流通范围和高质量流通。例如基于区块链的共建共享生产调度云平台实现了支撑双方集团-省-地市三级架构的共享网络管理和运营。例如在面向通用人工智能方面,可信数网将基于大模型服务(MaaS)节点,在兼容多样化模型的同时为城市级或区域级提供可信安全的大模型能力,实现智能对话和图文生成等功能,并将大模型能力提供给中小型机构,降低应用成本。
可信数网的落地建设我们将联合行业各方采用循序渐进的步骤逐步推进。从依托可信数网测试床到共建枢纽节点或顶级节点,将逐步落实其可信数据流通基础设施的使命,赋能多种应用场景。
首先,中国信通院联合行业多家单位共同建设了可信数网测试床,服务于可信数网的建设与运行过程中的准入、审查与监控。然后,基于可信数网测试床和跨平台互联互通试点项目,联合行业各方共同建设实验网,进一步验证数据流通服务能力和网络互联互通能力,夯实可信数网建设基础。最后,在实验网的基础上,将已验证和规范的各种数据流通服务能力拓展到真实生产业务场景,满足应用需求。其中枢纽节点由行业龙头企业或行业内多家企业协作共建,也可以由各地方政府统一建设。顶级节点由区域性或国家级部门组织建设。未来,我们将广泛邀请产业界各方共同参与可信数网的建设落地,加快推动数据要素市场和全国统一大市场!
可信数网(TDN)测试床
为了实现可信数网互信、互认、互联的目标,中国信通院联合行业内多家单位共同建设了可信数网测试床。参考TDN的功能框架设计了多个功能层级的十余项测试功能,目前已完成了部分关键能力的建设。
安全检测能力方面,包含平台漏洞检测、密码安全检测和算法安全检测。其中,算法安全检测模块中创新的引入了算法一致性与算法脆弱性检测功能,借助通信报文信息、算法风险库、攻击演示程序等内容辅助检测,目前已支持部分经典MPC和FL算法协议,未来仍将依托联盟生态持续扩展完善。
性能检测能力方面,通过发布典型流通算法benchmark为数网中的应用需求方选择符合其场景需求的算法提供了指导与帮助;在多计算场景性能测试支持能力上补充了现有性能测试工具、平台在数据流通应用场景上的不足;通过对资源占用情况、任务处理效率进行实时记录,实现了多维度性能监控功能,为可信数网稳定运行提供了辅助支撑。
可信执行环境(TEE)借助其对数据机密性、数据完整性、代码完整性等方面的保护能力,为数网中的节点、网络可信提供了技术支撑。然而,TEE的安全能力是有底层硬件及密码机制实现,上层应用难以感知,需要借助远程证明来验证计算环境安全以及可信程序完整性等。基于此背景,测试床中结合数网架构设计并提供了自治化和第三方两种可信认证方案,根据实际场景需求灵活选择,为数网提供可信认证服务,维护数网节点、网络的可信属性。
未来,测试床一方面将服务于可信数网的建设与运行过程中的准入、审查与监控,另一方面也能够为行业内更多技术提供方、应用需求方提供一系列定制化测试服务,帮助企业提升数据流通技术、产品以及应用能力。