一文速通:可信数据空间从哪来?

2024-12-16 0
近期,国家数据局多次发文聚焦可信数据空间建设,并出台了一系列相关政策与规划,并引发了各界广泛关注。可信数据空间发展行动计划(2024—2028年)首次针对可信数据空间进行前瞻性系统布局,计划到 2028 年建成100个以上可信数据空间。“可信数据空间” 作为数字经济时代的关键基础设施,旨在构建一个安全、可靠、可控的数据交互环境。其核心在于通过一系列先进技术手段,如加密技术确保数据传输与存储的保密性,区块链技术保障数据的真实性、不可篡改和可追溯性,隐私计算技术实现数据的 “可用不可见”,以及严格的身份认证与授权机制控制数据访问权限等,确保数据在不同主体间流通时的安全性与可信度。为了让大家深入理解这一重要概念,我们特别整理了几期专题文章,全面剖析可信数据空间的相关内容,今天将带来第一期:“可信数据空间从哪来”带领读者深入了解这一领域的演进脉络。

01 欧盟数字战略法案与欧洲共同数据空间

数据可信空间的概念最早可以追溯到欧盟。2014年至2016 年间,弗劳恩霍夫协会与工业4.0标准化委员会合作提出了 “数据空间” 的概念,其构想得到了德国联邦经济和能源部的初始研发资金支持。随着时间的推移,数据空间理念逐渐从德国扩展到整个欧洲。2020年,《欧洲数据战略》明确提出建设9大数据空间,涵盖制造业、绿色化、交通、健康、金融、能源、农业、公共管理、技能就业等领域,至2022年,数据空间类别增至17类,新增法律、科学、安全执法、媒体、文化文物、旅游、建筑、智慧社区等领域。

“欧洲共同数据空间”指的是跨领域大规模数据空间(以盖亚-X为代表),以及欧洲委员会规定的9个领域(产业、环保、交通、保健、金融、能源、农业、行政、技能)分别构筑数据空间的总称。盖亚-X的作用是与各领域的数据空间相互连接。其中,在旨在促进交通系统(包括汽车和其他客货运输手段在内)数字化的交通数据空间中,Catena-X把汽车供应链整体进行数字化,是盖亚-X的构成要素之一

此外,欧盟的数据相关法案不断推进,以决定各领域产业数据的合作方式。2022年11月实施了《数字市场法》和《数字服务法》;2022年2月提出《数据法》,规定了产业数据的提供者和使用者、第三者之间对数据访问和利用的权利义务关系,可定位为规定盖亚-X等体系和产业数据协作方法的前提的基本法。

02 欧洲共同数据空间的代表: “盖亚-X ”

盖亚-X是以希腊神话中的大地女神“盖亚”命名,是欧洲的跨领域、分布式开放数据平台,在欧洲通用数据空间中被定位为最综合的数据空间旨在跨领域强化各领域的产业数据合作,提升欧洲产业的竞争力。为了实现这一点,盖亚-X将上文提到的9个领域的产业数据连接起来,实现跨领域的数据协作,同时还对加入盖亚-X和各数据空间的主体提供连接服务。

推进该项目的主体是盖亚-X 欧洲数据和云协会 AISBL(Gaia-X European Association for Data and Cloud AISBL,在比利时注册为非营利组织,本文以下称为“盖亚-X协会”),得到了德国联邦经济和气候保护部的支持。盖亚-X协会的最高决策机构是大会,执行机构下设3个委员会。各企业参加上述委员会,对共通规格、运用规则的制定和实践等进行讨论,以确保盖亚-X的架构及各数据空间的相互运用性,并开发公开连接服务所需的开源软件。

盖亚-X起源于2019年4月德国和法国两国的倡议,并于《数据战略》公布后的2020年6月正式启动。2021年1月,以西门子、SAP、Atos等德法企业为主的22家公司设立了盖亚-X协会

03 Catena-X 汽车价值链数据协作

Catena-X是与盖亚-X连接的最早数据空间之一,目标是促进汽车价值链(Value chain)整体的数据协作该项目推进主体是以德国的汽车产业界为中心设置的联盟。Catena-X于2021年启动,计划推进平台机能和用例开发,直至2024年中期。

协作目标。Catena-X主要目的有以下几点:确保数字主权;应对强化的汽车二氧化碳排放规则和资源循环、供应链的尽责查证(due diligence)规定;加强汽车供应链的韧性和竞争力。

服务种类。为了实现这些目标,Catena-X为其参与企业提供了多种服务。具体包括:面向资源的循环化,对所有的参加主体提供可追溯性信息(产品中使用的材料和零件在何处及如何使用);对构成制造供应链的汽车零部件制造商提供二氧化碳排放管理服务等。

图片

图:Catena-X提供的服务一览

分布式系统架构Catena-X采用符合盖亚-X的分布式系统架构。在EDC(Eclipse Dataspace Connector,控制对数据的访问的软件)方面,只有接受服务的主体才能访问。具体如下图所示,SAP、西门子等SaaS提供主体和工厂,通过EDC直接对机器运转数据等操作数据进行协作。

图中央橙色部分所示Catena-X的中心部分,不通过操作数据,由只有控制各主体间数据协作的作用的系统构成,如门户功能、认证功能、页面注册表(登录信息管理台帐)功能等。中心部分不是数据的中介和集成地点,数据只在必要的主体上集成,以确保“数字主权”。

图片

图:Catena-X的系统架构和数据协作

Catena-X的两项关键优势与价值转化:

第一,能够提高对上述欧盟环保法规等的应对效率。例如引进二氧化碳排放管理服务,可对符合欧盟法规所需供应链上各供应商的二氧化碳排放量进行比较,从而可以高效选择供应商。

第二,以环保法规为契机进行数据协作,进而参与将其二次利用的供应链变革。进入促进数据协作的生态系统,从而能够使可信赖企业之间供应链的工序发生变革。为了使材料、零件、制造以及不同主体的工厂高效执行生产工序,各公司联合进行设计,把通过Catena-X集成的操作数据进行二次利用,在数字映射(digital twin)上高精度再现新生产线并进行虚拟验证,可省去现实世界中耗时且耗成本的验证,实现工序变革。

04 欧洲健康数据空间(EHDS)的建设
随着技术的不断进步和实践的深入推进,可信数据空间在医疗领域的应用也逐渐拓展并深化2020年,欧盟委员会在之前一系列举措的基础上,提出建设欧洲健康数据空间(EHDS)的构想。这一构想旨在构建一个更为完善的数据共享框架,以应对当时全欧盟范围健康数据共享和远程访问面临的瓶颈问题,如数据流通不畅、利用不足等。2022年5月,欧盟委员会发布《欧洲健康数据空间条例(草案)》,对患者数据权利、成员国机构职责、数据二次使用规则和基础设施等方面做出详细规定。
EHDS的关键优势与价值转化:

提升医疗服务质量:对于患者而言,EHDS 将赋予个人更大的数据控制权,使患者能够更方便地访问和共享自己的健康数据,从而更好地参与自身医疗保健决策。医护专业人员可跨境访问患者病史,增加诊断和治疗决策的证据基础,避免重复检查,提高医疗服务的准确性和效率,为患者提供更个性化、精准的医疗服务。

推动医学研究创新:研究人员能够在受信任和安全的框架内更直接地获取大量高质量数据,用于医学研究和创新。这些数据将有助于深入了解疾病机制、开发新的治疗方法和药物,推动医学科学的进步,为改善公共健康提供更多可能。

优化政策制定与监管:监管机构和政策制定者可更容易获取健康数据,从而制定更科学合理的医疗政策,优化医疗资源配置,提高医疗保健系统的运行效率和公平性,确保医疗服务的质量和可及性,促进整个医疗体系的可持续发展。

促进产业发展:行业将受益于统一标准和规范的电子健康记录系统市场,推动电子健康数据的更大可用性。这将促进创新医药产品和设备的研发生产,鼓励企业开发使用人工智能技术的新设备,提升整个医疗健康产业的竞争力,推动产业创新升级,为经济增长创造新动力。


欧洲可信数据空间的发展对全球数据治理产生了深远影响。其先进经验和实践模式为其他国家和地区提供了重要参考,推动了全球范围内对数据可信空间的关注和探索自党的十九届四中全会首次提出将数据作为生产要素后,党中央、国务院高度重视数据要素市场培育工作。可信数据空间作为实现数据资源共享共用的一种数据流通利用基础设施,受到各方重视。在今年9月,由上海数交所联合生物芯片上海国家工程研究中心、大数据流通与交易技术国家工程实验室、芯超数据牵头组织国内医疗机构、药企、体外诊断企业、健康管理服务机构等多类主体共同建设的重大疾病行业创新中心幽门螺杆菌数据空间,是国内首个行业数据空间,依托数据空间实现数据安全提供,推动数据在医疗、科研、药物研发等领域的多场景应用、多主体复用,更好发挥数据要素乘数效应

展望未来,通过技术创新的持续赋能、应用场景的深度拓展以及对各类挑战的有效应对,可信数据空间有望构建起一个更加完善、高效、安全的数据生态系统,为我国数字经济的高质量发展提供强大助力,推动各行业在数字化浪潮中实现创新升级与可持续发展。我们应密切关注其发展动态,积极参与其中,共同把握这一数字时代的重要发展机遇

END