专家精彩发言 | 郜恒骏:样本及数据驱动临床转化新范式——20年的探索
2025年全球数商大会的 “可信数据流通赋能生命健康产业新未来” 论坛上,生物芯片上海国家工程研究中心主任郜恒骏教授的线上分享,为在场者勾勒出一幅跨越20年的临床转化创新图景。从生物样本库的标准化建设到可信数据空间的构建,从幽门螺杆菌诊疗方案的突破到AI大模型的落地应用,他提出的“CBDTM临床转化新范式”,正以“需求—样本—数据—转化—患者”为核心链条,破解基础研究与临床应用脱节的行业痛点,为生命健康领域的新质生产力发展提供了坚实路径。
01 “高标准的生物样本才会有高质量的数据和产品。”郜恒骏主任指出这是中心在24年探索中坚守的重要准则。2001年,生物芯片上海国家工程研究中心在国家发改委支持下成立,从最初打造十大平台起步,便将生物样本的标准化建设放在首位。彼时,中国生物样本库普遍存在质量参差不齐、管理缺乏规范的问题,严重制约了生物医药创新。2007年,郜恒骏教授的团队向政府提出规范建议,推动2009年国家级生物样本领域行业组织中国医药生物技术协会组织生物样本库分会(BBCMBA)成立,从此开启了中国生物样本标准化的系统性建设。在此基础上,2015年又牵头推动全国生物样本标准化技术委员会(SAC/TC559)的创立。 从发布首个肿瘤生物样本库行业标准、ISBER最佳实践(译)、CACA生物样本库指南,到作为共同召集人组织制定首个生物样本库国际标准(ISO20387),再到推出首个国家标准(GB/T37864-2019),至今已经发布25项国家标准。同时推动首个生物样本国家认可准则并得到国际认可。中国生物样本库实现了从“数量大国”到“质量强国”的转型。上海生物样本库作为标杆,以1500万份的存储能力、标准化、专业化、自动化、智能化与数据化“五化”建设标准被Nature杂志报道,更带动全国31家机构通过ISO20387国际认可。在此期间走进100多家医院,为600多家医院提供质量评估,正是这种“啃硬骨头”的坚守,让生物样本从“闲置资源”成为临床转化的“源头活水”。 02 CBDTM范式:打通从样本到商品的闭环 在标准化样本库基础上,郜恒骏主任带领团队凝聚形成了独具特色的CBDTM临床转化新范式,即以患者需求(C)为导向,整合生物样本资源中心(B)、组学大数据中心(D)、转化研究中心(T)、精准医疗中心(M)的全链条体系,这一范式的核心突破,打破了基础研究、临床诊疗与产业转化之间的壁垒,实现了“样本—数据—产品—商品”的价值闭环。 郜恒骏主任首先以常见的疾病幽门螺杆菌介绍了CBDTM范式的应用场景。面对中国50%人口感染、胃癌发病率居高不下的困境,郜恒骏主任及团队联合全国20个分中心、65家协作单位,构建4.5万份耐药菌株库和专病队列库。通过全基因组测序找到中国人专属耐药基因位点,开发出两款三类医疗器械试剂盒,将难治性患者根除率提升至90%以上,相关方案更被纳入国际指南。在新冠疫情中,这一范式再次发力,3000多份样本支撑的抗体试剂盒(上海唯一)、抗原试剂盒(上海第一)应急审批产品服务20多个国家,完美诠释了“需求牵引—样本支撑—数据赋能—产品落地”的转化逻辑。 同时在肿瘤领域,26万份高标准样本支撑开发的613种组织芯片产品,为1.14万名专家提供研究支持,催生6336个新标记物和3116篇高水平论文,构建的28种肿瘤原位多组学数据库,规模远超美国TCGA数据,成功发布后有望摆脱了相关研究“卡脖子”困境。如今,这一范式已在全国40多家医院落地,从糖尿病到肝癌,专病CBDTM基地的建设正在让更多疾病诊疗受益。 03 数据与AI:激活新质生产力的双引擎 随着数据成为国家战略生产要素,芯超数据应运而生,在郜恒骏主任的带领下将CBDTM范式升级为“数据驱动的新范式”,以可信数据空间和AI技术为双翼,开启了数据资产化的新征程。2024年,他们牵头创建中国首个重大疾病数据创新与交易中心,一年多时间创造近10个“行业首个”:首批重大疾病数据产品挂牌、首个医疗数据产品批量挂牌、首个幽门螺杆菌可信数据空间发布……其中幽门螺杆菌可信数据空间更入选“数字上海”十大场景榜首。 郜恒骏主任用“共享数据小区”生动诠释可信数据空间的价值:医院数据“不出域”却“可用不可见”,通过区块链、隐私计算技术实现权限可控、全程追溯。这种模式既解决了医院“怕泄露”的顾虑,又满足了研究机构和AI企业的数据源需求,让医疗数据从“不敢用”“不能用”变为“安全用”“高效用”。同时作为核心单位,芯超数据牵头制定的首份可信数据空间国家标准,更让这一“基础设施”从试点走向规模化应用。 AI技术的融入让CBDTM范式焕发新活力。基于33年幽门螺杆菌研究成果构建的垂直大模型,不仅能实现中英双语乃至方言交互,回答问题的全面性已超越真人,成为医生、患者全流程管理的智能助手。郜恒骏主任强调在AI“算法、算力、数据"三驾马车中数据是核心,正是依托高质量样本数据,AI才能从“技术概念”变为“临床工具”。如今,从数字真人问诊到研究方案智能设计,AI正让精准医疗触手可及。 “不忘初心、牢记使命、长期坚守,砥砺前行,方得始终。”这是陈竺院士对团队的题词,也是郜恒骏主任24年坚守的写照。从1992年投身幽门螺杆菌研究,到如今构建覆盖东盟的生物样本数据转化联盟,他带领团队完成了从“生物样本库”到“生物银行”的认知升级——原始样本与数据如同“银行本金”不可交易,而加工后的标准化数据产品则是“超市商品”,可实现合规流通与价值变现。 未来,推动生物样本库从“存储中心”向“数据中心”转型,构建“以健康为中心”的全流程管理体系,将是团队的核心方向。当高标准样本遇上可信数据空间,再经AI技术赋能,CBDTM范式不仅能破解临床转化难题,更能为健康中国战略提供坚实支撑。正如郜恒骏主任所言,拥抱数据、拥抱AI、拥抱CBDTM,就是拥抱生命健康领域的未来。 讲者简介 郜恒骏主任 · 教授、主任医师、博导 · 生物芯片上海国家工程研究中心、上海分子医学工程技术研究中心、上海数据交易所重大疾病数据行业创新中心主任 · 同济大学医学院消化疾病研究所所长、上海交通大学医学院附属第一人民医院临床研究院执行院长 · 全国生物样本标准化技术委员会、中国医药生物技术协会生物样本库分会、中国抗癌协会学研转化专委会与上海市研究型医院学会临床转化 CBDTM 专委会主任委员 来源 | 2025年全球数商大会“可信数据流通赋能生命健康产业新未来”论坛 END