数据采购需求 急诊抢救全链条数据
急诊
一、疾病:不限,近5年 二、例数: 1.内科疾病≥ 10000例 2.外科疾病≥ 10000例 3.连续病例 三、院前信息 呼叫接通时间戳、调度派车时间戳、救护车出发时间戳、救护车到达现场时间戳、主诉类别、现场首次接触患者时间戳、离开现场时间戳、到达医院时间戳、首次生命体征记录、持续生命体征数据流链接、初步印象/诊断、关键评分、关键干预措施等 四、患者基本信息 性别、出生日期、吸烟史、饮酒史、疾病史等 五、诊疗信息 1.基本信息:首诊医生接诊时间戳、入院科室、急诊初步诊断、急诊最终诊断等 2.影像检查:影像检查类型、影像检查时间、影像报告摘要等 3.实验室检验:血常规、肝功能、肾功能、电解质等项目,含项目名称、结果、参考范围、采样时间、检测时间。 4.心电图(适用时) 5.治疗信息:治疗方式、治疗方案等。 6.出院状态 六、随访信息 随访方式、随访时间点、随访内容(生存状态、功能状态、生活质量、再住院情况、主要不良事件等)。
需求场景:AI模型
面议
数据采购需求 医患对话语音数据
医患对话 语音
数据规模:10万小时 采样率:44.1 / 48 kHz 合规性:已获得医患双方完整授权
需求场景:AI模型
面议
数据采购需求 胃镜影像数据
胃镜 影像
一、疾病/异常 胃炎、胃息肉、胃溃疡、胃癌、高级别上皮内瘤变、低级别上皮内瘤变、胃黏膜下隆起、胃部未见异常、食管炎、食管癌、食管黏膜下隆起、十二指肠溃疡、十二指肠黏膜下隆起,具体见附件。 二、例数:见附件 三、影像数据 1. 数据标准: (1) 原始胃镜动态视频(完整记录从食管至十二指肠的检查过程),或从中截取的高质量静态图像序列(DICOM或同等清晰度格式)。 (2) 若为静态图像,每个病例的有效图片数量应不少于40张,需全面覆盖上消化道主要解剖部位(食管、贲门、胃体、胃窦、幽门、十二指肠球部及降部)以及发现的任何病灶的不同角度与模式(白光、特殊光NBI)。 2. 数据排除标准: 为确保数据质量与可用性,以下情况的数据应予以排除: (1) 完整性不足:缺少内镜诊断报告,或静态图像数量少于40张且无法提供完整视频的病例。 (2) 解剖结构异常:有胃部全切或部分切除手术史的病例,因其解剖结构发生根本性改变,不利于模型学习标准解剖下的病变特征。 (3) 质量不合格:影像质量差,存在严重模糊、伪影、视野不清或病灶遮挡,影响诊断判断的病例。 3. 标注与标签要求 标注与标签明确疾病类型,应提供病灶区域的边界框或像素级分割掩码,特别是在静态图像上。 四、报告 1. 胃镜检测报告: (1) 病灶信息:精确解剖位置、大小、形态(如息肉、溃疡、隆起、凹陷)、表面结构、边界、质地等。 (2) 内镜诊断:对病变的初步判断(如慢性胃炎、胃溃疡、高级别上皮内瘤变怀疑、早癌等)。 2. 病理报告(如有):病理报告需明确病理类型(如慢性炎、萎缩、肠化、低/高级别上皮内瘤变、腺癌等)、分化程度、浸润深度(如有)等关键信息。 五、数据多样性要求 1. 数据来源应具有广泛性,尽量来源于多中心、多品牌内镜设备(如奥林巴斯、富士等)。 2. 病例需涵盖不同地区、性别、年龄段的患者,并包含上消化道各类常见病、癌前病变及恶性肿瘤,确保数据具备临床代表性。 3. 应包含不同病程阶段的病例(从正常黏膜、炎症、癌前病变到早癌、进展期癌)。 六、脱敏要求 必须对数据进行彻底脱敏处理,去除所有可直接或间接识别个人身份的信息,仅保留与医学研究相关的参数与标签。
需求场景:AI模型
面议
数据采购需求 乳腺钼靶影像数据
乳腺 钼靶
一、异常类型 乳腺未见异常、肿块、结构扭曲、不对称致密、局灶性不对称、淋巴结异常、乳腺填充、乳腺皮肤增厚、乳头回缩。 二、例数:见附件 三、影像数据: 1. 序列需求: (1) 检查类型:必须为符合临床标准的双侧乳腺DBT检查。 (2) 投照体位:每例检查应包含双侧乳腺的两个标准投照位头足位(CC)和内外斜位(MLO)的薄层重建序列和对应的二维乳腺钼靶摄影。 (3) 图像格式:原始DICOM格式,保留完整的DICOM元数据,包括但不限于扫描参数(kV、mAs)、层厚、重建算法(重建核)、设备型号等。 2. 图像质量需求: (1) 分辨率:单帧断层图像分辨率不低于512 x 512像素。 (2) 图像质量:影像应清晰,满足诊断需求。需排除存在严重运动伪影、金属伪影或其他技术缺陷以致影响影像诊断与病灶判读的病例。 (3) 病灶显示:图像应能清晰呈现目标病灶的关键影像特征(如边缘、形态、密度等)。 3. 数据多样性需求: (1) 设备来源(多中心/多品牌):数据应来源于多个医疗中心,并覆盖至少3个不同设备制造商(如Hologic, GE Healthcare, Siemens Healthineers等)的至少5种不同设备型号,以确保算法泛化能力。 (2) 人群代表性:患者人群应涵盖不同地区、性别与年龄分布,具备流行病学代表性,能反映真实的临床人群特征。 4. 标注需求: (1) 分类标签:明确标注病种名称(如钙化、局灶性不对称等)及对应的BI-RADS分级。 (2) 分割掩码:对可测量病灶,需提供像素级的分割掩码,精确勾勒病灶轮廓。 (3) 标准规则:对于钙化病变,需标注在二维影像上,局灶性不对称、结构扭曲、不对称致密、淋巴结异常需要在三维重建序列上逐层标注。 四、报告: 1. 影像报告:每例DBT影像数据必须配套一份完整的放射科诊断报告,应包含病灶位置(侧别、象限/钟点位置)、大小(三维测量)、形态(肿块、不对称、结构扭曲等)、密度、分布范围等标准化描述。 2 .BI-RADS分级:必须提供最终的BI-RADS评估分级(0-6级)。 3. 病理报告:包含送检组织的来源部位、细胞类型、病变性质、肿瘤大小、分化程度等关键信息。 五、脱敏要求 必须对数据进行彻底脱敏处理,去除所有可直接或间接识别个人身份的信息,仅保留与医学研究相关的参数与标签。
需求场景:AI模型
面议
数据采购需求 颅脑MRI影像数据
颅脑 MRI
一、疾病 未见异常、脑出血、脑梗塞、胶质瘤、脑膜瘤、脑转移瘤、血管瘤、垂体瘤、听神经瘤、三叉神经瘤 二、例数:每种疾病各2000例 三、影像数据: 1.序列需求: (1)除垂体瘤外其他疾病必须包含序列: a. 轴位:T1WI、T2WI、T2Flair、DWI、ADC、T1WI+C (2)垂体瘤必须包含序列: a. 矢状位:T1WI、T2WI、T1WI+C b. 冠状位:T1WI、T2WI、T1WI+C (3)其他序列如SWI、DTI、3DCiss等,如有请一并提供。 2.参数要求 (1)影像采集设备线圈要求:头线圈或头颈联合线圈。 (2)影像采集设备磁场强度要求:≥1T。 (3)影像层厚要求:5mm-8mm。 (4)影像层间隔要求:≤层厚×30%。 (5)矩阵:≥256×192。 3.标注与标签要求 标注与标签明确疾病类型,应提供病灶区域的边界框或像素级分割掩码。 四、报告 1.影像报告:包含病灶的部位、形态特征、分期及严重程度评估等关键信息。 2.病理报告(如有):包含送检组织的来源部位、细胞类型、病变性质、分化程度等关键信息。 五、数据多样性要求 1.设备来源:数据应来源于多个医疗中心,并覆盖至少多家设备制造商,以确保算法泛化能力。 2.人群代表性:患者人群应涵盖不同地区、性别与年龄分布,具备流行病学代表性,能反映真实的临床人群特征。 六、脱敏要求 必须对数据进行彻底脱敏处理,去除所有可直接或间接识别个人身份的信息,仅保留与医学研究相关的参数与标签。
需求场景:AI模型
面议
数据采购需求 上腹部CT影像数据
上腹部 CT 脏器
一、疾病 肝癌、肝脏血管瘤、胆囊癌、胰腺癌、胰腺囊腺瘤、脾脏血管瘤、脾脏淋巴瘤、肾上腺癌、肾癌、淋巴瘤、淋巴结反增生 二、例数:每种疾病各2000例 三、影像数据: 1.DICOM数据标准:矩阵分辨率 ≥ 512×512原始DICOM格式,保留完整元数据(扫描参数、层厚、重建核等) 2.序列要求: (1)上腹部平扫CT: a. 要求包含完整的肝脏,胆囊,肾上腺,肾脏,胰腺,脾脏等器官。 b. 以1.25mm薄层CT为主(占比80%左右),其余薄层(如0.625mm)CT作为数据多样性补充。 c. 以GE 256排CT为主(占比80%),其余厂商不同扫描设备作为数据多样性补充。 d. 不包含严重运动伪影与金属伪影 (2)同一患者上腹部增强增强CT: a. 与平扫CT要求相同。 b. 同一患者平扫与增强序列拍摄时间间隔小于一周。 3.标注内容要求:再平扫CT上完成标注,标注与标签明确疾病类型,应提供病灶区域的边界框或像素级分割掩码。 四、报告 1.影像报告:包含病灶的部位、形态特征、病理类型、分期及严重程度评估等关键信息。 2.病理报告:包含送检组织的来源部位、细胞类型、病变性质、肿瘤大小、分化程度等关键信息。 五、数据多样性要求 每类病种应覆盖不同年龄、性别、病程阶段、分级、分类、分期、病社大小等。 六、脱敏要求 必须对数据进行彻底脱敏处理,去除所有可直接或间接识别个人身份的信息,仅保留与医学研究相关的参数与标签。
需求场景:AI模型
面议
数据采购需求 晚期实体瘤MRD诊疗数据
实体瘤 MRD
一、病例 至少1000例,中位随访时间至少2年。 二、患者基本信息 性别、出生日期、确诊年龄、吸烟史、饮酒史、肿瘤家族史、疾病史、合并症等。 三、疾病与治疗史 1.影像检查:影像检查类型、影像检查时间、影像报告摘要。 2.病理诊断:肿瘤类型、原发部位、诊断日期、初始分期(AJCC/TNM)、远处转移部位、肿瘤大小、切缘状态等。 3.实验室检验:血常规、肝功能、肾功能、肿瘤标志物等项目,含项目名称、结果、参考范围。 4.治疗信息:是否接受新辅助治疗、新辅助治疗方案、手术日期、手术类型(如根治性切除、姑息性切除等)、辅助治疗(化疗/放疗/靶向/免疫治疗,方案、周期、起止时间)等。 四、分子检测信息 检测日期、检测平台、样本类型、融合基因、变异名称(含基因名、转录本)、变异丰度、TMB、MSI、MMR、PDL1克隆号、PDL1表达、MSI、MMR等。 五、MRD检测信息 MRD检测时间、样本类型、检测方法、检测灵敏度、MRD状态、检出变异、MRD丰度、基线肿瘤组织突变谱等。 六、随访与结局信息 1.实验室检查:包括肿瘤标志物、分子检测、病理检查等。 2.治疗信息 3.影像检查:影像检查类型、影像检查时间、影像报告摘要、影像学评估结果。 4.结局信息:复发/进展日期、复发部位、生存状态、死亡时间、死亡原因、无病生存期、总生存期。 七、原始数据 影像数据:确诊手术前、每次随访 MRD数据
需求场景:疾病研究
面议
数据采购需求 系统性红斑狼疮数据集
系统性红斑狼疮 预后 AI模型
1.数量:至少2000例 2.数据内容 1)一般信息:性别、出生日期、民族、家族史(自身免疫病)、吸烟史、饮酒史。 2)诊断信息:初诊年龄、SLE确诊日期、首发症状 3)实验室检验:ANA、dsDNA抗体、ENA谱(抗Sm,抗RNP,抗SSA,抗SSB等)、补体C3、C4、抗心磷脂抗体、狼疮抗凝物、抗β2-糖蛋白I抗体、血沉、CRP、肝功能、肾功能、血常规等,含项目名称、结果、参考范围。 4)治疗情况:药品名、每日剂量、开始日期,换药/停药原因(疾病活动、副作用、缓解后减停、经济原因等),治疗依从性(良好、一般、差)。 5)并发症与合并症(随访更新) 6)器官系统受累情况(随访更新) 7)疾病活动度评估(随访更新) 8)随访与结局(随访更新) 随访信息:随访编号、随访时间、随访状态(仍在随访、失访、死亡) 死亡信息(如发生):死亡日期,死亡原因(SLE相关、感染、心血管事件、其它)
需求场景:疾病研究
面议