病理特征数据结构文档

基于肾活检病理报告提取的结构化数据格式

API 特别说明

由于计算资源限制,本API采用Qwen系统提供的embedding服务,而非本地Qwen模型。

重要差异: 最大向量长度为 2048 tokens,而非本地Qwen模型的4096 tokens。

因此,机器学习模型是基于 2048×4 向量 重新训练的新模型。

向量化配置

总特征向量维度为 2048 × 4 = 8192 维

原始配置

模型: 本地Qwen模型

向量长度: 4096 tokens

总维度: 4096 × 4 = 16384 维

当前配置

模型: Qwen系统embedding服务

向量长度: 2048 tokens

总维度: 2048 × 4 = 8192 维

数据结构格式

MEST_C 评分

评分系统
字段名 数据类型 描述
M int M分项评分 (0-1)
E int E分项评分 (0-1)
S int S分项评分 (0-1)
T int T分项评分 (0-1)
C int C分项评分 (0-1)

肾小球病变

主要病变
字段名 数据类型 描述
total_count int 肾小球总数
global_sclerosis_ratio float 全球硬化比例(已转换为小数)
segmental_sclerosis_count int 节段性硬化数量
cellular_proliferation_present bool 是否存在细胞增生
cellular_crescents_ratio float 细胞性新月体比例(已转换为小数)
mesangial_hypercellularity_degree str 系膜细胞增生程度(无/轻度/中度/重度)
capillary_loop_abnormalities bool 是否存在毛细血管袢异常

肾小管间质病变

主要病变
字段名 数据类型 描述
tubular_atrophy_degree str 肾小管萎缩程度(无/轻度/中度/重度)
tubular_atrophy_percentage float 肾小管萎缩比例(已转换为小数)
interstitial_fibrosis_degree str 间质纤维化程度
interstitial_fibrosis_percentage float 间质纤维化比例
inflammatory_infiltration_degree str 炎性浸润程度
inflammatory_infiltration_distribution str 炎性浸润分布

血管病变

次要病变
字段名 数据类型 描述
intimal_fibrosis_present bool 是否存在内膜纤维化
intimal_fibrosis_severity str 内膜纤维化严重程度
arteriolosclerosis_present bool 是否存在小动脉硬化

免疫荧光

主要病变
字段名 数据类型 描述
IgA_intensity str IgA沉积强度(如"2-3+")
IgA_distribution str IgA分布模式
IgG_present bool 是否存在IgG沉积
IgG_intensity str IgG沉积强度
IgM_present bool 是否存在IgM沉积
IgM_intensity str IgM沉积强度
C3_present bool 是否存在C3沉积
C3_intensity str C3沉积强度
C1q_present bool 是否存在C1q沉积
fibrinogen_present bool 是否存在纤维蛋白原沉积

关键病理特征

文本特征
字段名 数据类型 描述
key_pathology_features list 关键病理特征列表(字符串数组),后续会进行向量化处理

数据预处理规则