背景:神经递质障碍(NTDs)的体征和症状范围从早发性严重神经表现(常伴有发育迟缓)到晚发性中度运动障碍[1]。及时诊断仍然具有挑战性。
方法:为了开发SQL算法,我们分析了来自医院发作统计(HES)数据库的假名患者记录,该数据库涵盖了2010年4月至2020年5月间英格兰所有国家卫生服务住院患者。提取的数据包括诊断、临床程序、临床专科和收费代码。提取有NTD诊断的记录(国际疾病和相关健康问题统计分类第10版修订代码E708-E709)。临床代码按频率排序,并使用专家临床输入,根据与神经节障碍的关联程度在1到5之间打分。为了帮助描述潜在的未诊断患者,那些总得分≥53的记录被标记为潜在的NTDs,然后使用5个最常见的代码作为进一步的选择标准。
结果:在10年的研究期间,共有5500万患者被英国医院收治;加权评分≥53的记录有1972份。这些记录中最常见的编码是小儿神经学,其次是癫痫、肌张力障碍、脑瘫和肌张力减退。共1469例患者,构成病例回顾人群,评分≥53,参加儿科神经病学,诊断为癫痫,诊断为肌张力障碍、脑瘫或肌张力减退。
结论:一种创新的SQL编码方法,使用去识别的医院记录来分析潜在的NTDs患者,以便进一步测试。这源自医院患者管理系统(PAS),对缩短确诊时间和实现早期干预具有重要意义。我们的方法可以应用于其他罕见疾病或诊断条件下。
神经递质障碍,芳香l -氨基酸脱羧酶,结构化(小写)查询语言,诊断
•一般人群中神经递质障碍(NTDs)的发生率仍然未知。
•由于非特异性症状和缺乏诊断这些疾病所需的代谢物测量,及时诊断患者仍然具有挑战性。
•准确的诊断很重要,因为一些NTDs很容易治疗。
•开发了一种创新的SQL算法来查询医院的患者管理系统(PAS),以配置潜在的NTDs患者,并标记他们以供临床医生进一步测试。该算法是根据HES数据分析和专家临床输入测试设计的。
•这有可能缩短确诊时间,实现早期干预。
•所使用的方法可适用于检测其他罕见疾病或在诊断条件下
神经递质障碍(NTDs)是由神经递质代谢和转运的遗传缺陷引起的,包括儿茶酚胺、血清素、生物terin、甘氨酸、吡哆辛和伽马氨基丁酸代谢[2]缺陷。体征和症状通常出现在儿童早期,包括张力减退、运动障碍、自主调节障碍和发育障碍[2]。一般人群中热带病的发病率仍然未知。在加拿大一个单一中心进行的一项回顾性队列研究报告称,在患有全身性发育迟缓、新生儿张力低下、新生儿癫痫、癫痫和运动障碍的患者中,4%的遗传性NTDs患病率,这些患者接受脑脊液(CSF)神经递质测量以诊断[2]。测量脑脊液神经递质代谢物(例如,高香草酸[HVA], 5-羟基吲哚乙酸[5-HIAA], 3- o -甲基多巴[3- omd],四氢生物terin,生物terin,和新opterin)用于确定儿茶酚胺,血清素和生物terin代谢障碍,通过候选基因[3]的直接测序确认诊断。
芳香l -氨基酸脱羧酶缺乏症(AADC-d)是一种NTD,其特征是儿茶酚胺、多巴胺、肾上腺素和去甲肾上腺素以及血清素的合成受损,迄今为止已有135多名患者在医学文献[4]中被描述。东亚地区发现了一种始祖突变,其中台湾AADC-d患病率最高(1:32 000);然而,这种疾病并不专属于亚裔,也会发生在其他血统的个体中[5,6]。大多数患者出现在婴儿期早期,具有严重的表型,包括早发性张力减退、视力危机、上睑下垂、肌张力障碍、运动障碍、发育障碍和自主神经功能障碍;然而,轻微的疾病可以发生[7]。AADC-d患者脑脊液中常出现低水平的5- hiaa和HVA,高浓度的3-OMD、L-Dopa和5- oh色氨酸(5- htp)[5,7]。AADC-d可在绝大多数[7]患者中得到基因证实。
NTDs患者的及时诊断仍然具有挑战性,因为非特异性的症状可能与其他神经综合征的症状重叠,例如脑瘫和癫痫性脑病的[1]。诊断不足也可能是由于缺乏腰椎穿刺(LPs)和缺乏可用的代谢物测量,以诊断这些疾病[2]。准确的诊断是很重要的,因为一些NTDs是很容易治疗的。误诊或延误诊断可能导致患者病情不可逆转的恶化,并给医疗保健系统带来重大成本[9]。在加拿大的这项研究中,5.3%接受LP测量CSF HVA和5-HIAA的患者有一种可治疗的遗传代谢疾病,短期神经发育结果良好,强调了早期和特异性诊断[2]的重要性。补充缺乏的神经递质前体或修复内源性酶合成缺乏的辅因子是治疗NTDs[1]的基础。AADC-d的治疗策略常常因中心而异,患者的治疗反应往往令人失望;然而,一小部分AADC-d患者对L-Dopa或多巴胺激动剂[2]反应良好。
本研究旨在开发基于结构化语言查询(SQL)的方法,利用来自PAS的电子健康记录数据,在英国各医院中识别应接受适当诊断检查的潜在NTDs/AADC-d患者。
该队列来自医院发作统计(HES),化名电子医疗记录来自英国所有国家卫生服务(NHS)住院和门诊住院患者[10]。使用国际疾病和相关健康问题统计分类第10版(ICD-10)编码[11]记录,每一次HES发作最多有20例诊断。使用OPCS干预措施和程序分类和医疗保健资源组(HRG)代码记录程序,以对消耗类似资源水平的患者事件进行分组。这些数据被用于构建SQL选择查询,供临床医生通过安全在线门户在本地使用。这些数据仅供临床医生和临床综述使用。本研究不需要伦理和研究批准,因为它是允许重复使用医院发作统计数据和患者识别信息没有被利用。
从HES检索了2010年4月至2020年5月之间的记录。数据包括诊断、临床程序、临床专科和关税代码。从以下患者队列中提取数据并用于开发SQL SELECT查询:
E708-709队列:包括在10年研究期间入院的ICD-10编码为E708或E709的患者的记录。在ICD-10中没有针对NTDs/AADC-d的特定编码,有NTDs/ aadc的患者很可能在E708(“芳香氨基酸代谢的其他障碍”)或E709(“芳香氨基酸代谢障碍,未指明”)编码下被捕获。
HES总队列:包括研究期间在英国所有医院住院的所有患者的记录。
通过有针对性的文献综述和临床专家鉴定了两篇关键论文,并筛选了与NTDs/AADC-d相关的重要临床特征的内容[7,12]。首先提取关键特征的初始列表,随后由两名儿科神经学家和两名儿科医生检查,以确保捕获与NTD患者相关的所有相关体征/症状、程序和临床专业。由此产生的代码列表(n = 115)构成了一个触发点表,其中包括潜在的NTD患者在诊断前可能经历的最相关的事件(完整列表见在线补充的表1)。商定的触发点的最终列表被翻译成HES术语(ICD-10、OPCS和HRG代码),供后续分析使用。
E708-709队列表示用于设计SQL SELECT查询的数据集。预先定义的触发点应用于该队列,以确定患者记录中至少有115个编码中的一个。在更广泛的四位数ICD-10编码中,确定了触发点的发生组合和可能的NTD/ AADC-d患者。临床专家进一步分析了这些患者记录中出现的编码组合,以评估发生NTD的可能性,并一致认为这些代表了潜在的患者概况。随后,对115个触发点代码进行了排名,并根据与神经节疾病的可能关联程度给出了1到5之间的加权分数(即,5分表示与神经节疾病的关联程度高;表1)。通过将患者记录中出现的每个触发点代码的加权得分相加,计算出包含至少一个触发点的每个患者记录的总得分。≥53分被认为是高度可能患有NTDs/AADC-d患者的合适分值。
患者、他们的家属和公众成员没有参与研究的设计或设置SQL查询的参数。
HES数据测试查询:SQL SELECT查询应用于整个HES数据库(即HES总队列),分析所有评分≥53的患者。将这些患者记录中出现的所有代码进行汇总,并按频率排序,列出了五个最常见的关键触发点。最有可能患有NTDs/AADC-d的患者,或病例回顾人群,包括那些总分≥53分和关键触发点组合的患者。该分析的输出产生了一个关键表,突出显示了不同的代码组合,特别是英格兰每个医院信托站点的预期患者数量。
在现实环境中的实现:修改了基于HES分析的SQL SELECT查询,以便在NHS信任患者管理系统(PAS)上使用。这支持跨中央信任数据库的简单搜索功能,对信任更安全,并支持治理。修改后的SQL SELECT查询在Trust内部运行,以维护患者机密性。OPEN Health或PTC Therapeutics在任何阶段均未收到患者识别信息。确定的患者名单被直接发送给相关的临床医生,由他们自行决定哪些患者可能从进一步的诊断检查中受益。
在2021年11月与药品和保健产品监管机构(MHRA)进行详细讨论后,MHRA决定SQL SELECT查询是一种通用产品,由最终用户定制,用于在HES数据库中选择患者。因此,这将不是一个医疗设备,因为SQL SELECT查询不提供决策功能。所有关于特定患者的诊断和管理的决定都由其负责的医疗保健专业人员决定。
在2010年4月至2020年5月期间,共有5500万名患者入住英国医院,其中20350,842人至少有记录中列出的115个触发点中的一个。这些患者的总加权得分在1到110之间。近四分之三(n = 14,717,481, 72.3%)的总加权评分≤3,加权评分≥53的患者有1972例,被认为可能是NTDs/AADC-d患者。评分≥53的患者记录的最常见代码是儿童神经内科,其次是癫痫、肌张力障碍、脑瘫和肌张力减退的诊断代码。
在评分≥53的1972例患者中,1822例接受了儿科神经学治疗,并被诊断为癫痫。另有1469人被诊断为肌张力障碍、脑瘫或肌张力减退;这些人构成了病例回顾人群,被认为极有可能患有NTDs/AADC-d。21个NHS信托机构被确定有≥20个潜在的NTD患者(表1)。
在研究期间,有289名HES患者的诊断代码为E708-709。SQL SELECT查询显示的1469例极有可能患有NTDs/AADC-d的患者比单独使用E708-709编码捕获的患者多80%。
到目前为止,修改后的SQL SELECT查询已经在12个NHS信托基金和健康委员会中成功运行,并确定了多达130名适合进一步临床审查的患者。
在一个获得数据的Trust中确定了7名潜在的NTDs/AADC-d患者。在病例回顾中,一名患者的症状与NTD一致,然而,作为AADC-d初始筛查的3-OMD测量没有进行。因此,该患者(n = 1/ 7,14%)可能患有AADC-d,并可根据共识指南[7]从进一步检测中获益。
我们开发了一种创新的编程语言方法,用于指示英国各地可能患有ntd /AADC-d的患者,这些患者将从进一步的诊断工作中受益。这个SQL SELECT查询可以为临床医生提供机会,通过早期的NTD检测和随后的干预来改善患者的预后。
我们注意到,在英格兰所有NHS医院中,有1469名潜在的NTDs/AADC-d患者,比有E708-709代码的患者多80%。我们的SQL SELECT查询基于体征、症状和治疗特点的概要,这比NTD诊断更直接。出现非特异性症状且难以诊断的罕见疾病,如神经管紊乱,在HES中可能被错误编码(例如作为模仿者综合征)。在对一个信托组织中确定为潜在的NTDs/AADC-d的7名患者进行进一步审查后,1名(14%)患者没有替代诊断,没有接受完整的调查,因此需要进一步检测。这证实了SQL SELECT查询是有效的,对患者管理和预后有重要意义。
基于sql的方法尚未应用于NTDs的诊断。机器学习的方法略有不同,但已成功用于其他罕见疾病的诊断[13]。机器学习算法基于样本数据构建模型,以便做出预测或决策。值得注意的是,这项研究并不是这样进行的。相反,使用基于sql的方法来管理包含实体和变量之间关系的数据并检索相关数据。
应用基于sql的方法可能比其他疾病检测方法更有优势,特别是在罕见疾病方面。由于罕见病很少发生,治疗的医生最初可能不会怀疑。此外,罕见病往往具有非特异性表现和遗传成分,可能需要专门检测,从而进一步使诊断复杂化。另一个优点是,SQL查询是在整个HES数据库上开发的,它代表了整个英格兰的人口,而不是从一个单一中心或一个地区的几个中心选择数据库,这可能会引入偏见。HES包括所有年龄的患者,尽管AADC-d的症状出现在生命早期,但诊断可能要到多年后,甚至在20岁[6]后才出现。因此,根据年龄限制数据可能会导致某些情况被遗漏。这种基于sql的方法的另一个优势是有可能选择所有患有罕见疾病(如NTDs)的患者,这对进一步研究(包括评估结果)具有重要意义。
然而,有些限制是需要考虑的。基于sql的方法可能存在偏差,包括分类错误、测量错误和数据缺失。因此,临床判断应该与这些技术的应用一起使用。编码错误可能发生在HES中;然而,数据质量已被证明在后来的年份[14]更好。进一步的工作包括进一步识别Trust数据中的潜在患者,并对这些患者进行诊断检查,以验证SQL查询。
总之,本研究中描述的方法强调了可能的NTDs/AADC-d病例,以便进一步诊断。这种基于sql的方法学可以改进临床环境中对NTDs/AADC-d的检测,从而能够更早地进行干预并改善患者的预后。我们的方法可以应用于其他罕见疾病和诊断条件下,并作为一种新的策略,以帮助患者识别。
这项工作由PTC治疗有限公司全额资助,目的是医学教育和改善患者护理。PTC Therapeutics, Ltd没有支付任何医疗保健专业人员作为该项目的一部分。
不适用。
所有作者已在www.icmje.org/coi_disclosure.pdf上完成ICMJE统一披露表,并声明:所提交的作品没有任何组织的支持;在过去三年内,与任何可能与所提交作品有利害关系的组织无经济关系;没有其他关系或活动可能影响提交的工作。
研究概念由PTC Therapeutics, Ltd设计。记录是由OPEN健康集团的哈维·沃尔什检索的。数据由哈维·沃尔什分析。手稿是由Julia Granerod博士写的。所有作者都阅读、评论并批准了手稿。
这些研究由PTC Therapeutics, Ltd资助。