标志

引用

Fox E, Mehta V, Madhu R, Wassmer E, Arora R等人(2022)开发一种基于sql的创新方法来识别潜在的神经递质障碍患者。国际J罕见疾病紊乱5:048。doi.org/10.23937/2643-4571/1710048

研究文章|vwin德赢体育网址2643 - 4571/1710048 DOI: 10.23937 /

开发一种基于sql的识别潜在神经递质障碍患者的创新方法

艾米丽·福克斯1Vishal梅塔,2, Rajesh Madhu3.,伊万杰琳沃斯默4,前腿Arora5托尼•考克斯6 *戴夫·希顿6茱莉亚Granerod6和马克兰斯1

1医疗事务,PTC治疗,吉尔福德,英国

2儿科神经学,赫尔大学教学医院NHS信托,赫尔,英国

3.神经科学,Alder Hey儿童NHS基金会信托,英国利物浦

4神经学,伯明翰妇女和儿童NHS基金会信托,伯明翰,英国

5儿科神经学,诺福克和诺威奇大学医院NHS基金会信托,诺威奇,英国

6真实世界证据,OPEN Health,马洛,英国

摘要

背景:神经递质障碍(NTDs)的体征和症状从早发性严重神经表现(常伴有发育迟缓)到晚发性中度运动障碍[1].及时诊断仍然具有挑战性。

方法:为了开发SQL算法,我们分析了来自医院发作统计(HES)数据库的假名患者记录,该数据库涵盖了2010年4月至2020年5月间英格兰所有国家卫生服务住院患者的记录。提取的数据包括诊断、临床程序、临床专科和收费代码。提取有NTD诊断的记录(国际疾病和相关健康问题统计分类第10版修订代码E708-E709)。临床代码按频率排序,并使用专家临床输入,根据与神经节障碍的关联程度在1到5之间打分。为了帮助描述潜在的未诊断患者,那些总得分≥53的记录被标记为潜在的NTDs,然后使用5个最常见的代码作为进一步的选择标准。

结果:在10年的研究期间,英国医院总共接收了5500万患者;加权评分≥53的记录有1972份。这些记录中最常见的编码是小儿神经学,其次是癫痫、肌张力障碍、脑瘫和肌张力减退。共1469例患者,构成病例回顾人群,评分≥53,参加儿科神经病学,诊断为癫痫,诊断为肌张力障碍、脑瘫或肌张力减退。

结论:一种创新的SQL编码方法,使用去识别的医院记录概要分析潜在的NTDs患者,以便进一步测试。这源自医院患者管理系统(PAS),对缩短确诊时间和实现早期干预具有重要意义。我们的方法可以应用于其他罕见疾病或诊断条件下。

关键字

神经递质障碍,芳香l -氨基酸脱羧酶,结构化(小写)查询语言,诊断

关于这个主题我们知道些什么?

•一般人群中神经递质障碍(NTDs)的发生率仍然未知。

•由于非特异性症状和缺乏诊断这些疾病所需的代谢物测量,及时诊断患者仍然具有挑战性。

•准确的诊断很重要,因为一些NTDs很容易治疗。

这项研究补充了什么

•开发了一种创新的SQL算法来查询医院的患者管理系统(PAS),以配置潜在的NTDs患者,并标记他们以供临床医生进一步测试。该算法是根据HES数据分析和专家临床输入测试设计的。

•这有可能缩短确诊时间,实现早期干预。

•所使用的方法可适用于检测其他罕见疾病或在诊断条件下

简介

神经递质障碍(NTDs)是由神经递质代谢和转运的遗传缺陷引起的,包括儿茶酚胺、血清素、生物嘌呤、甘氨酸、吡哆辛和伽马氨基丁酸代谢缺陷[2].症状和体征常出现在儿童早期,包括张力减退、运动障碍、自主调节障碍和发育障碍[2].一般人群中热带病的发病率仍然未知。在加拿大的一个单一中心进行的一项回顾性队列研究报告,在接受脑脊液(CSF)神经递质测量进行诊断检查的患有全身性发育迟缓、新生儿张力低下、新生儿癫痫发作、癫痫和运动障碍的患者中,4%的遗传性NTDs患病率[2].测量脑脊液神经递质代谢物(例如,高香草酸[HVA], 5-羟基吲哚乙酸[5-HIAA], 3- o -甲基多巴[3-OMD],四氢生物terin,生物terin和新opterin)用于确定儿茶酚胺、血清素和生物terin代谢障碍,通过候选基因的直接测序确认诊断[3.].

芳香l -氨基酸脱羧酶缺乏症(AADC-d)是一种以儿茶酚胺、多巴胺、肾上腺素、去甲肾上腺素和血清素合成受损为特征的NTD,迄今为止已有135多名患者在医学文献中描述过[4].东亚地区发现了一种始祖突变,其中台湾AADC-d患病率最高(1:32 000);然而,这种疾病并非亚洲种族所特有,其他血统的人也会患上[56].大多数患者出现在婴儿期早期,具有严重的表型,包括早发性张力减退、视力危机、上睑下垂、肌张力障碍、运动障碍、发育障碍和自主神经功能障碍;然而,轻微的疾病也会发生[7].AADC-d患者脑脊液中经常出现低水平的5-HIAA和HVA,高浓度的3-OMD、L-Dopa和5-OH色氨酸(5-HTP) [57].AADC-d可在绝大多数患者中得到基因证实[7].

NTDs患者的及时诊断仍然具有挑战性,因为非特异性的症状可能与其他神经综合征的症状重叠,例如脑瘫和癫痫性脑病[1].诊断不足也可能是由于缺乏腰椎穿刺(LPs)和缺乏诊断这些疾病所需的可用代谢物测量[2].准确的诊断非常重要,因为有些非神经性神经症很容易治疗[8].误诊或延误诊断可能导致患者病情不可逆转的恶化,并给医疗保健系统带来重大成本[9].在加拿大的研究中,5.3%接受LP以测量CSF HVA和5-HIAA的患者患有可治疗的遗传性代谢疾病之一,短期神经发育结果良好,这突出了早期和特异性诊断的重要性[1].补充缺乏的神经递质前体或恢复缺乏的内源性酶合成辅因子是治疗神经节紊乱的基础[7].AADC-d的治疗策略常常因中心而异,患者的治疗反应往往令人失望;然而,一小部分AADC-d患者对l -多巴或多巴胺激动剂反应良好[2].

本研究旨在开发基于结构化语言查询(SQL)的方法,利用来自PAS的电子健康记录数据,在英国各医院中识别应接受适当诊断检查的潜在NTDs/AADC-d患者。

方法

数据源

该队列来自医院发作统计(HES),来自英格兰所有国家卫生服务(NHS)住院和门诊病人的假名电子医疗记录[10].根据《国际疾病和相关健康问题统计分类第10版》(ICD-10)代码记录,每起HES发作最多有20项诊断[11].使用OPCS干预措施和程序分类和医疗保健资源组(HRG)代码记录程序,以对消耗类似资源水平的患者事件进行分组。这些数据被用于构建SQL选择查询,供临床医生通过安全在线门户在本地使用。这些数据仅供临床医生和临床综述使用。本研究不需要伦理和研究批准,因为它是允许重复使用医院发作统计数据和患者识别信息没有被利用。

研究人群

从HES检索了2010年4月至2020年5月之间的记录。数据包括诊断、临床程序、临床专科和关税代码。从以下患者队列中提取数据并用于开发SQL SELECT查询:

e708 - 709群组:这包括在10年研究期间入院的ICD-10编码为E708或E709的患者的记录。在ICD-10中没有针对NTDs/AADC-d的特定编码,有NTDs/ aadc的患者很可能在E708(“芳香氨基酸代谢的其他障碍”)或E709(“芳香氨基酸代谢障碍,未指明”)编码下被捕获。

他总群:这包括研究期间英国所有医院收治的所有患者的记录。

触发点的识别

通过有针对性的文献综述和临床专家鉴定了两篇关键论文,并筛选了与ntd /AADC-d相关的重要临床特征的内容[712].首先提取关键特征的初始列表,随后由两名儿科神经学家和两名儿科医生检查,以确保捕获与NTD患者相关的所有相关体征/症状、程序和临床专业。由此产生的代码列表(n = 115)构成了一个触发点表,其中包括潜在的NTD患者在诊断前可能经历的最相关的事件(完整列表见在线补充的表1)。商定的触发点的最终列表被翻译成HES术语(ICD-10、OPCS和HRG代码),供后续分析使用。

表1:NHS信托≥20名潜在的NTDs患者。查看表1

SQL查询的开发

E708-709队列表示用于设计SQL SELECT查询的数据集。预先定义的触发点应用于该队列,以确定患者记录中至少有115个编码中的一个。在更广泛的四位数ICD-10编码中,确定了触发点的发生组合和可能的NTD/ AADC-d患者。临床专家进一步分析了这些患者记录中出现的编码组合,以评估发生NTD的可能性,并一致认为这些代表了潜在的患者概况。随后,对115个触发点代码进行了排名,并根据与神经节疾病的可能关联程度给出了1到5之间的加权分数(即,5分表示与神经节疾病的关联程度高;表1)。通过将患者记录中出现的每个触发点代码的加权得分相加,计算出包含至少一个触发点的每个患者记录的总得分。≥53分被认为是高度可能患有NTDs/AADC-d患者的合适分值。

患者和公众的参与

患者、他们的家属和公众成员没有参与研究的设计或设置SQL查询的参数。

SQL SELECT查询的应用

HES数据测试查询:SQL SELECT查询应用于整个HES数据库(即HES总队列),分析所有评分≥53的患者。将这些患者记录中出现的所有代码进行汇总,并按频率排序,列出了五个最常见的关键触发点。最有可能患有NTDs/AADC-d的患者,或病例回顾人群,包括那些总分≥53分和关键触发点组合的患者。该分析的输出产生了一个关键表,突出显示了不同的代码组合,特别是英格兰每个医院信托站点的预期患者数量。

在现实环境中的实现:对基于HES分析的SQL SELECT查询进行了修改,以便在NHS信任患者管理系统(PAS)上使用。这支持跨中央信任数据库的简单搜索功能,对信任更安全,并确保更容易的信息治理。修改后的SQL SELECT查询在Trust内部运行,以维护患者机密性。OPEN Health或PTC Therapeutics在任何阶段均未收到患者识别信息。确定的患者名单被直接发送给相关的临床医生,由他们自行决定哪些患者可能从进一步的诊断检查中受益。

在2021年11月与药品和保健产品监管机构(MHRA)进行详细讨论后,MHRA决定SQL SELECT查询是一种通用产品,由最终用户定制,用于在HES数据库中选择患者。因此,这将不是一个医疗设备,因为SQL SELECT查询不提供决策功能。所有关于特定患者的诊断和管理的决定都由其负责的医疗保健专业人员决定。

结果

他的数据

在2010年4月至2020年5月期间,共有5500万名患者入住英国医院,其中20350,842人至少有记录中列出的115个触发点中的一个。这些患者的总加权得分在1到110之间。近四分之三(n = 14,717,481, 72.3%)的总加权评分≤3,加权评分≥53的患者有1972例,被认为可能是NTDs/AADC-d患者。评分≥53的患者记录的最常见代码是儿童神经内科,其次是癫痫、肌张力障碍、脑瘫和肌张力减退的诊断代码。

在评分≥53的1972例患者中,1822例接受了儿科神经学治疗,并被诊断为癫痫。另有1469人被诊断为肌张力障碍、脑瘫或肌张力减退;这些人构成了病例回顾人群,被认为极有可能患有NTDs/AADC-d。21个NHS信托机构被确定有≥20个潜在的NTD患者(表1)。

在研究期间,有289名HES患者的诊断代码为E708-709。SQL SELECT查询显示的1469例极有可能患有NTDs/AADC-d的患者比单独使用E708-709编码捕获的患者多80%。

相信数据

到目前为止,修改后的SQL SELECT查询已经在12个NHS信托基金和健康委员会中成功运行,并确定了多达130名适合进一步临床审查的患者。

在一个获得数据的Trust中确定了7名潜在的NTDs/AADC-d患者。在病例回顾中,一名患者的症状与NTD一致,然而,作为AADC-d初始筛查的3-OMD测量没有进行。因此,该患者(n = 1/ 7,14%)可能患有AADC-d,并可根据共识指南从进一步检测中获益[7].

讨论

我们开发了一种创新的编程语言方法,用于指示英国各地可能患有ntd /AADC-d的患者,这些患者将从进一步的诊断工作中受益。这个SQL SELECT查询可以为临床医生提供机会,通过早期的NTD检测和随后的干预来改善患者的预后。

我们注意到,在英格兰所有NHS医院中,有1469名潜在的NTDs/AADC-d患者,比有E708-709代码的患者多80%。我们的SQL SELECT查询基于体征、症状和治疗特点的概要,这比NTD诊断更直接。出现非特异性症状且难以诊断的罕见疾病,如神经管紊乱,在HES中可能被错误编码(例如作为模仿者综合征)。在对一个信托组织中确定为潜在的NTDs/AADC-d的7名患者进行进一步审查后,1名(14%)患者没有替代诊断,没有接受完整的调查,因此需要进一步检测。这证实了SQL SELECT查询是有效的,对患者管理和预后有重要意义。

基于sql的方法尚未应用于NTDs的诊断。然而,机器学习这种稍有不同的方法已经成功地用于其他罕见疾病的诊断[13].机器学习算法基于样本数据构建模型,以便做出预测或决策。值得注意的是,这项研究并不是这样进行的。相反,使用基于sql的方法来管理包含实体和变量之间关系的数据并检索相关数据。

应用基于sql的方法可能比其他疾病检测方法更有优势,特别是在罕见疾病方面。由于罕见病很少发生,治疗的医生最初可能不会怀疑。此外,罕见病往往具有非特异性表现和遗传成分,可能需要专门检测,从而进一步使诊断复杂化。另一个优点是,SQL查询是在整个HES数据库上开发的,它代表了整个英格兰的人口,而不是从一个单一中心或一个地区的几个中心选择数据库,这可能会引入偏见。HES包括所有年龄的患者,尽管AADC-d的症状出现在生命早期,但诊断可能要到多年后,甚至在20岁之后[5].因此,根据年龄限制数据可能会导致某些情况被遗漏。这种基于sql的方法的另一个优势是有可能选择所有患有罕见疾病(如NTDs)的患者,这对进一步研究(包括评估结果)具有重要意义。

然而,有些限制是需要考虑的。基于sql的方法可能存在偏差,包括分类错误、测量错误和数据缺失。因此,临床判断应该与这些技术的应用一起使用。编码错误可能发生在HES中;然而,数据质量已被证明在以后的几年里会更好[14].进一步的工作包括进一步识别Trust数据中的潜在患者,并对这些患者进行诊断检查,以验证SQL查询。

总之,本研究中描述的方法强调了可能的NTDs/AADC-d病例,以便进一步诊断。这种基于sql的方法学可以改进临床环境中对NTDs/AADC-d的检测,从而能够更早地进行干预并改善患者的预后。我们的方法可以应用于其他罕见疾病和诊断条件下,并作为一种新的策略,以帮助患者识别。

资金

这项工作由PTC治疗有限公司全额资助,目的是医学教育和改善患者护理。PTC Therapeutics, Ltd没有支付任何医疗保健专业人员作为该项目的一部分。

格兰特/奖项数量

不适用。

相互竞争的利益

所有作者已在www.icmje.org/coi_disclosure.pdf上完成ICMJE统一披露表,并声明:所提交的作品没有任何组织的支持;在过去三年内,与任何可能与所提交作品有利害关系的组织无经济关系;没有其他关系或活动可能影响提交的工作。

作者的贡献

研究概念由PTC Therapeutics, Ltd设计。记录是由OPEN健康集团的哈维·沃尔什检索的。数据由哈维·沃尔什分析。手稿是由Julia Granerod博士写的。所有作者都阅读、评论并批准了手稿。

致谢

这些研究由PTC Therapeutics, Ltd资助。

参考文献

  1. Brennenstuhl H, chung - klawitter S, Assmann B, Opladen T(2019)遗传性神经递质障碍:分类和实用的诊断和治疗方法。Neuropediatrics 50: 2 - 14。
  2. Mercimek-Mahmutoglu S, Sidky S, Hyland K, Patel J, Donner EJ等(2015)运动障碍和癫痫患者中遗传神经递质障碍的患病率:一项回顾性队列研究。孤儿J罕见病10:12。
  3. Cordeiro D, Bullivant G, Cohn RD, Raiman J, Mercimek-Andrews S(2018)遗传性神经递质障碍患者的预后。神经科学杂志45:571-576。
  4. Pearson TS, Gilbert L, Opladen T, Garcia-Cazorla A, Mastrangelo M,等(2020)AADC缺陷从婴儿期到成年期:一项63例国际队列患者的症状和发育结局。J继承Metab Dis 43: 1121-1130。
  5. Hyland K, Reott M(2020)高危人群中芳香l-氨基酸脱羧酶缺乏症的患病率。儿科神经病学106:38-42。
  6. 钱玉华,陈佩武,李冬青,谢文伟,赵春萍,等(2016)新生儿3- o甲基多巴水平:新生儿芳香l-氨基酸脱羧酶缺乏症筛查结果。Mol Genet Metab 118: 259-263。
  7. Wassenberg T, molro - luis M, Jeltsch K, Hoffmann GF, Assmann B,等(2017)芳香l-氨基酸脱羧酶(AADC)缺乏症诊断和治疗共识指南。孤儿罕见病
  8. Siu WK(2015)单胺类神经递质障碍的遗传学。翻译儿科4:175-180。
  9. Opladen T, Cortès-Saladelafont E, Mastrangelo M, Horvath G, Pons R, et al.(2016)神经递质相关疾病国际工作组(iNTD):一个专注于原发性和继发性神经递质障碍的全球研究项目。Mol Genet Metab Rep 9: 61-66。
  10. 医院发作统计(HES)。NHS的数字。
  11. (2010年)疾病和有关健康问题的国际统计分类th修订。icd -版本:2010。
  12. Himmelreich N, Montioli R, Bertoldi M, Carducci C, Leuzzi V,等(2019)芳香氨基酸脱羧酶缺乏症:分子和代谢基础及治疗前景。分子生物学及分子生物学研究
  13. Schaefer J, Lehne M, Schepers J, Prasser F, Thun S(2020)机器学习在罕见病中的应用:范围综述。孤儿罕见病
  14. Boyd A, Cornish R, Johnson L, Simmonds S, Syddall H,等(2018)了解医院发作统计(HES)。加强资源报告。

引用

Fox E, Mehta V, Madhu R, Wassmer E, Arora R等人(2022)开发一种基于sql的创新方法来识别潜在的神经递质障碍患者。国际J罕见疾病紊乱5:048。doi.org/10.23937/2643-4571/1710048

Baidu