看看最近的文章

从电子健康记录系统中获得患者去识别临床研究数据库:确定住院患者乳酸盐、c反应蛋白和降钙素原预后价值的单中心经验

Mohan R

美国加利福尼亚州洛马林达市洛马林达大学卫生学部儿科

电子邮件:bhuvaneswari.bibleraaj@uhsm.nhs.uk

何伟平

美国加利福尼亚州洛马林达洛马林达大学卫生保健处信息服务部

道尔顿L

临床试验中心,洛马琳达大学卫生,洛马琳达,加利福尼亚州,美国

陈F

美国加利福尼亚州洛马林达市洛马林达大学卫生学部儿科

阮HB

美国加州洛马林达大学医学院,肺、重症监护、高压氧、过敏和睡眠医学部

DOI: 10.15761 / JTS.1000405

文章
条信息
作者信息
图表和数据

摘要

客观的在这项研究中,我们证明了从电子健康记录(EHR)中推导出一个去识别的研究数据库,然后将其用于确定住院患者的生物标志物乳酸盐、c反应蛋白(CRP)和降钙素原的预后价值。

方法数据库是通过一系列数据导出、转换、加载和可视化创建的。完成了一个数据库词汇表,包括每个患者遇到的650个数据元素,没有个人标识符。为使用该数据库的人员提供数据可视化和统计分析工具。

结果从2012年7月至2019年8月,该数据库包含240759例不同的医院遭遇,2682例患者符合分析标准,年龄54.5±18.6岁,乳酸1.9±1.7 mmol/L, CRP 10.7±10.0µg/mL,降钙素原4.0±17.5 ng/mL,死亡率8.7%。乳酸、CRP和降钙素原的ROC曲线下面积分别为0.670、0.553和0.672。乳酸、CRP和降钙素原死亡率的比值比分别为1.111(1.037-1.190)、1.015(0.991-1.031)和0.999(0.991-1.007)。

结论我们的努力为创建ehr衍生的去识别患者数据用于临床研究提供了一个框架。我们对乳酸、CRP和降钙素原的预后价值进行了分析,结果显示这些生物标志物的准确性低于预期,突出了使用现有数据的挑战。

关键字

临床研究数据库,电子健康记录,乳酸盐,c反应蛋白,降钙素原

简介

临床研究目的的数据收集往往是一个艰巨、耗时和昂贵的过程。随机对照试验(RCT)一直被视为研究的黄金标准,经常为我们提供有价值的信息,在循证医学的实践[1]。虽然不能低估随机对照试验的效用,但除了那些拥有大量私人或公共资金来源的人之外,实施随机对照试验的成本往往令人望而却步。先前的一项系统综述估计,随机对照试验的平均成本为每名患者43美元至103,254美元。虽然这种确定的研究范式继续得到支持,但通过探索常规患者护理中现有的数据,我们的医学知识的进步可以得到极大的提高。

在美国,电子健康记录(EHR)几乎已经普及,因为通过了《经济与临床健康卫生信息技术法案》(HITECH),以促进EHR的采用及其有意义的使用[3,4]。自2009年HITECH通过以来,截至2015年,估计81%的医院已经采用了EHR,而且这一数字可能已经增加了[5]。电子病历几乎被用于患者护理的各个方面,并改善了多个临床领域的结果,如糖尿病和癌症治疗[6,7]。鉴于电子病历所提供的信息的普遍性和数量,如果我们能够系统地收集和分析这些信息,就会有大量数据可用于研究。

近年来,人们一直在努力通过电子病历系统提取数据,例如EPIC (EPIC systems Corporation, Verona, WI),据估计每个患者包含超过32,000个离散数据元素[8,9]。最近,Epic宣布了Cosmos (Epic Systems Corporation, Verona, WI)的计划,这是一个大型合作研究数据库,汇集了多个机构的Epic EHR数据。Cosmos广泛应用于临床研究和数据挖掘的时间表还有待确定。然而,来自全国医疗保健机构的2亿多份患者记录最终可能构成数据库,将大数据研究推向新的高度。

自2012年7月起,我们在洛马琳达大学健康中心(LLUH)的组织开始采用EPIC。目前,我们的电子病历包括近200万份独特的患者记录。因此,我们看到了一个很好的机会来获取这些数据用于临床研究,同时等待更大的多中心数据库,如Cosmos。在本研究中,我们介绍了我们从单中心EPIC EHR中获得患者去识别数据库的经验,仅用于临床研究。在数据库创建后,我们完成了统计分析,比较了三种常见生物标志物在预测住院患者死亡率方面的预后价值:乳酸、c反应蛋白(CRP)和降钙素原大量研究表明,这些生物标志物可用于危重患者预后的预测[11-17]。使用我们的衍生数据库,我们的目标是检查这些生物标志物应用于我们自己的患者群体的准确性。在此过程中,我们探索了利用现有数据回答相关临床问题的成功和挑战,并为未来对ehr衍生数据进行研究提供了一个框架。

材料与方法

临床研究的挑战和自助数据库的基本原理

基于ehr的数据库是根据我们自己现成的患者数据高效地进行临床研究的需要而创建的。我们机构的调查人员和研究人员经历了从我们的EHR (LLEAP - Loma Linda电子访问门户,这是我们机构对EPIC EHR的实施)中及时获取去识别数据的挑战,以进行前期研究分析、拨款申请和其他资助机会。虽然EPIC系统中可用的报告工具,如reporting Workbench和Slicer Dicer,对于从EHR中获取临床数据很有用,但我们发现它们没有提供研究人员所需的灵活性或所需的数据集。当这些自助服务工具不能提供所需的数据时,调查人员必须通过我们的信息技术服务台提交数据请求。此外,他们必须从单个数据集中指定数据元素,而不能跨多个数据集交叉引用。数据提取变得很麻烦,因为服务请求可能需要几个月的时间,具体取决于请求和机构范围内的需求。这些挑战最终导致错失拨款机会,许多项目失败,并阻碍了研究人员的临床研究努力。

试验数据集

我们的目标是将ehr衍生的数据库作为临床研究的全机构解决方案,检查LLUH现有的患者数据。创建试点数据集的最初努力来自杜克大学的一个多中心数据项目,称为“儿科试验网络数据库”。网络数据库由尤尼斯·肯尼迪·施赖弗国家儿童健康和人类发展研究所杜克大学医学中心作为协调中心[18,19]。这个最初的项目产生了一个有限的数据集,而不是一个完全去标识的数据库。因此,需要机构审查委员会(IRB)的伦理批准,才能从我们儿童医院的患者接触中获得所需的数据元素。

获得机构支持

基于我们为儿科试验网络提供的有限数据集的经验,我们获得了机构的批准,开发了一个完全去识别的数据库。为了临床研究的目的,我们组织中的任何研究人员都可以使用它。成立了一个工作组,由临床试验中心主任(LD,本文手稿的合著者)领导,包括医生冠军、数据分析专家、技术支持人员和首席医疗信息官(FC,本文手稿的合著者)。定期举行会议,以确定数据库的内容、提取和分析数据的工具,以及作为初始项目的潜在研究想法。

访问数据库进行临床研究

我们机构的任何研究人员都可以以临床研究为目的访问数据库,并具有IRB审查的“豁免”状态。IRB认为这一活动不符合人体研究的标准,因为数据被去识别。我们分别选择Tableau (Tableau Software, Seattle, WA)和统计软件包社会科学(SPSS) 25.0版(IBM, Armonk, NY)作为数据库的用户界面,用于数据可视化和统计分析。为了方便我们的调查人员使用这些工具,我们制定了一份用户指南,其中详细说明了如何1)在他们的台式电脑上安装工具以及2)连接到数据库。参考在线课程,供用户根据需要自主学习Tableau和SPSS;https://www.udemy.com/course/tableau10-advanced/和https://www.udemy.com/course/spss-statistics-foundation-course-from-scratch-to-advanced/。用户指南中还提供了数据库术语表(或数据字典)。

住院患者生物标志物的数据库分析

为了确定从数据库中获得的乳酸、CRP和降钙素原在住院患者中的预后价值,我们使用SPSS作为主要统计分析工具。在18岁或以上的患者中测量至少一种乳酸盐、CRP和降钙素原的独特医院遭遇纳入分析。收集的数据包括患者人口统计学、生命体征、实验室(包括乳酸、CRP和降钙素原)、血管加压药物使用、呼吸机使用和住院时间。

采用单变量方差分析比较存活者和非存活者。采用二项logistic回归对相关临床变量对死亡率结局的影响进行建模。生成受试者工作特征(ROC)曲线,比较乳酸盐、CRP和降钙素原预测死亡率的准确性。p值< 0.05,差异有统计学意义。

结果

ehr衍生去识别数据库

去标识的数据库是从我们的LLEAP应用程序中提取的数据的一个大子集(图1)。数据是从LLEAP传输的记录临床数据存储(即EHR)清晰这是一个微软SQL Server数据库(Microsoft Corporation, Redmond, WA),由超过18,000个数据表组成,通过一个称为ETL(导出,转换和加载)的过程。从那里,数据被导入到一个名为,这也是一个由大约5,000个数据表组成的Microsoft SQL Server数据库。最后一步涉及到通过Tibco®数据虚拟化工具(Tibco Software Inc., Palo Alto, CA)对数据进行去标识,之后数据被缓存到SAP HANA®(SAP SE, Walldorf, Baden-Württemberg, Germany)内存数据库中,以实现快速数据分析和检索。最后的去识别数据库通过这个过程每周更新一次。

图1所示。为临床研究创建电子健康记录衍生去识别数据库

创建了一个数据库术语表,描述了可用于分析的数据元素(表1)。每个患者都有一个唯一的患者标识符(ID),每个患者到我们机构的介绍都有一个唯一的就诊ID。每一次病人接触有650个数据元素。然而,数据库中的任何患者信息都无法与个人识别码相关联:与患者直接相关的姓名、地址、日期(年份除外)、年龄在89岁以上、电话号码、传真号码、电子邮件地址、社会安全号码、医疗记录号码、健康计划保单号码、帐户号码、证书/许可证号码、车辆识别码和车牌号码、设备识别码和序列号、网址(url)、互联网IP地址、生物特征识别码(包括指纹和声印)、全面部摄影图像和任何可比较的图像,以及任何其他唯一的识别数字、特征或代码。

表1。数据元素的数据库术语表。国际疾病分类;ECG—心电图;CT -计算机断层扫描;ID—标识符;现行程序术语;BMI -身体质量指数

类别

数据元素

过敏

过敏原的名称,过敏原类型,严重程度和个别患者和遇到的反应

计费诊断与程序代码

个别患者和遭遇的手术前计费程序名称、程序代码、麻醉类型、代码数量、死亡风险和病情严重程度

主诉及诊断

主诉和诊断,账单诊断名称和ICD-9/10代码,既往病史ICD-9/10代码,以及单个患者和遭遇的带有ICD-9/10代码的医院问题列表

急诊科探访

到达时间,离开时间,心电图数据,是否需要创伤激活,是否需要溶栓,是否需要镇静,是否需要CT扫描,是否需要心理咨询,是否需要隔离,护理水平,敏锐度,如果需要,是否需要住院

住院时间汇总数据

住院时间、患者病情严重程度、死亡风险、住院时间、住院死亡率、保险范围、主院诊断、出院诊断

医院实验室

入院时以及整个住院期间获得的所有实验室都与唯一的医院会诊ID相关联

免疫接种信息

与唯一的患者ID相关联的免疫名称和注射时间

用药顺序和给药时间

药物治疗和用药类别,仿制产品标识符,用药剂量,顺序时间,给药时间,顺序来源

病人的人口统计

年龄、性别、宗教、吸烟状况、经济阶层、种族(如有)和最高教育水平(如有)

手术过程/订单

程序顺序,程序名称,CPT代码,与患者ID和就诊ID相关联的顺序日期

门诊访问

根据计费代码、预约时间、入住时间、生命体征(血压、脉搏、呼吸、体重、BMI)来确定遇到类型

生命体征数据

一些医院遭遇的生命体征数据(不完整的数据集,并非所有遭遇都可用)

乳酸、CRP和降钙素原的预后价值

从2012年7月到2019年8月,该数据库包含240759例不同的医院遭遇(入院)。我们的分析确定了生物标志物的预后价值,2682例患者符合纳入标准,年龄为54.5±18.6岁(图2)。研究人群的患者特征如表2所示,乳酸1.9±1.7 mmol/L, CRP 10.7±10.0µg/mL,降钙素原4.0±17.5 ng/mL,住院死亡率为8.7%。单因素比较显示,幸存者与非幸存者在年龄、性别、乳酸、CRP、降钙素原、白细胞计数、血小板、国际标准化比值、肌酐、总胆红素、白蛋白、碳酸氢盐、葡萄糖、呼吸机使用、血管加压药物使用和住院时间等方面存在统计学差异。根据国际疾病分类(ICD)-10代码入院最常见的诊断为:未指明的骨髓炎(M86.9)占总入院人数的0.9%,坏死性筋膜炎(M72.6)占0.7%,菌血症(R78.81)占0.7%。

图2。分析流程图。c反应蛋白

表2。病人的特点。国际标准化比率。数据以计数(%)或均数±标准差表示。N表示数据不完整时数据库中可用的幸存者/非幸存者病例数

所有的病人

N = 2682

幸存者

N = 2450

Non-Survivors

N = 232

假定值

年龄(年)

54.5±18.6

53.8±18.5

62.6±17.6

< 0.001

女/男,否(%)

1237 (46.1)/1445 (53.9)

1118 (45.6)/1332 (54.4)

119 (51.3)/113 (48.7)

< 0.001

初始生命体征

温度,oF

(n = 197/4)

98.3±0.7

98.2±0.7

98.7±0.6

0.185

心率,每分钟

(n = 197/4)

87±15

87±15

80±8

0.155

呼吸,每分钟

(n = 197/4)

19±4

19±4

19±6

0.909

氧饱和度,%

(n = 197/4)

97±2

97±2

98±4

0.852

最初的实验室

乳酸,更易与L

1.9±1.7

1.8±1.5

3.1±3.0

< 0.001

c反应蛋白,μg/mL

10.7±10.0

10.6±9.9

12.2±10.9

0.015

原降钙素,ng / mL

4.0±17.5

3.6±16.4

8.4±26.3

< 0.001

白细胞,每毫米3.

(n = 2449/232)

13.3±13.9

12.9±12.1

17.2±25.8

< 0.001

血小板,每毫米3.

(n = 2445/231)

267±147

271±147

218±130

< 0.001

印度卢比

(n = 1836/216)

1.3±0.6

1.2±0.6

1.5±1.1

< 0.001

肌酐,mg / dL

(n = 2443/231)

1.7±2.0

1.7±2.0

1.9±1.9

0.069

总胆红素,mg/dL

(n = 2391/231)

1.0±2.8

0.9±2.4

1.8±5.3

< 0.001

白蛋白,g / dL

(n = 2397/231)

3.2±0.7

3.3±0.7

2.8±0.8

< 0.001

碳酸氢盐,毫克当量/ L

(n = 1197/224)

21.2±5.5

22.1±5.4

20.5±5.9

< 0.001

葡萄糖,mg / dL

(n = 2134/210)

148±88

150±90

135±64

0.002

使用呼吸机,否(%)

695 (25.9)

510 (20.8)

185 (79.7)

< 0.001

使用血管加压剂(无,%)

483 (18.0)

311 (12.7)

172 (74.1)

< 0.001

住院天数(天)(n=2358/232)

13.8±20.1

13.6±21.1

16.5±15.1

0.007

受试者工作特征分析显示,曲线下面积(AUC)分别为0.670、0.553、0.672;乳酸、CRP和降钙素原的拐点分别为1.7 mmol/L、8.0 mg/L和0.3 ng/mL(图3)。生物标志物测量的时间有显著差异。随机抽取100例患者,分别在入院后86±90、113±199和199±221小时测量乳酸、CRP和降钙素原(图4)。

图3。受试者工作特征与乳酸、c反应蛋白(CRP)和降钙素原与死亡率的关系曲线。曲线下面积分别为0.670、0.553和0.672。拐点(预测死亡率精度最高的临界值)分别为1.7 mmol/L、8.0 mg/L和0.3 ng/mL

图4。随机选择100例患者就诊时的乳酸、c反应蛋白(CRP)和降钙素原初始测量时间。测量时间分别为86±90、113±199、199±221小时

采用二项logistic回归模型确定住院死亡率的预测因素(表3)。乳酸、CRP和降钙素原与死亡率的比值比分别为1.111(1.037-1.190)、1.015(0.991-1.031)和0.999(0.991-1.007)。

表3。死亡率的二项logistic回归模型包括乳酸、c反应蛋白(CRP)和降钙素原测量。国际标准化比率。给出了优势比的上限和下限的95%置信区间

变量

优势比

N = 2682

年龄

1.034 (1.024 - -1.044)

性别(男性)

0.730 (0.526 - -1.013)

乳酸

1.111 (1.037 - -1.190)

c反应蛋白

1.015 (0.991 - -1.031)

原降钙素

0.999 (0.991 - -1.007)

白细胞

1.009 (1.002 - -1.009)

血小板

0.998 (0.997 - -1.000)

印度卢比

1.157 (0.940 - -1.423)

肌酸酐

1.002 (0.919 - -1.092)

总胆红素

1.014 (0.979 - -1.054)

白蛋白

0.685 (0.547 - -0.857)

碳酸氢

0.979 (0.947 - -1.012)

葡萄糖

0.998 (0.995 - -1.000)

呼吸机使用

4.597 (3.018 - -7.004)

血管加压的使用

6.049 (4.066 - -8.999)

讨论

在这项研究中,我们已经证明,在整个机构的支持下,为临床研究目的而派生一个患者去识别数据库是可行的。我们完成了对数据库的首次分析,以确定几种常见生物标志物在预测住院患者死亡率方面的准确性。

在logistic回归模型中,我们证实乳酸与死亡率之间存在显著相关性,优势比和95%置信区间均大于1.0。乳酸的ROC曲线显示了1.7 mmol/L的拐点,与之前报道的低于1.4和2.3 mmol/L的正常值相关[12,14,18-20]。超过这样的乳酸临界值,死亡率增加。CRP和降钙素原的死亡率优势比不显著,95%可信区间为1.0。虽然在某些情况下与死亡率相关,但在患有心脏病或炎症性疾病的患者中,CRP通常升高,因此它作为预后标志物[13]是非特异性的。降钙素原已被证明可指导脓毒症的抗生素治疗,其<0.2 ng/mL的阴性预测值较高[21-23]。CRP在预测死亡率方面的非特异性和降钙素原在预测抗生素使用疗效方面的更特异性可能解释了这些标志物缺乏显著的优势比。

在我们机构使用ehr衍生数据的能力代表了进行临床研究的范式转变。传统的流程是向我们的信息技术服务台提交数据请求,等待结果以执行准备分析,如样本量计算,向IRB提交提案,并等待批准从医疗记录中执行完整的数据提取,这些流程都被取消了。患者身份去识别数据库的可用性将节省几个月到一年或更长时间。在包括实习生(即医学生、住院医生和研究员)在内的学术环境中,这种资源将导致研究生产力的巨大变化。项目现在可以在学员接受教育的1-2年内及时完成。来自数据库的分析可以作为产生假设的研究,供更资深的研究人员进一步测试。

由于HITECH[24]的财政激励,自美国采用EHR以来,个人医疗保健系统中的数据存储库数量不断增长。这些数据库已经在药理学和基因组学等学科中被创建和使用[9,25]。大数据也被用于医疗保健的其他领域,特别是电子医疗保健系统的改进和预防健康[26]。在我们的研究中,我们已经表明,基于现有本地机构EHR的数据集的实施可能极大地促进临床研究。

创建ehr衍生数据库确实需要在初始阶段投入时间和资源。需要一个强大的数据分析部门来提取数据,将其转换为可用的格式,并通过定期更新预期数据来维护数据库。在临床研究方面有知识的医生冠军被聘请来提供对数据库内容的输入。鼓励最终用户调查人员(包括受训者)学习并执行他们自己的数据库统计分析,而不是浏览IRB批准流程。一旦创建,我们机构内的任何人包括非临床医生都可以访问数据库。

分析现有数据并非没有局限性。之前的一项研究检查了国家医院门诊医疗调查(NHAMCS)数据库中超过10年导致插管的348,367例急诊患者就诊情况。在875名插管患者中,27%被不准确地记录为出院回家或住进非重症监护病房[27]。虽然我们不知道电子病历中记录的数据的准确性,但我们直觉地接受这种回顾性数据可能并不完全准确。其次,在分析现有数据时,为了临床诊断或预后而控制实验室测量的时间是不可能的。在我们的研究中,乳酸、CRP和降钙素原应该在患者入院后的最早时间点进行理想的测量。然而,这些生物标记物从数小时到数天的时间存在显著差异,这不可避免地影响了它们对死亡率的预后准确性。因此,本研究的ROC AUC值远低于既往研究报道的ROC AUC值[28-30]。最后,使用国际疾病分类(ICD)代码来识别任何现有数据集中的患者,在确定最常见的诊断时带来了挑战。因此,我们的前三名最常见的ICD-10编码占研究总人数的不到3%。

结论

总之,我们的项目提供了一个创建ehr衍生的去识别患者数据并将其用于临床研究的框架,但也强调了以高度可靠性使用这些数据的挑战。大量的数据包括缺失的值,很难单独筛选不准确或不一致的地方。

电子病历系统已在大多数急症护理医院得到广泛应用。随着各组织不断改进其EHR系统的功能[31],通过HIMSS(医疗保健信息和管理系统协会)标准化临床数据的收集和仓库的工作正在进行中。随着电子病历的不断发展,我们希望本研究中描述的过程将允许简单的数据提取和分析,将现实世界的数据转化为回答相关的临床问题。

参考文献

  1. Hariton E, Locascio JJ(2018)随机对照试验-有效性研究的金标准:研究设计:随机对照试验。问卷25: 1716。(Crossref)
  2. Speich B, Von Niederhausern B, Schur N(2018)对随机临床试验成本和资源使用的系统综述显示缺乏透明和全面的数据。临床流行病学96: 1 - 11。
  3. Adler-Milstein J, DesRoches CM, Kralovec P(2015)美国医院采用电子健康记录:继续取得进展,但挑战依然存在。卫生助理(米尔伍德)34: 2174 - 2180。(Crossref)
  4. Blumenthal D(2010)推出HITECH。N英语J医学362: 382 - 385。
  5. Adler-Milstein J, Holmgren AJ, Kralovec P, Worzala C, Searcy T等人(2017)(美国医院采用电子健康记录:数字“高级使用”鸿沟的出现。美国医学信息协会24: 1142 - 1148。
  6. Jensen RE, Snyder CF, Abernethy AP(2014)癌症临床护理中使用的电子患者报告结果系统综述。J Oncol实践10: e215-22。
  7. 黄娟,郭志明,郭志明,等(2012)糖尿病患者门诊电子病历与临床护理及预后的关系。实习医生157: 482 - 489。(Crossref)
  8. Milinovich A, Kattan MW(2018)从Epic中提取和利用电子健康数据进行研究。安翻译医学6: 42。
  9. 魏WQ, Denny JC(2015)从电子健康记录中提取研究质量表型以支持精准医疗。基因组医学7: 41。
  10. 德雷斯J (2019) Epic推出患者数据研究计划,新软件。贝克尔的健康IT和CIO报告,2019年8月29日。
  11. Bou Chebl R, El Khuri C, Shami A(2017)血清乳酸是急诊危重患者住院死亡率的独立预测因子:一项回顾性研究。创伤复苏急救医学25: 69。
  12. Dundar ZD, Kocak S, Girisgin AS(2019)乳酸和NEWS-L是老年急诊科危重患者死亡率的合理预测指标。是急诊医生吗.2019.(Crossref)
  13. Marsik C, kazami - shirazi L, Schickbauer T(2008)一项大型医院队列研究中C反应蛋白与全因死亡率.中国化学54: 343 - 549。
  14. Nichol AD, Egi M, Pettila V(2010)相对高乳酸血症与危重患者住院死亡率:一项回顾性多中心研究。暴击治疗14: R25。
  15. Schuetz P, Birkhahn R, Sherwin R(2017)连环降钙素原预测严重脓毒症患者的死亡率:多中心降钙素原监测脓毒症(MOSES)研究的结果。重症监护医学45: 781 - 789。(Crossref)
  16. Schuetz P, Wirz Y, Sager R(2018)降钙素原引导的抗生素治疗对急性呼吸道感染死亡率的影响:患者水平的荟萃分析。柳叶刀感染病18: 95 - 107。
  17. Zacho J, tybjager - hansen A, Nordestgaard BG (2010) c反应蛋白与全因死亡率——哥本哈根城市心脏研究。Eur Heart J31日:1624 - 1632。
  18. 儿科试验网络。国家儿童健康和人类发展研究所。国家儿童健康和人类发展研究所。
  19. Hornik CP, Atz AM, Bendel C(2019)基于电子健康记录的多中心儿科住院患者数据存储库的创建。应用临床通知10: 307 - 315。
  20. Wacharasint P, Nakada TA, Boyd JH, Russell JA, Walley KR,等(2012)感染性休克正常范围血乳酸浓度具有预后和预测作用。冲击38: 4到10。(Crossref)
  21. 陈志伟,陈志伟,陈志伟,等。(2004)降钙素原和C反应蛋白在全身炎症反应综合征、败血症和脏器功能障碍中的作用。暴击治疗.8: R234-R242。
  22. 陈志强,陈志强,陈志强(2004)降钙素原在感染性休克中的诊断和预后价值。重症监护医学32: 1166 - 1169。
  23. Meisner M(2014)降钙素原测量的最新进展。安医学实验室34: 263 - 273。
  24. Marcotte L, Seidman J, Trudel K(2012)实现健康信息技术的有意义使用:医生的电子病历激励计划指南。Arch实习医生172: 731 - 736。
  25. Tate AR, Beloff N, Al-Radwan B(2014)利用快速搜索算法和直观的查询界面开发电子健康记录大型数据库的潜力.美国医学信息协会21日:292 - 298。
  26. El Aboudi N, Benhlima L(2018)医疗保健系统的大数据管理:架构、需求和实现。阿德生物信息学2018: 4059018。
  27. 格林SM(2013)国家医院门诊医疗调查中急诊插管后处置的一致性。安急诊医学61: 423 - 6 - e8。(Crossref)
  28. Filho RR, Rocha LL, Correa TD, Pessoa CM, Colombo G,等(2016)脓毒症患者血乳酸水平临界值和死亡率预测的重新评估?回顾性队列研究。冲击46: 480 - 485。
  29. Povoa P, Coelho L, Almeida E (2005) c反应蛋白作为危重患者感染的标志。临床微生物感染11: 101 - 108。
  30. Sager R, Wirz Y, Amin D(2017)入院降钙素原水平是不同医疗急诊患者群体的普遍死亡率预测指标吗?来自跨国、前瞻性、观察性TRIAGE研究结果。临床化学实验室医学55岁:1873 - 1880。(Crossref)
  31. EMRAM:有效采用和成熟EMR的战略路线图。医疗保健信息和管理系统学会。

编辑信息

主编

特里Lichtor
Tsuyoshi Hirata
Shinya美津浓
Giacomo柯拉

文章类型

研究文章

出版的历史

收稿日期:2020年7月6日
录用日期:2020年7月17日
发布日期:2020年7月20日

版权

©2020 Mohan R.这是一篇根据创作共用署名许可协议条款发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是要注明原作者和出处。

引用

Mohan R, Ho P, Dalton L, Chan F和Nguyen HB(2020)从电子健康记录系统中获得患者去识别临床研究数据库:确定住院患者乳酸盐、c反应蛋白和降钙素原预后价值的单中心经验7:DOI: 10.15761/JTS.1000405。

相应的作者

H. Bryant Nguyen

MD, MS,洛马琳达大学,11234安德森街,1523室,洛马琳达,加利福尼亚州92354,美国

电子邮件:bhuvaneswari.bibleraaj@uhsm.nhs.uk

图1所示。为临床研究创建电子健康记录衍生去识别数据库

图2。分析流程图。c反应蛋白

图3。受试者工作特征与乳酸、c反应蛋白(CRP)和降钙素原与死亡率的关系曲线。曲线下面积分别为0.670、0.553和0.672。拐点(预测死亡率精度最高的临界值)分别为1.7 mmol/L、8.0 mg/L和0.3 ng/mL

图4。随机选择100例患者就诊时的乳酸、c反应蛋白(CRP)和降钙素原初始测量时间。测量时间分别为86±90、113±199、199±221小时

表1。数据元素的数据库术语表。国际疾病分类;ECG—心电图;CT -计算机断层扫描;ID—标识符;现行程序术语;BMI -身体质量指数

类别

数据元素

过敏

过敏原的名称,过敏原类型,严重程度和个别患者和遇到的反应

计费诊断与程序代码

个别患者和遭遇的手术前计费程序名称、程序代码、麻醉类型、代码数量、死亡风险和病情严重程度

主诉及诊断

主诉和诊断,账单诊断名称和ICD-9/10代码,既往病史ICD-9/10代码,以及单个患者和遭遇的带有ICD-9/10代码的医院问题列表

急诊科探访

到达时间,离开时间,心电图数据,是否需要创伤激活,是否需要溶栓,是否需要镇静,是否需要CT扫描,是否需要心理咨询,是否需要隔离,护理水平,敏锐度,如果需要,是否需要住院

住院时间汇总数据

住院时间、患者病情严重程度、死亡风险、住院时间、住院死亡率、保险范围、主院诊断、出院诊断

医院实验室

入院时以及整个住院期间获得的所有实验室都与唯一的医院会诊ID相关联

免疫接种信息

与唯一的患者ID相关联的免疫名称和注射时间

用药顺序和给药时间

药物治疗和用药类别,仿制产品标识符,用药剂量,顺序时间,给药时间,顺序来源

病人的人口统计

年龄、性别、宗教、吸烟状况、经济阶层、种族(如有)和最高教育水平(如有)

手术过程/订单

程序顺序,程序名称,CPT代码,与患者ID和就诊ID相关联的顺序日期

门诊访问

根据计费代码、预约时间、入住时间、生命体征(血压、脉搏、呼吸、体重、BMI)来确定遇到类型

生命体征数据

一些医院遭遇的生命体征数据(不完整的数据集,并非所有遭遇都可用)

表2。病人的特点。国际标准化比率。数据以计数(%)或均数±标准差表示。N表示数据不完整时数据库中可用的幸存者/非幸存者病例数

所有的病人

N = 2682

幸存者

N = 2450

Non-Survivors

N = 232

假定值

年龄(年)

54.5±18.6

53.8±18.5

62.6±17.6

< 0.001

女/男,否(%)

1237 (46.1)/1445 (53.9)

1118 (45.6)/1332 (54.4)

119 (51.3)/113 (48.7)

< 0.001

初始生命体征

温度,oF

(n = 197/4)

98.3±0.7

98.2±0.7

98.7±0.6

0.185

心率,每分钟

(n = 197/4)

87±15

87±15

80±8

0.155

呼吸,每分钟

(n = 197/4)

19±4

19±4

19±6

0.909

氧饱和度,%

(n = 197/4)

97±2

97±2

98±4

0.852

最初的实验室

乳酸,更易与L

1.9±1.7

1.8±1.5

3.1±3.0

< 0.001

c反应蛋白,μg/mL

10.7±10.0

10.6±9.9

12.2±10.9

0.015

原降钙素,ng / mL

4.0±17.5

3.6±16.4

8.4±26.3

< 0.001

白细胞,每毫米3.

(n = 2449/232)

13.3±13.9

12.9±12.1

17.2±25.8

< 0.001

血小板,每毫米3.

(n = 2445/231)

267±147

271±147

218±130

< 0.001

印度卢比

(n = 1836/216)

1.3±0.6

1.2±0.6

1.5±1.1

< 0.001

肌酐,mg / dL

(n = 2443/231)

1.7±2.0

1.7±2.0

1.9±1.9

0.069

总胆红素,mg/dL

(n = 2391/231)

1.0±2.8

0.9±2.4

1.8±5.3

< 0.001

白蛋白,g / dL

(n = 2397/231)

3.2±0.7

3.3±0.7

2.8±0.8

< 0.001

碳酸氢盐,毫克当量/ L

(n = 1197/224)

21.2±5.5

22.1±5.4

20.5±5.9

< 0.001

葡萄糖,mg / dL

(n = 2134/210)

148±88

150±90

135±64

0.002

使用呼吸机,否(%)

695 (25.9)

510 (20.8)

185 (79.7)

< 0.001

使用血管加压剂(无,%)

483 (18.0)

311 (12.7)

172 (74.1)

< 0.001

住院天数(天)(n=2358/232)

13.8±20.1

13.6±21.1

16.5±15.1

0.007

表3。死亡率的二项logistic回归模型包括乳酸、c反应蛋白(CRP)和降钙素原测量。国际标准化比率。给出了优势比的上限和下限的95%置信区间

变量

优势比

N = 2682

年龄

1.034 (1.024 - -1.044)

性别(男性)

0.730 (0.526 - -1.013)

乳酸

1.111 (1.037 - -1.190)

c反应蛋白

1.015 (0.991 - -1.031)

原降钙素

0.999 (0.991 - -1.007)

白细胞

1.009 (1.002 - -1.009)

血小板

0.998 (0.997 - -1.000)

印度卢比

1.157 (0.940 - -1.423)

肌酸酐

1.002 (0.919 - -1.092)

总胆红素

1.014 (0.979 - -1.054)

白蛋白

0.685 (0.547 - -0.857)

碳酸氢

0.979 (0.947 - -1.012)

葡萄糖

0.998 (0.995 - -1.000)

呼吸机使用

4.597 (3.018 - -7.004)

血管加压的使用

6.049 (4.066 - -8.999)