2024年8月,我院臨床流行病學(xué)與循證醫(yī)學(xué)中心孫鑫研究員、王雯副研究員團(tuán)隊(duì)在《Military Medical Research》 (IF:16.7)上發(fā)表題為“Guidance of development, validation, and evaluation of algorithms for populating health status in observational studies of routinely collected data (DEVELOP?RCD)”的方法學(xué)指南。該指南系統(tǒng)構(gòu)建了在真實(shí)世界環(huán)境下,變量識(shí)別的算法開發(fā)、驗(yàn)證、評(píng)價(jià)一體化方法框架和關(guān)鍵技術(shù),是國(guó)內(nèi)首部基于真實(shí)世界數(shù)據(jù)的變量識(shí)別與標(biāo)準(zhǔn)化方法學(xué)指南。
圖1. 基于常規(guī)收集健康醫(yī)療數(shù)據(jù)的觀察性研究變量識(shí)別算法開發(fā)、驗(yàn)證和評(píng)價(jià)指南(DEVELOP-RCD)(Military Medical Research, 2024)
以醫(yī)院電子病歷數(shù)據(jù)為代表的常規(guī)收集健康醫(yī)療數(shù)據(jù)(RCD),是真實(shí)世界數(shù)據(jù)的最重要的組成,近年來廣泛應(yīng)用于臨床研究?;赗CD的臨床研究常需依賴算法(如ICD編碼、手術(shù)操作編碼、AI算法等)識(shí)別患者的健康狀況(如糖尿病、膿毒癥等)。這些編碼或算法的準(zhǔn)確性嚴(yán)重影響真實(shí)世界研究的可信度。團(tuán)隊(duì)前期研究發(fā)現(xiàn)當(dāng)采用不同識(shí)別算法,高達(dá)45.5%的研究結(jié)果存在不一致。
針對(duì)這一難題,研究團(tuán)隊(duì)聯(lián)合加拿大、美國(guó)等國(guó)內(nèi)外20名專家,牽頭制定了基于RCD的變量識(shí)別方法學(xué)框架和流程(圖2);針對(duì)“算法評(píng)估→開發(fā)→驗(yàn)證→應(yīng)用評(píng)價(jià)”四個(gè)關(guān)鍵步驟,形成了13條技術(shù)推薦意見。研究團(tuán)隊(duì)還將建立的關(guān)鍵技術(shù)運(yùn)用到復(fù)雜疾病的變量識(shí)別,通過開發(fā)基于AI算法的膿毒癥識(shí)別模型,成功將膿毒癥識(shí)別的敏感性從ICD編碼40%提升到81%。
圖2. 基于常規(guī)收集健康醫(yī)療數(shù)據(jù)的觀察性研究變量識(shí)別算法開發(fā)、驗(yàn)證和評(píng)價(jià)的關(guān)鍵流程(Military Medical Research, 2024)
該方法指南是課題組在真實(shí)世界研究領(lǐng)域的又一重要成果。自2014年以來,依托循證醫(yī)學(xué)學(xué)科優(yōu)勢(shì),課題組深耕真實(shí)世界數(shù)據(jù)研究,開發(fā)了系列真實(shí)世界研究方法;構(gòu)建了覆蓋12萬患者、10億余條數(shù)據(jù)的重癥隊(duì)列,相關(guān)成果發(fā)表在BMJ, Journal of clinical epidemiology, Critical Care, Critical Care Medicine等國(guó)際權(quán)威雜志。
我院王雯副研究員、武漢大學(xué)中南醫(yī)院循證與轉(zhuǎn)化醫(yī)學(xué)中心靳英輝副教授作為共同第一作者,孫鑫研究員和王雯副研究員為共同通訊作者。該研究工作得到了國(guó)家自然科學(xué)基金杰出青年基金、四川省科技廳及我院1·3·5項(xiàng)目等資助。
原文鏈接:https://doi.org/10.1186/s40779-024-00559-y