臨床科研數據庫系統的現狀與未來(下)(臨床研究數據庫)
導讀
本文介紹臨床科研數據庫系統的主要的技術問題,提出與隨訪系統以及醫療業務信息系統的整合、圍繞研究問題從原始數據直接提取科研數據的能力是未來臨床科研數據庫系統發展的重點。
《臨床科研數據庫系統的現狀與未來(上)》已介紹臨床科研數據庫的三種常見類型、特點,以及系統的發展演變。本文將闡述其主要技術問題以及未來發展重點。
三、臨床科研數據庫系統的主要技術問題
根據臨床科研數據庫的發展需求,構建一個完整、高效、靈活的臨床科研數據庫半臺需要解決以下關鍵技術問題。
3.1 病例數據模型的表達
臨床科研數據是圍繞科研問題從原始的醫療(電子病歷)數據或其他來源數據中采集加工的病例特征數據。針對原始觀察性醫療數據,可采用類似于電子病歷的數據模型表示,這方面有標準化的數據模型可供借鑒,如觀測性醫療結果合作組織(OMOP)的通用數據模型(CDM)。而對于特征化的數據,則每個研究都有所不同,需要結合病例表單進行定義。
作為平臺化的臨床科研數據庫系統,要能夠根據臨床科研的數據需求和科研設計者的需要,動態建立和表達每一研究項目對應的數據模型。解決數據模型動態定義的問題,當前有三種技術路線:
1、基于傳統的關系數據庫表達和動態建立所定義的模型;
2、基于XML或對象數據庫表達和建立所定義的模型;
3、基于底層的Key-Value通用模型,在其上進一步建模構建所定義的模型。
三種方式各有特點,但后兩種方式更便于數據平臺的統一管理和處理實現。RedCap系統采用了關系數據庫MySQL基礎上的Key-Value表示方法。臨床數據交換標準協會(CDISC)制定的臨床研究數據交換標準,采用了基于XML文檔和類似于“Key-Value"的數據元素,有很好的適應性。
3.2 病例表單的靈活定義
病例采集表單由臨床科研數據庫平臺所提供的界面元素類型、屬性、組合、布局等進行定義,其靈活性決定了數據錄入采集界面的美觀和易用性。對數據校驗的定義能力很大程度上影響到數據的錄入質量,除了常規的類型一致性、非空值、值域校驗外,數據項之間的校驗可采用表達式、函數以提高校驗表達能力。
3.3 醫療數據的自動關聯與提取
根據臨床科研數據庫所定義的數據項,最大程度地從原始醫療數據中自動關聯和提取病例數據,是減輕臨床科研人員數據整理工作量的關鍵,也是當前臨床科研數據庫系統的關鍵技術。要較好地實現這一目的,除了提供數據項映射外,要實現對時間點、醫療事件的自動識別,以及數據項的計算處理和自動判斷。更進一步,針對原始醫療記錄中大量的自由文本,需要采用規則定義、機器學習等方法,實現從自由文本中自動提取結構化數據項。由于自然語言處理技術的進展和局限性,把這一技術集成到臨床科研數據庫平臺還處于發展之中。
四、未來發展
隨著需求、技術和應用的發展,未來的臨床科研數據庫系統還將進一步發展。其中,有以下幾點值得關注。
4.1 與院后隨訪系統的整合
院后隨訪數據作為患者臨床結局的反映,是多數臨床研究中必須收集的數據。傳統的院后隨訪除了患者到門診隨訪外,主要依靠臨床研究人員電話隨訪,存在工作量大、失訪率高、數據質量受限等普遍性問題。隨著互聯網、移動通信技術的發展,通過網頁、微信、App等多種形式的患者院后隨訪服務以及患者自報告結局(PRO)成為可能,隨訪問卷、原始報告等都可以由患者直接錄入或上傳。未來的臨床科研數據庫應能與新型的院后隨訪系統相集成,實現臨床數據與隨訪數據的一體化整合,從而有效提升科研數據完整度。
4.2 與醫療業務信息系統的協同
從醫療記錄中回顧性提取科研數據是科研數據采集的難點,實踐中始終存在著原始記錄不全、結構化技術要求高的困擾。建立“臨床科研一體化”的電子病歷系統,由醫護人員在診療現場電子病歷系統中直接以結構化方式錄入各類醫療記錄(即“前結構化”)也有諸多探索,但實現全結構化的電子病歷無論是從技術上還是應用上目前都不理想。然而,結合臨床研究需要,把結構化的科研數據表單以“插件”形式集成到臨床電子病歷系統中,兼顧臨床記錄的描述性和科研數據的結構化,卻是可行的。另外,近幾年,在臨床專業學會的推動下,一些專科化的檢查開始推行結構化報告,也為科研數據采集提供了便利。未來,臨床科研數據采集需求會更多地體現在醫療業務信息系統中,兩類系統之間的協同互補將是發展的趨勢。
4.3 回顧性研究數據收集利用模式的改變
在目前的科室專科專病數據庫中,有相當一部分是為未來的回顧性研究建設。一方面,在研究問題不確定的情況下,建設和維持科研數據庫需要投入專門力量,長期持續難度大;另一方面,隨著電子病歷數據的完善和數據處理分析技術能力的提升,當提出研究問題時,能夠針對研究問題直接從原始數據中提取所需特征變量開展研究。
結語:
專業化數據服務能力的支持,能最大程度地減輕臨床科室工作量,這一趨勢在醫院的大數據中心工作實踐中已經開始顯現。在這種模式下,臨床研究所需要的數據特征更為精準、數目縮小,對病例錄入表單的定義需求降低,對從原始數據到科研特征數據的加工能力要求提高。
未來,臨床科研數據庫系統的數據加工功能會進一步加強,預先建庫的模式將更多地轉為有研究問題時的即時建厙和數據加工,整個過程將進一步簡化。
文章來源:[1]薛萬國,喬屾,車賀賓,孫曉春.臨床科研數據庫系統的現狀與未來[J].中國數字醫學,2021,16(01):2-6.
文章內容有刪減