在“數據**”的時(shí)代背景下,世界逐漸被數據所“淹沒(méi)”,隨之而來(lái)的“大數據”更是滲透到人類(lèi)生產(chǎn)、生活的各個(gè)領(lǐng)域,推動(dòng)著(zhù)新一波的技術(shù)***,在這一波時(shí)代大潮中,每一個(gè)醫療工作者迫切關(guān)心的是醫療行業(yè)如何運用“大數據”這一***性的技術(shù)。2017年3月8日由中國數字醫療網(wǎng)(HC3i)、中關(guān)村互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟移動(dòng)醫療專(zhuān)委會(huì )主辦的“西部醫院信息化大會(huì )”上來(lái)自北京大學(xué)腫瘤醫院(以下簡(jiǎn)稱(chēng)“北大腫瘤醫院”)的信息中心工程師王立軍,從醫療的角度分享了大數據在醫院中的實(shí)際應用。
北京大學(xué)腫瘤醫院信息部工程師 王立軍
北大腫瘤醫院作為一家集醫、教、研于一體,預防、治療、康復相結合的三級甲等腫瘤專(zhuān)科醫院,具有較高的醫療技術(shù)水平和較強的醫療服務(wù)能力。在2010年被批準為教育部“惡性腫瘤發(fā)病機制及轉化研究”重點(diǎn)實(shí)驗室,醫院現有29個(gè)臨床科室,14個(gè)醫技科室,27個(gè)病區790張病床,年住院人數4萬(wàn)余人次,年門(mén)診量45萬(wàn)余人次。如何讓數據發(fā)揮更大的作用,為腫瘤患者更好的服務(wù),成為信息中心不斷思考的問(wèn)題,在一系列的嘗試過(guò)程中,王立軍對于“大數據思維”,也有了獨到的見(jiàn)解。
大數據思維更重要
眾所周知,大數據具有量大、多樣、快速、高值的特點(diǎn)。“從大數據的特點(diǎn)來(lái)看,醫院當前沒(méi)有完全意義上的大數據;大數據技術(shù)是傳統IT的突破性提高,但說(shuō)不上***性創(chuàng )新”,北大腫瘤醫院信息中心工程師王立軍這樣說(shuō)道。
既然醫院現階段根本沒(méi)有真正意義的大數據,為什么大家都在談醫療大數據?其實(shí)對于醫療大數據來(lái)說(shuō),不能單純只靠量大來(lái)衡量,真正的價(jià)值在于運用醫療大數據的技術(shù)實(shí)現歷史醫療資源的再利用,并借助大數據的思維和方法進(jìn)行研究,完成過(guò)去傳統思維、方法、技術(shù)無(wú)法完成的任務(wù),解決過(guò)去無(wú)法解決的問(wèn)題,使得數據加以利用,形成從量變到質(zhì)變的過(guò)程,同時(shí)通過(guò)多維度的分析研究,實(shí)現對醫療數據的高效檢索、后結構化、分析計算。
科研數據應用--當今醫院的痛點(diǎn)
與普通的綜合醫院相比,專(zhuān)科醫院在各方面都有其自身的特點(diǎn),北大腫瘤醫院的臨床數據同樣存在一些特殊性:
第一,復診率高,治療周期記錄完整(跟隨病人多年診療次的過(guò)程);
第二,隨訪(fǎng)數據完善(以治療次為時(shí)間軸,同時(shí)搜集門(mén)診數據與住院數據)
對于腫瘤醫院來(lái)說(shuō),病人出院后,醫院需要對病人的復**況進(jìn)行實(shí)時(shí)監測,因此如果把每個(gè)過(guò)程、每個(gè)階段聯(lián)系起來(lái),傳統的技術(shù)則無(wú)法實(shí)現,此時(shí)就需要醫院利用大數據來(lái)實(shí)現。
經(jīng)過(guò)醫院信息化20余年的發(fā)展,臨床所需的單一患者數據已基本能滿(mǎn)足,但是臨床數據應用由于數據質(zhì)量、數據標準、數據挖掘等問(wèn)題,還處于試驗階段,無(wú)法規模化應用于臨床。近年來(lái)隨著(zhù)醫院科研任務(wù)及要求的增加,對科研數據獲取的準確性及效率要求越來(lái)越高,傳統的手工或半手工獲取科研數據的方式已不能滿(mǎn)足要求,因此解決醫院的科研數據問(wèn)題,成為醫院IT人員的重要任務(wù)。
五大臨床科研探索路徑實(shí)踐
面對當前科研存在的二次錄入數據效率低,增加臨床大夫負擔、書(shū)寫(xiě)效率低及使用率低、臨床醫學(xué)科研項目數據分散、數據不延續等問(wèn)題,北大腫瘤醫院通過(guò)以下五個(gè)臨床科研探索路徑進(jìn)行嘗試實(shí)踐:
第一,篩選入組患者,二次錄入。
傳統的“到信息部或統計室通過(guò)數據查詢(xún)工具篩選符合條件的入組患者列表,查詢(xún)病案或電子病歷記錄,將符合條件的數據錄入數據庫,最后對數據庫進(jìn)行分析”。這種方法的缺點(diǎn)是數據收集效率低下、準確性差。面對這個(gè)問(wèn)題,醫院思考通過(guò)結構化病歷搜集數據,并因此做了第二階段的嘗試。
第二,結構化電子病歷。
病歷模板結構化采集數據是業(yè)內共識,然而易增加臨床大夫負擔,且后期利用仍需要臨床大夫進(jìn)行二次整理,書(shū)寫(xiě)效率低導致使用率低,無(wú)法滿(mǎn)足臨床科研采集的需要,那么能否后臺靠算法自動(dòng)轉換成結構化病歷呢?
第三,臨床科研一體化病歷書(shū)寫(xiě)與采集體系。
這一階段則是基于上述結構化電子病歷前結構化的難題產(chǎn)生的,因此在做該采集系統時(shí),要求數據盡量在發(fā)生期進(jìn)行采集,同時(shí)以醫師為視角,提升臨床書(shū)寫(xiě)效率,以電子病歷為平臺,建立臨床科研一體化病歷書(shū)寫(xiě)與采集體系。在實(shí)現科研數據收集的同時(shí),不增加日常工作量。目前北大腫瘤醫院已經(jīng)完成5000例的病人數據收集。
第四,基于CDR的科研數據采集體系。
上一路徑雖然實(shí)現了基于前瞻性研究的科研數據搜集,但是回顧性研究數據如何解決?基于CDR的科研數據采集體系成為了解決方法,該體系**臨床各種數據,CRF表單對應模式,填報人(醫生或護士)進(jìn)行確認填寫(xiě)表單(機器對應自動(dòng)填寫(xiě)),同時(shí)基于傳統SQL的人工分析思路,做后結構化病理報告等關(guān)鍵數據,但是病歷的問(wèn)題并沒(méi)有最終解決,對于如何喚醒“沉睡的歷史病歷”,醫院又進(jìn)行了基于大數據的機器學(xué)習。
第五,基于大數據技術(shù)的后結構化數據采集。
通過(guò)后結構化,保持醫生書(shū)寫(xiě)習慣和思考邏輯的基礎上,實(shí)現對既往病歷的結構化處理,滿(mǎn)足科研數據采集需求。
路徑比較圖
通過(guò)以上五個(gè)階段的臨床科研路徑探索不難發(fā)現:挖掘數據價(jià)值,不僅限于解析清洗出臨床數據,而是在于數據價(jià)值臨床、科研、產(chǎn)業(yè)的轉化,因此如何挖掘真正有價(jià)值的數據,這就對數據的高準確性提出了要求。
最后,王立軍還說(shuō)道:“醫院目前在做健康篩查,也就是將常人的信息跟患腫瘤人的信息進(jìn)行走勢觀(guān)測,從而實(shí)現對腫瘤的預測,未來(lái)有可能實(shí)現滴血驗腫瘤。”對于醫療大數據的發(fā)展前景,他表示十分看好,同時(shí)也期待大數據在基因組學(xué)分析等方面的更高一級應用的出現。