全民健保資料庫的美麗與哀愁

我國極高納保率的全民健保制度及健保資料庫非常難能可貴,在國際上也極為少見。這樣的醫療資料庫對於醫療實證、健保政策等議題有顯著的貢獻。惟個資安全問題不可不慎,如何取得平衡,是一大難關。

信讀者一定有機會遇過,在公家機關、保險金融機構或是醫療機構辦理手續時,常被詢問個資是否同意提供研究使用的選項。這些同意被運用的資訊,通常會被加入機構的資料庫中,再按照資料的種類進一步命名。

以醫院為例,經由病患的同意,醫療資料庫會儲存個人完整就醫的所有紀錄,當然包含檢驗、檢查、用藥、診斷或是住院等資訊;針對因醫療行為所產生的費用,向健保署申請給付,也就是健康保險的申報。由於這類的保險申報資料庫可以從病患就診起,累積大量時間順序或是治療病程的資料,若經由細心分析的話,勢必可以找出以往不易發現, 卻十分珍貴的疾病趨勢或治癒證據。假如專家能無私的透過回溯性評估某些治療方法和結果,並提供醫療研究機構對各式疾病進行預後之整體性分析,可想見其貢獻層面之廣。此外,還可以經由分析結果來進一步改善醫療政策,促進全國人民健康,或甚至加強醫療機構的經營管理。

絕無僅有的「全民健保資料庫」

台灣目前最具代表性的全國性健康紀錄,就是記錄全國民眾健康的保險申報資料─「台灣全民健保資料庫」。健保資料庫建置的目的是在保障民眾隱私的前提下,提供豐富的健康相關研究資料給學術及非營利單位,進行健康醫療與疾病等相關研究。由於我國實行全民健保制度,納保率達到百分之九十九以上,因此健保資料能夠涵蓋我國幾乎全部的醫療衛生與疾病狀況,例如長期收集全國兩千三百萬人以上的健檢資料,就是非常全面且具有研究價值的資料庫,也是現今國際上絕無僅有的。

為了可以善加使用健保資料庫,創造更多的價值,最早在一九九八年中央健保局委託國家衛生研究院規劃建置全民健保資料庫,並在二○○○年開放使用,透過公開全國健保資料,帶動健保政策與醫療衛生相關研究,進而將研究成果做為醫療衛生相關政策的參考,直至近年每年平均仍有約六百多篇的學術論文發表。

醫療保險相關資料的研究對台灣醫療貢獻良多,但醫療領域牽涉範圍較廣,涉及較多敏感議題,加上近年來個人隱私意識抬頭,法律對於各式個人資料的取得、使用規範也漸趨嚴格,尤其醫療資料含有大量病患個人隱私資訊,特別是個人疾病診斷資料更為敏感,多數民眾不願自己的疾病資訊被公開,故必須向民眾確保申請單位使用資料時,不會有侵犯隱私權及個資外洩的疑慮。

基於此,二○一四年由衛福部成立衛生福利資料科學中心,將全民健保資料庫以更安全的方式管理,目前共設有十個分中心,依法所有資料之處理必須於中心內獨立作業區進行,並禁止攜帶手機、硬碟等任何通訊設備進入,分析人員僅能攜出統計報表結果。為提升資料之加值應用,允許政府部門與學術單位檢附研究計劃書及倫理審查委員會審查書(IRB),向各中心付費申請資料分析,目前所申請資料內容皆無法直接或間接識別個人之機敏資料,因此加值資料可應用範圍也隨之擴展。至於資料科學中心在公開任何醫療資料提供使用前,必須先去除任何有關病患的個人資訊,如姓名、身分證字號、病歷號碼等,並確認病理報告資料無法對應回特定病患,也就是所謂的去識別化。各式醫療資料庫在提供申請單位進行研究的時候,除了去識別化以外,還會有一些特殊的使用限制,來保護醫療資料的資訊安全和病患的個人隱私,例如全民健保資料庫會依據各個申請單位的專案申請,來進行二次加密,並保證不同專案拿到的資料,都經過不同程序的加密。

僅管醫療資料在使用上有諸多限制,但像我國全民健保資料庫擁有如此完整的醫療資料庫,並能應用在各式各樣的研究領域,是目前國際上少見的。關於健保資料庫的相關研究,迄今已發表超過六千篇論文, 從中可以發現醫療資料庫對於醫療實證、健保政策,甚至是疾病管理經濟學都有顯著的貢獻。

破壞式創新在醫療場域──健康保險資料開放服務

全民健保開辦至今超過二十年,累積相當多健康保險、醫療行為、藥材相關資料,與民眾權益切身相關。這些可再利用之資訊,開放於公共平台運用之目的是在期望社會大眾能透過資料開放的機制,促進學術研究或資料流通及加值運用,以促成未來跨機關與民間協力合作與服務創新,進而對民眾健康創造更多的價值。

在目前進行中有關於醫療資料庫相關研究中,以國內最近火紅的智慧醫療議題來說,人工智慧技術可以做到以往單靠統計所無法達成的多層次或是深度資料分析。然而目前對於資料的使用,受限於資料科學中心的法規,僅能從分中心以虛擬雲端桌面之方式連線存取,然後操作統計軟體分析。對於人工智慧演算法之訓練流程,以及完成訓練之後的AI 推論模型,勢必無法經由分中心上傳以便測試其成效,殊為可惜。

這些龐大而多元的民眾就醫申報保險之資料庫,若在借助 AI 模型學習的能力後,同時在去識別化的資訊安全處理之後,將可能大量分析、精準解讀醫療數據,最終將是精準醫療的基礎建設。醫療在科技的幫助下,不僅只是治療疾病或預防併發症,而是一開始就透過其他資訊精準預測疾病風險,並在治療前就做到預防,最終減少疾病發生及降低健保支出。

當然,除了醫療相關的生理數值之外,會影響健康的因素其實還很多,未來醫療資料庫還可以納入更多個人資訊,如社會環境、勞動環境、心理環境、基因遺傳、文化因素等。在資訊技術的幫助下,更多不同面向的資料可以統合進醫療資料庫中,實現個人化醫療的同時,並提供病患更加合適的治療方式。

在高科技的協助下,勢必會推動醫療科技加速發展。現在越來越多不同領域的研究人才投入醫療領域,加上醫療資料庫的建立,未來醫療的精準度可望有顯著的提升。看到醫療資料庫帶來的貢獻和未來潛力, 政府機關以及各大企業都致力在建立國家級或是具有特色之資料庫,並積極水平整合醫療資料庫的應用。醫療資料庫中亦仍有許多未知的應用存在,可見醫療資料庫不僅可以促進醫療的顯著發展,其中還蘊含龐大的商機。

雖然醫療資料庫具有強大發展潛力,但若要開放資料庫,為保障個人資料安全,必定需要進行去識別化的手續。例如去識別化後的資料會失去連續性,也就是說為了避免資料使用者從資料的特徵推斷出是哪一名個案的醫療紀錄,會把紀錄打亂按照原本的數量重新亂數分配,此舉雖保障了隱私,但也必然限縮了研究的內容。

個資安全和研究成效需求始終猶如天秤的兩端,如何達到完美的平衡點,一直是醫療資料庫發展的一大難關。就像若為了達到嚴控犯罪的效果,在全民身上安裝監控器,雖然有效控制犯罪,卻又侵害了人民的隱私。尋找兩全其美的方法,將是未來任何醫療資料庫順利開放以及進一步發展的最大關鍵點,也許讀者可以從下一單元中的健康存摺看到破壞式創新在醫療場域上的精彩應用。

從AI到智慧醫療

(本文作者為蔣榮先著《從AI到智慧醫療》,商周出版提供)


延伸閱讀

被遺忘的大流行 1918年致命流感病毒

人類與病毒之戰!陳時中:抗疫,是我們全民的戰役

【後疫情時代】疫苗是最佳解法嗎?

你可能還喜歡