國網中心建構生醫資料可信賴研究環境 滿足健康大數據永續平台隱私與研究兩大需求
發佈日期:2024.04.26
貢獻撰文研究成員:王聿泰、葉昌偉、林沿妊、潘怡倫
醫療產業進入智慧化時代,善用數據力量提升學術研究與醫療服務品質,成為產官學研界的重要策略。數據科學對醫療產業發展至關重要,但基因資料或個人疾病史等屬於個人資料的資訊也須被嚴格保護。因此,如何在保障個人隱私、不泄露原始數據的前提下,讓研究者使用資訊,並在取得資料後有完整的權限管理,確保數據的合法和合規使用,就成為近期醫療產業發展重點。
目前國際已有多種可參考的做法與機制,例如美國的癌症基因體圖譜計畫(TCGA, The Cancer Genome Atlas),就是收集特定癌症病患的臨床記錄、腫瘤組織等資訊,有些是公開使用、有些是申請下載,提供給全球的科學家、研究人員和學術機構,希望完整的癌症基因組資料庫,分享知識促進癌症研究。
由於TCGA的資料以歐美人士為主,因此國科會希望在健康大數據永續平台計畫中,建立擁有臺灣自己的腫瘤基因體資料庫,並與健保資料庫連結,形成完整資料沙盒,讓學術界和產業界均能使用,因此參考其作法與機制,並由國網中心負責建立可信賴的資訊基礎建設平台,讓獲得授權的研究人員在符合臺灣嚴謹法規,且以資訊技術保護原始資料不被攜出分析環境下進行資料分析,兼顧個資保護與醫療產業升級雙重考量。目前在打造國家級生醫資料共享共用資訊系統已有初步成果。

健康大數據生醫檢核系統流程圖
舉例在健康大數據永續平台計畫中,醫療院所與國網中心簽訂合約,明確指定將資料存放於國網中心內。至今已與八個醫學中心合作,共收集約4,000名病患的資料,資料種類包括腫瘤基因定序、醫學影像及數位病歷等。國網中心在收集資料的同時,也重視資料儲存與品質,因此制定完整的標準格式,並開發上傳系統,協助各家醫院輕鬆完成資料上傳工作,並可獲得即時統計資訊。
此計畫在執行過程中克服多項挑戰。建構可信賴環境及上傳系統屬於前瞻性作法,全球醫療領域相關案例並不多,臺灣更是首次嘗試此方式,在國網中心與醫療院所的努力下,攜手克服了多種挑戰,例如各醫療院所的資訊化程度不一,合作過程中需要不斷調整磨合、滾動式檢討,經過頻繁溝通後,最終成功建立出可協同運作的作業機制。
除了積極溝通外,國網中心也致力提升系統運作效率,例如醫療影像資料處理,國網中心與國內軟體開發團隊共同設計出自動化機制,讓系統可自動檢查資料完整性並上傳,解決最初須由人工檢查資料,導致效率不彰的做法。此系統從零開始,建置過程不僅讓合作廠商累積經驗,也可協助臺灣的生醫資訊領域培養出專業人才。
國網中心期待所建立的臺灣生醫數位資料包含醫學影像、腫瘤基因定序、數位病理、數位病歷等四大類別,同時串接健保資料庫,資料內容更完整,不僅可強化臺灣生醫研究能量,也為產業界提供更完整的數據基礎,有助於推動精準醫療發展。

NCHC打造臺灣可信賴資料雲端分析平台(2024-2027)
生醫機敏資料條文正在修改中,國網中心未來將持續繼續扮演技術支援角色,目前已著手規劃開發可擴充之雲端高速計算環境,以線上計算取代實體資料搬移或實體隔離作業區,以期未來在符合法規可進行資料釋出服務時,可提供國內授權研究團隊,在安全資料不落地、模組化服務的環境內,協助國內人體生物資料庫、健康大數據永續平台、癌症登月計畫、生技產業資料等平台服務提供,為國內生醫發展建構堅實基礎。