人工智能疾病預防:無需犧牲隱私與安全

聯邦學習(federated learning)使人工智能能夠在不損害患者隱私的情況下,通過在醫院數據上訓練模型來幫助預測疾病爆發。這項技術在構建強大的疾病監測系統以更好地應對公共衛生事件的同時,確保了敏感健康信息的安全。
在巴西,雨季帶來的不僅是洪水和潮濕,往往還伴隨著登革熱的流行。登革熱是一種由蚊子傳播的疾病,會導致患者發高燒、出皮疹,嚴重時甚至會危及生命。
過去25年間,巴西已有超過1800萬人感染登革熱,而到2024年6月,該病的病例數激增,已達600萬例,死亡4000人。受登革熱影響的不止巴西,世界衛生組織的數據顯示,全球約有一半人口面臨登革熱風險,每年估計有1億至4億人感染。
自COVID-19以來,全球研究人員紛紛借助人工智能監測潛在的疾病暴發情況。但這些努力面臨一個主要障礙:獲取敏感的健康數據。聯邦學習技術使醫院和相關機構能夠在不共享患者數據的情況下構建預測模型。
IEEE會員Márcio Teixeira參與了 “登革熱預警” 項目,該項目旨在訓練機器學習模型,以預測登革熱的嚴重程度、識別疫情暴發模式并優化資源分配。
下文將介紹Teixeira對聯邦學習及其在登革熱防控中的應用所做的相關闡述。
什么是聯邦學習?它與其他人工智能技術有何不同?
聯邦學習是一種能讓研究人員在不將訓練數據從其原始位置移走的情況下訓練人工智能模型的技術。例如,假設有多家醫院或衛生中心,每家都存有登革熱患者的數據。一個共享的人工智能模型會被發送到每家醫院,然后僅利用該醫院現有的數據在本地對模型進行訓練。之后,模型只將學到的內容(即模型的更新部分)發送回中央服務器,這些更新會被匯總起來以改進全局模型。這一過程會重復多次,直到全局模型完全訓練完成 —— 而在此過程中,始終不會接觸到實際的患者數據。
傳統的人工智能技術會將所有數據集中到一個地方來訓練模型,這可能會帶來隱私風險。而聯邦學習讓數據留在原地(在這個例子中就是留在醫院),并在本地訓練模型。這使得聯邦學習更適合處理敏感數據。
是什么促使您在這一領域開展研究?
我們的研究動機源于對利用創新且保護隱私的技術改善登革熱監測與治療的迫切需求。登革熱仍是一個重大的公共衛生問題,尤其在巴西等地區,疫情暴發給醫療系統帶來了巨大壓力。
構建準確的預測模型需要獲取敏感的醫療數據,而這會引發倫理和法律方面的挑戰。巴西及許多其他國家都有嚴格的法律,對健康數據的使用、存儲和共享進行規范。
健康數據極具價值,因為它包含個人信息,如全名、出生日期、地址、病史等。一旦犯罪分子獲取這些數據,他們可能會竊取患者身份,用于賬單詐騙、虛假治療、偽造保險索賠或發起針對性的釣魚攻擊。
人工智能如何幫助預測和預防登革熱疫情?為什么這種疾病是該技術的良好測試案例?
人工智能能夠分析大量的健康、環境和行為數據,從中識別出人類可能忽略的模式。就登革熱而言,機器學習可用于及早識別高風險患者,并根據天氣狀況預測疫情 —— 因為蚊子會利用積水進行繁殖。
聯邦學習還能通過哪些方式在保障我們隱私的同時,為我們提供更優質的技術?
聯邦學習為智能技術的開發提供了一種新途徑,既能推動技術發展,又不會損害用戶隱私。除醫療領域外,它還應用于多個行業。例如,銀行可以通過協作識別欺詐模式,同時不會泄露客戶記錄;它也被應用在智能手機中,你的手機會在本地進行學習,但會為全局模型的優化貢獻力量,而信息始終不會離開你的設備。
了解更多:數字化醫療設備能夠實現更個性化的診療方案,并為提升健康預后效果帶來新希望。但它們可能成為網絡犯罪分子的目標,尤其是當這些設備通過無線方式連接到互聯網時。





評論