用人工智慧預測疫情神準 華裔工程師獲美媒肯定
疫情大流行至今已一年有餘,許多人都迫切的想知道,究竟要到何時疫情才能趨緩?什麼時候才能恢復正常生活呢?
在沒有絕對可信預測機制的當前,一位沒有醫學背景的 27 歲資料科學家「Youyang Gu」憑一己之力,做出了精準度遠超過專業機構的預測模型,更讓美國知名新聞機構彭博社(Bloomberg Businessweek)稱他為「COVID-19 資料的超級巨星」。
在介紹這位年少有為的 Youyang Gu 之前,先讓我們話說從頭、把時間倒回 2020 年年初。
英美兩大專業機構 預測新冠疫情失準
當時新冠疫情已然爆發,在各國之間大流行,每個人都想知道冠狀病毒接下來造成的影響會有多大。當時多數人都將期望放在兩家專業機構建立的預測系統:一是倫敦帝國理工學院(Imperial College London),二是位於西雅圖的健康指標與評估研究所(IHME)。
但這兩家備受期待的機構,卻產生了截然不同的預測結果。倫敦帝國理工學院警告說:「到夏季時,美國的死亡病例可能會達到 200 萬人」;相較之下,IHME 的預測則保守許多:他們估計到 8 月時,美國死亡人數約為 6 萬人。
但後來事實證明,兩者都離實際數字頗有差距──8 月初時,美國的死亡人數約為 16 萬人。
一般民眾可能感嘆個兩句「結果居然這麼差這麼多!」就置之腦後了,但對於有專業數據分析背景的 Youyang Gu 來說,這件事成為他展開未知旅途的契機。
以機器學習來理解資料
在看到專業機構的結果後,Youyang Gu 毅然決然地選擇自己打造出一個使用人工智慧來預測疫情死亡人數的模型。2020 年 4 月中旬, Youyang Gu 僅僅耗費了一週的時間,就建構出預測模型,還架好了可以展示預測結果的網站,取名為「covid19-projections.com」。
即使他沒有任何醫療或公共衛生的專業背景,但他認為用演算法進行的資料預測分析──正也是他的專業──可以在此時大展身手。「我就是單純地認為,數學和統計知識可以應用到生活中的任何方面,那當然也可以用在預測疫情。」Youyang Gu 表示。
Youyang Gu 大學和碩士皆畢業於 MIT,擁有電腦科學與數學雙學士學位、電腦科學的碩士學位,畢業後則進入遠近馳名的 MIT 電腦科學與人工智慧實驗室(CSAIL),在 NLP 小組中進行了一年的研究,並在 NLP 領域的頂尖會議「EMNLP」上發表論文。從此他開始接觸大數據,也開始累積建立統計模型、預測數據的能力。
隨後他離開校園,進入金融行業,為銀行的高頻交易(英語:high-frequency trading,HFT,指利用電腦以快於毫秒的速度快速押注買賣股票、期貨等,從那些人們無法利用、極為短暫的市場變化中尋求獲利的自動交易系統。)系統編寫演算法,而金融交易資料講求的精準與量化,使 Youyang Gu 建造模型的能力與對資料處理的理解又更上層樓。離開金融產業後,他進入了體育界,繼續進行大數據領域的研究,這讓他除了懂得更加精準地建模,也累積了能應對全新領域的跨學科經驗。
Youyang Gu 表示,他的專長是「使用機器學習來理解數據,將資訊與雜訊分離,並做出準確的預測」。
準到怕!人工智慧預測死亡人數幾乎命中
▲ Youyang Gu 親自講解自己一手打造的 Covid-19 預測網站
重點來了,那 Youyang Gu 使用機器學習技術的預測結果如何呢?
在模型建立完成後,他預測了 5 月 9 日美國將有 8 萬人死亡──而當天的實際死亡人數總計為 79,926 人!這個極微小的誤差,與 IHME 預測的「2020 整年的死亡人數不超過 8 萬」相比,真可以說是神準至極了。
接著,他預測在 5 月 18 日死亡人數會達到 9 萬,而到5 月 27 日,人數將達到 10 萬。後來比對當天的實際人數,都相差不大、十分精準。除了數據資料外,Youyang Gu 也考量許多現實情況,例如當時有許多州從封鎖狀態轉為開放,於是預測到將出現第二波大規模的感染和死亡案例。
Youyang Gu 是用了什麼特殊的方式,讓疫情預測如此神準?請見下篇!連結點此。
延伸閱讀:
【機器學習懶人包】 10種演算法圖解-從監督式到非監督式學習
留言列表