大數據在商業應用也許可以精準無比,
產品代銷
,但到了其他領域可能無法如此順利。去年協助台南市政府打擊登革熱的成功大學團隊,
網路行銷達人
,就面臨到這一個困擾,
網域申請
,因為最重要的病情資料是由「人」所回憶出來的,
清境住宿
,難免出錯。該團隊設計一套容錯制度,
清境農場民宿
,為資料正確性打分。去年台南市爆發嚴重登革熱疫情,
台式泡菜
,成功大學跨資訊、數學、公衛、環衛、醫學等學術專家與學生約廿人,透過資料科學預測技術,與台南市政府一起打了一場人類與蚊媒的大戰。成功大學資工系教授莊坤達指出,一般的大數據是在正確資料下,挖出一個寶物出來。但應用在與人互動的領域時,資料不一定能夠完美。莊坤達舉例,登革熱病情資料是參考病人回憶,蚊媒資訊則多由防疫人員記錄,精準度會不如機器。他說,為大數據設計容錯機制,研究出完美的演算法,是另一大挑戰。莊坤達說,「當時團隊最想要了解的就是:現在的傳染熱點在哪裡?下一個傳染熱區又會在哪裡?」如何在廣大市區、繁密建物中抓到病媒蚊與傳染熱點,進行有效率的噴藥撲滅,是團隊的重要任務。登革熱主要追蹤出兩種變數:病媒蚊與傳染病人移動範圍。成功大學數學系教授舒宇宸說,「我們不可能在蚊子上裝GPS追蹤,蚊子移動範圍也比較小,不會超過五十公尺。更重要的就是傳染病人發病前去過哪些地方」。不過,從病人口中問出精確的回憶,並不是件容易的事情。莊坤達說,除了工作地、居住地外,希望病人回憶起停留較久時間的地點。「但是病人發病時有時都很痛了,難免會出現回憶不精確、或亂回答的情況」。舒宇宸補充,像去年台南市某兩區病例數較多,可是團隊很疑惑,因兩區的病人並沒去過彼此地點,距離也超過病媒蚊移動範圍。後來發現,原來該兩區的病人,都去過同一個市場買菜,可能是在市場裡面傳染的。莊坤達指出,如果病人回答去過某些地點,但那個地點沒發生過病例,資料的可信度分數就會低一點。或者,病人只講去過某個路口旁邊空地,但那塊空地可能非常大,分數也會被打低。另外也發現,雨量與發病人數也密切相關,下大雨後最好十八天內就清除掉積水。,