Go to contents

數據自己是不會說的

Posted November. 14, 2022 07:49   

Updated November. 14, 2022 07:49

한국어

“數字自己是不會說的。我們替它們說。我們給數字賦予了意義。”―出自納特•西爾弗的《信號與噪聲》中

 數據科學是從數據中尋找新價值的學問。正如數據科學家納特•西爾弗所說,我們對數字賦予意義壹樣,數據的價值是由人類決定的。在這方面,數據科學是壹種藝術。就像音樂賦予聲音意義壹樣,數據科學賦予數據意義。MZ壹代、人口懸崖等韓國社會的自畫像就像數據科學的作品。更進壹步說,數據科學是綜合藝術。因為,如果對問題的深入理解與對數據分析的專業理論等相融合,就會出現優秀的作品。例如,前紐約市長魯道夫•朱利亞尼在1994年就任後,引入了犯罪相關數據分析系統,適用於犯罪預防政策,結果辭職當時紐約市的犯罪率下降了7.6%。

 數據科學既是藝術又是科學。藝術作品由相關專家或大眾評價,但數據科學的作品則被評價為準確性。因為,以數據為基礎的未來預測隨著時間的流逝,總有壹天會知道預測的真偽。其預測經常與18世紀馬爾薩斯的人口論壹樣,即人口指數性爆發導致人類滅亡。

 看著梨泰院慘案,作為數據科學家產生了很多想法。閉路電視(CCTV)或地鐵乘客現狀等數據應該知悉太多人聚集在狹窄的空間裏。但是我們沒有賦予意義,所以沒能阻止慘案發生。想想原因,是不是因為對數據沒有感情,或者歪曲了結果,或者我們太懶了。秋天是壹個思索該如何償還年輕靈魂欠下的債的季節。