Go to contents

数据自己是不会说的

Posted November. 14, 2022 07:52   

Updated November. 14, 2022 07:52

한국어

“数字自己是不会说的。我们替它们说。我们给数字赋予了意义。”―出自纳特•西尔弗的《信号与噪声》中

 数据科学是从数据中寻找新价值的学问。正如数据科学家纳特•西尔弗所说,我们对数字赋予意义一样,数据的价值是由人类决定的。在这方面,数据科学是一种艺术。就像音乐赋予声音意义一样,数据科学赋予数据意义。MZ一代、人口悬崖等韩国社会的自画像就像数据科学的作品。更进一步说,数据科学是综合艺术。因为,如果对问题的深入理解与对数据分析的专业理论等相融合,就会出现优秀的作品。例如,前纽约市长鲁道夫•朱利亚尼在1994年就任后,引入了犯罪相关数据分析系统,适用于犯罪预防政策,结果辞职当时纽约市的犯罪率下降了7.6%。

 数据科学既是艺术又是科学。艺术作品由相关专家或大众评价,但数据科学的作品则被评价为准确性。因为,以数据为基础的未来预测随着时间的流逝,总有一天会知道预测的真伪。其预测经常与18世纪马尔萨斯的人口论一样,即人口指数性爆发导致人类灭亡。

 看着梨泰院惨案,作为数据科学家产生了很多想法。闭路电视(CCTV)或地铁乘客现状等数据应该知悉太多人聚集在狭窄的空间里。但是我们没有赋予意义,所以没能阻止惨案发生。想想原因,是不是因为对数据没有感情,或者歪曲了结果,或者我们太懒了。秋天是一个思索该如何偿还年轻灵魂欠下的债的季节。