Go to contents

自ら語らないデータ

Posted November. 14, 2022 08:42,   

Updated November. 14, 2022 08:42

한국어

「数字は自分で語らない。代わりに私たちが語ってあげる。我々は数字に意味を与える」(ネイト・シルバーの「シグナルとノイズ」)

データ科学は、データから新しい価値を見出す学問だ。データ科学者ネイト・シルバーは、数字に私たちが意味を付与すると言ったように、データの価値は人間が決める。この点で、データ科学は芸術である。音楽が音に意味を与えるように、データサイエンスは、データに意味を与える。MZ世代や人口絶壁など、韓国社会の自画像はデータ科学の作品ともいえる。さらに、データ科学は総合芸術である。問題に対する深い理解とデータ分析に対する専門理論などがよく調和すれば、立派な作品が出てくるからだ。例えば、ルドルフ・ジュリアーニ元ニューヨーク市長は、1994年の就任直後、犯罪関連データ分析システムを導入し、犯罪予防政策に適用した結果、辞任当時、ニューヨーク市の犯罪率は7.6%も下落した。

データ科学はまた、芸術であると同時に科学である。芸術作品は、関連専門家や大衆によって評価されるが、データ科学の作品は正確性で評価される。データ基盤の未来予測は、時間が経つにつれ、いつかはその予測の真偽が分かるためだ。その予測は、人口が指数的に爆発して人類が滅びるという18世紀のマルサスの人口論のように、頻繁に外れたりもする。

梨泰院(イテウォン)惨事を見ながら、データ科学者として多くのことを考えるようになる。あまりにも多くの人が狭い空間に集まっていることを、防犯カメラや地下鉄の乗客現状などのデータは知っていたはずだ。しかし、私たちは意味を与えなかったので、惨事を防ぐことができなかった。データに愛情がなかったり、結果を歪曲したり、あるいは私たちがあまりにも怠けているからではないか、その理由を考えてみる。若い魂に負った借金を、どのように返済すればいいか悩む秋だ。