[IT동아] “평범한 직장인 홍길동 대리의 책상은 언제나 수많은 데이터로 넘쳐난다. 매출 보고서와 고객 유입 경로, 마케팅 효율 분석 등 하루에만 수십 개의 데이터가 그의 손을 거쳐 갔지만, 이들 데이터에서 정작 의미 있는 인사이트를 찾아내는 것은 하늘의 별 따기 격으로 어려웠다.
그러다가 데이터를 잘 활용해서 가장 알맞은 결과를 내놓는다는 인공지능(AI)이 등장했다. 모두가 AI를 앞다퉈 배우는 것을 보고, 홍길동 대리 역시 유행에 뒤처질 수 없다는 생각에 챗GPT를 비롯한 최신 AI 도구를 연구했다. 그는 처음에는 AI가 그럴듯한 그래프와 보고서를 순식간에 만드는 것을 보고 감탄했지만, 기쁨은 오래가지 않았다.
AI가 제시한 분석 결과는 종종 비즈니스의 핵심과 어긋났다. 심지어 현실과 판이한 결론을 내기도 했다. AI는 ‘왜 이 데이터가 이런 패턴을 보이는지’ 설명하지 못했고, 잘못된 전제에서 출발한 분석은 치명적인 의사결정 오류를 일으킬 위험을 만들었다. 홍길동 대리는 그 때 깨달았다. 진짜 문제는 분석 도구의 부재가 아니라, 데이터를 올바르게 이해하고 질문하는 능력의 부재라는 것을.”
이러한 현상은 비단 개인의 경험에 국한되지 않는다. 최근 MIT 테크놀로지 리뷰에 실린 한 보고서는 ‘생산성 역설(Productivity Paradox, 많은 기업이 AI를 도입하는데 막대한 비용을 쏟아부었음에도 생산성 향상으로 이어가지 못하는 현상)’을 지적한다. 이 보고서는 AI를 성공리에 도입하려면 기술 자체가 아닌, 그 기술을 이해하고 비판적으로 활용하는 ‘인간의 능력’이 반드시 필요하다고 강조한다. 이것이 홍길동 대리가 AI가 아닌 데이터의 본질을 파고 든 계기다.
챗GPT의 허와 실: 데이터 분석가의 관점에서
AI, 특히 대화하듯 질답을 주고받으면 정보를 정리해 주는 챗GPT는 데이터 분석의 패러다임을 바꿀 혁신 도구임에 틀림없다. 챗GPT는 복잡한 코드를 단 몇 초 만에 만들고, 방대한 양의 텍스트 데이터도 순식간에 요약한다. 이를 토대로 분석 아이디어를 제공하는 능력은 분명 경이롭다. 많은 사람들이 챗GPT만 잘 활용하면 뛰어난 데이터 분석가가 될 것이라고 믿는 이유다. 하지만 이 믿음에는 반드시 짚고 넘어갈 ‘허상’과 직시할 ‘실체’가 있다.
허상(虛): AI는 만능 해결사라는 환상
많은 사람들이 ‘AI에게 데이터를 던져주기만 하면 마법처럼 인사이트가 나올 것’으로 기대한다. 실제로 “우리 회사의 매출 증대 방안을 알려줘”와 같은 막연한 질문을 해도, AI는 온라인 공간에 있는 일반 정보들을 조합해 그럴듯한 답변을 내놓는다. 하지만, 이 답변에는 우리 회사의 구체적인 비즈니스 맥락, 데이터의 특수성, 숨겨진 함의 등이 전혀 담겨있지 않다. 또한 AI는 잘못된 정보를 매우 자신감 있게 제시하는 ‘환각(할루시네이션, Hallucination)’ 현상을 보이기도 한다. 검증 능력이 없는 사용자가 AI의 답변을 맹신하는 순간, 데이터 분석은 길을 잃고 산으로 가게 된다.
실체(實): AI는 능력 있는 ‘신입사원’이다
데이터 분석 관점에서 챗GPT의 실체는 ‘능력은 뛰어나지만, 경험과 도메인 지식이 전무한 신입사원’에 가깝다. 이 신입사원은 주어진 지시(프롬프트)에 따라 데이터 정제, 코드 작성, 기초 통계 분석 등 반복적이고 정형화된 업무를 놀라운 속도로 처리한다. 분석가의 업무 부담을 획기적으로 줄여주는 강력한 보조 도구인 셈이다.
그렇기에 AI에게 ‘무엇을’, ‘어떻게’ 분석할지 명확하게 지시하는 것은 온전히 분석가의 몫이다. 데이터에 어떤 편향이 있는지, 어떤 변수를 조합해야 새로운 관점을 얻을지, 분석 결과를 비즈니스 언어로 어떻게 해석하고 설득할지 결정하는 것은 AI가 아닌 인간의 영역이다. 즉, AI를 제대로 활용하려면 역설적으로 AI보다 더 깊은 데이터 이해력과 날카로운 문제 정의 능력이 요구된다. AI는 분석가의 ‘대체재’가 아니라, 분석가의 역량을 극대화하는 ‘촉진제’여야 비로소 그 가치를 발휘한다.
변하지 않는 핵심: 통계 이해력과 상용 도구 활용 능력
최신 AI 기술이 홍수가 밀려오듯 나오는 가운데, 우리는 종종 데이터 분석의 가장 기본적인 역량을 간과하곤 한다. 이 때야말로 제대로 된 전문가로 자리 잡으려면 변치 않는 핵심, 즉 ‘통계적 문해력(Statistical Literacy)’과 ‘상용 분석 도구 활용 능력’을 예리하게 갈고 닦아야 한다.
[모든 분석의 뼈대, 통계적 문해력]
통계는 데이터에 숨겨진 진실과 거짓을 구분하는 가장 강력한 무기다. 평균의 함정, 상관관계와 인과관계의 혼동, 통계적 유의성의 올바른 해석 등은 AI가 판단하지 못하는 영역이다. 예를 들어, AI는 ‘특정 지역의 아이스크림 판매량’과 ‘상어의 공격 횟수’ 사이에 높은 상관관계가 있다고 분석한다. 그리고 이것을 ‘아이스크림이 상어 공격을 유발한다’는 단순한 인과관계로 이어가기도 한다. 반면, 같은 상관관계를 보고 ‘더운 날씨’라는 공통 요인을 찾아내는 것은 통계적 사고 능력을 가진 인간의 몫이다.
이러한 통계적 문해력이 없다면 우리는 AI가 보여주는 현란한 시각화에 현혹될 것이다. AI의 분석 결과 뒤에 숨겨진 오류를 발견하지 못한 채 잘못된 의사결정의 늪에 빠지게 될 것이다. 탄탄한 통계 지식은 데이터의 홍수 속에서 길을 잃지 않게 해주는 등대와 같다.
[손에 익은 무기, 상용 분석 도구]
챗GPT가 만능 무기처럼 보일지라도, 실제 현장에서는 손에 익은 무기가 가장 강력한 효용을 발휘하는 법이다. 데이터 분석 실무에서 마이크로소프트의 엑셀(Excel), 미니탭(Minitab), SQL 등의 상용 도구는 여전히 가장 신뢰받고 널리 쓰이는 무기다.
이들 상용 도구의 가장 큰 강점은 ‘과정의 투명성’과 ‘결과의 신뢰성’이다. 미니탭이나 엑셀의 함수 하나, SQL의 쿼리 한 줄에는 분석가의 의도가 명확하게 담긴다. 덕분에 문제 발생 시 어느 단계에서 오류가 생겼는지 역추적이 가능하다. 이는 모든 것을 블랙박스처럼 처리하는 일부 AI 모델과 대치되는 지점이다. 데이터를 직접 정제하고 가설을 세워 검증하며, 원하는 형태로 시각화하는 과정을 통해 분석가는 데이터에 대한 깊은 이해와 통제력을 갖게 된다. AI에게 코드 생성을 요청하더라도, 그 코드가 올바르게 작동하는지 검증하고 수정하는 능력은 결국 이러한 상용 도구에 대한 숙련도에서 나온다.
유행을 넘어 본질로, 진짜 전문가의 길
우리는 지금 기술로 인해 빠르게 변화하는 시대를 산다. 기술의 변화 속도를 체감하노라면 현기증이 날 정도다. 어제는 빅데이터, 오늘은 AI, 내일은 또 다른 신기술이 우리를 유혹할 것이다. 하지만, 이럴 때일수록 홍길동 대리가 겪은 사례는 우리에게 중요한 메시지를 던진다. 진정한 전문가의 가치는 반짝이는 유행을 좇는 데 있는 것이 아니라, 변치 않는 본질을 꿰뚫는 힘에 있다는 것이다.
데이터 분석의 본질은 결국 ‘올바른 질문을 통해 비즈니스 문제를 해결하고 가치를 창출하는 것’이다. AI는 이 여정에서 우리의 작업 속도를 높여주는 강력한 엔진이 될 수 있다. 이 때 어디로 가야 할지 방향을 결정하는 운전대는 여전히 우리가 쥐었다.
업계를 선도하는 데이터 능력자가 되는 길은 ‘최신 AI 도구 마스터하기’ 과정에 있지 않다. 오히려 지금 내가 다루는 데이터의 의미를 파고들고, 통계학의 기본 원리를 다시 공부하며, 손에 익은 미니탭이나 엑셀 혹은 SQL의 활용 능력을 극한으로 끌어올리는 ‘과거의 방식’ 속에 그 해답이 숨어 있을지 모른다.
유행에 흔들리지 않고 기본의 힘을 믿는 것. 새로운 기술을 비판적으로 수용하고 나의 강점을 더욱 강화하는 지혜를 발휘하는 것. 이것이야말로 시시각각 변하는 기술의 파도 속에서 자신만의 가치를 증명하는 진정한 데이터 전문가의 길이 될 것이다.
