[김상훈 기자의 That's IT]빅데이터? 의미없는 정보는 쓰레기!

  • 동아일보
  • 입력 2012년 4월 4일 03시 00분


코멘트
제 어린 시절 꿈은 스스로 생각하는 인공지능 컴퓨터를 만드는 과학자였습니다. 대학에 가서는 조금 현실적인 꿈으로 바뀌었습니다. 바로 도서관 사서가 되는 것이었죠. 컴퓨터 과학자와 도서관 사서 사이를 연결해준 건 보르헤스였습니다. 호르헤 루이스 보르헤스, 제가 생각하는 20세기의 위대한 소설가 가운데 한 명입니다.

보르헤스에게 도서관은 우주였습니다. 책이 너무 좋아 아르헨티나 국립도서관장까지 지냈고, 책이 너무 좋아 책을 읽다 눈이 멀었죠. 그는 인류의 지식이 모두 도서관에 있다 생각했고, 그 지식을 파고 들어가는 지적인 게임을 즐겼습니다. ‘틀뢴, 우크바르, 오르비스 테르티우스’ 같은 단편소설은 우리가 지금 얘기하는 사이버스페이스와 현실세계 사이의 긴장을 설명합니다. ‘끝없이 두 갈래로 갈라지는 길이 있는 정원’은 우리가 웹페이지에서 클릭을 하면 다른 페이지로 넘어가는 ‘하이퍼텍스트’ 기능을 연상시키죠. 1940년대에 쓰인 소설입니다.

오늘날 우리에게 인터넷은 보르헤스의 전망처럼 우주가 됐습니다. 별것 아닌 것 같던 인터넷 속 세상은 이제 현실 세계에 강한 영향을 줍니다. 웹에서 어떤 정보를 클릭하느냐에 따라 우리가 받아들이는 정보도 완전히 다르게 구성됩니다. 하지만 요즘 생각나는 다른 소설이 있습니다. 보르헤스의 ‘기억왕 푸네스’란 소설입니다.

푸네스는 모든 걸 기억하는 소년입니다. 어느 날 말에서 떨어져 다쳤는데, 우연히 천재적인 기억력을 얻게 됐죠. 그 덕분에 순식간에 라틴어를 마스터하고 자연도감을 외우는 능력도 생겼습니다. 어느 정도로 기억하느냐면 어제 24시간 있었던 일을 모두 기억해서 그 모든 얘기를 오늘 24시간 동안 똑같이 묘사할 수 있을 정도입니다. 부러운가요? 푸네스는 기억을 입 밖에 내어 말하는 그 순간까지 모두 기억합니다. 기억 위에 기억이 끊임없이 누적돼 쌓이는 것이죠.

요즘 빅 데이터라는 말이 화두입니다. 빅 데이터란 기존의 기술로는 다루지 못했던 대규모 데이터를 뜻합니다. 기술 발전 덕분에 이제야 이런 빅 데이터를 다루게 되면서 새로운 신천지가 열렸다는 얘기가 나옵니다. 제겐 이 얘기가 푸네스를 연상시킵니다. 중요한 게 있습니다. 쓰레기는 모아봐야 결국 쓰레기라는 평범한 진실 말입니다.

빅 데이터가 모든 걸 해결해 줄 것으로 생각하는 기업이 많습니다. 많은 전문가가 결국 빅 데이터를 의미 있게 만드는 건 쓸모 있는 데이터가 무엇인지를 골라내는 능력이라고 경고합니다. 그리고 그런 식으로 데이터를 골라내는 건 빅 데이터라는 말이 생기기 훨씬 전부터 인류가 늘 해온 일입니다. 바로 큐레이션입니다. 의미 없는 자료를 연구하고 배열하면서 의미를 만들어 가는 일이죠. 기술 발전으로 다룰 수 있는 정보량이 늘어난 건 환영할 일이지만 그 정보에 지배될 필요도, 지레 겁먹을 필요도 없습니다. 그리고 쓸데없는 데이터를 쌓아두려고 노력할 필요는 더욱 없습니다.

참, 푸네스는 일찍 죽고 맙니다. 그가 죽은 까닭은 단순했습니다. 기억을 기억하는 기억이 쌓이는 와중에서 그는 숨이 막혔습니다.

김상훈 기자 sanhkim@donga.com
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스