문송천 KAIST 명예교수가 빅데이터 품질·활용성 제고 방안으로 ‘데이터 설계’를 제시하면서 민관의 대대적인 인식변화를 당부했다. 사진은 경기 과천시 소재 한 카페에서 본지와 인터뷰 진행 중인 문송천 KAIST 명예교수. [사진=전한울 기자]

[이뉴스투데이 전한울 기자] “빅데이터 시대? 아직 도래하지도 않았어요. 기초적인 데이터 설계를 통해 중복되고 불필요한 데이터부터 정리해야 한다는 것이 50여년간의 학문적 깨달음입니다.”

국내 1호 전산학 박사이자 컴퓨터 데이터베이스 분야 최고 권위자로 꼽히는 문송천 KAIST 명예교수가 17일 본지와 인터뷰에서 “빅데이터 품질, 활용성 제고의 중심에는 ‘데이터 설계’가 있다”면서 “(데이터) 설계를 확장하기 위한 민관의 대대적인 인식변화가 필요하다”고 강조했다.

최근 민관 빅데이터 사업간 ‘데이터 품질’ 논란이 끊이지 않고 있다. 글로벌 기업의 97%가 데이터 품질에 만족하지 못한다는 ‘하버드 비즈니스리뷰(HBR)’의 조사결과는 논란의 심각성을 여실히 보여준다.

◇부피만 늘린 빅데이터…품질은 ‘나몰라라’

일련의 논란과 관련해 문 교수는 현존 빅데이터의 현실적 한계를 지적했다.

그는 “20여년 전 원자핵물리 실험에서 발생한 이후 개념이 정립된 빅데이터는 10의 15제곱, 즉 1000테라바이트 크기의 방대한 데이터”라면서 “물리학 실험에서나 나올 법한 빅데이터는 현실세계에선 매우 드물다”고 말했다.

그러면서 “(빅데이터를 보유한) 메타나 구글 등은 20여년간 쌓아온 빅데이터 전체를 공유하지 않는다. 현재 맛보기용으로 제공하는 데이터들은 빙산의 일각”이라면서 “구글의 1년치 데이터를 열람하기 위해선 2~3억원 가량을 지불해야 하며, 그마저 기한이 정해져 있고 (저장을 위한) 스토리지도 무지막지하게 늘어날 것”이라고 설명했다.

특히 빅데이터 품질과 활용성을 떨어뜨리는 주요 원인으로 ‘데이터시스템 비만화’를 꼽았다.

문 교수는 “현재 민간과 공공의 데이터시스템은 마치 인체 고도비만처럼 불필요한 데이터 중복으로 몸살을 앓고 있다”면서 “(전반적으로) 10개 데이터 중 6개는 중복되고 쓸모없는 ‘쓰레기 데이터’다. 이러한 데이터로 통계를 내면 말도 안 되는 결과가 도출된다”고 우려했다.

그러면서 “심지어 어떤 데이터가 쓰레기 데이터인지 구분할 수 있는 감별력도 ‘제로’인 상태”라면서 “여러 지자체, 공공기관과 수없이 협업해오면서 느낀 바로는 대부분 기관의 데이터와 관리 수준이 매우 엉성하다”고 지적했다.

문송천 KAIST 명예교수가 빅데이터 품질·활용성 제고 방안으로 ‘데이터 설계’를 제시하면서 민관의 대대적인 인식변화를 당부했다. 사진은 경기 과천시 소재 한 카페에서 본지와의 인터뷰를 진행 중인 문송천 KAIST 명예교수. [사진=전한울 기자]
문송천 KAIST 명예교수가 빅데이터 품질·활용성 제고 방안으로 ‘데이터 설계’를 제시하면서 민관의 대대적인 인식변화를 당부했다. 사진은 경기 과천시 소재 한 카페에서 본지와 인터뷰를 진행하고 있는 문송천 KAIST 명예교수. [사진=전한울 기자]

◇부실한 기초공사…개선 의지는 ‘글쎄’

문 교수는 빅데이터 구축에서 기초에 충실해야 한다고 강조했다.

그 대안으로 ‘데이터 지도’를 통한 기초 설계를 제안했다. 각 데이터간 긴밀한 연계로 ‘관계성’을 높이는 데 목표를 둔다.

그는 “데이터 양이 적던 많던 설계 원리는 똑같다. 결국 3초 이내에 정확한 솔루션이 제시돼야 한다”면서 “업무기술서만 잘 써놓으면 명확한 업무데이터를 만들 수 있듯, 데이터 지도를 통해 데이터 품질을 높일 수 있다”고 강조했다.

이어 “기본을 갖추게끔 뜯어고치면 데이터 문제가 사라진다”면서 “데이터 재설계는 비용이 들어가지도 않는다. 설계 철학과 사고방식만 바꾸면 된다”고 말했다.

그러면서 “기존 문제들을 2개월 내로 충분히 해결할 수 있지만 (특히) 공공부문에선 과오를 부정하고자 하는 성향이 강해 전반적인 개선이 전혀 이뤄지지 않고 있다”고 지적했다.

다수 기업들의 부실한 데이터 관리 행태에도 일갈을 날렸다.

문 교수는 “금융권에서 주기적으로 진행하는 전산 시스템 개편에 수조원이 투입되지만 실질 효과는 제로에 가깝다”면서 “기존 데이터는 그대로 이관돼 겉통만 바꾸는 셈”이라고 지적했다.

그러면서 “이러한 시스템은 결국 곪을대로 곪아 터지게 돼 있다”면서 “최근 발생한 복지정보시스템 먹통사태는 물론 이태원 참사도 마찬가지다. 데이터 하나 흘러다니지 않는 재난망이 온전하게 재난시스템 역할을 수행할 리 만무하다”고 질타했다.

문 교수는 또 다른 빅데이터 저해요인으로 ‘전사적 자원 관리(Enterprise Resource Planning, ERP)’ 시스템을 꼽았다. ERP는 재무, 공급망, 인사관리 등 전반적인 운영 지표를 자동화해 관리하는 시스템이다.

그는 “국내외 여러 기업이 ERP를 통해 데이터를 관리하고 있는데, 통상 10개 데이터 중 6개는 불필요한 데이터”라고 지적하면서 “ERP가 원흉이라기보다 ERP에 젖어든 기업문화가 문제”라고 꼬집었다.

그러면서 “ERP는 패키지일뿐 기업에 특화된 시스템이 아니다. 속도가 느리고 답을 틀릴 때도 많다”면서 “데이터 리모델링은 물론, 새로운 데이터시스템이 추가돼도 기존 설계철학과 동일하게 맞춰나가는 것은 철저히 기업과 기관의 책임”이라고 강조했다.

◇인력양성·제도개선 강조…SW 전방산업 예의주시 당부

문 교수가 제안하는 해법은 ‘저변 확대’에서 시작한다. 특히 데이터 설계 인력양성을 위한 교육체계 구축이 절실하다는 의견이다.

그는 “50여년간 IT학계에 몸 담으면서 ‘데이터 설계’가 가장 중요하다는 걸 여실히 깨닫고 있다”면서 “가장 아쉬운 것은 우리나라엔 아직까지 (데이터 설계) 전문가가 없다는 점”이라고 말했다.

그러면서 “전산학과에선 도사 수준의 코딩 인력을 길러내는 반면 데이터 설계에 대한 교육은 전무하다”면서 “전산학과에서도 안가르치는데 문헌정보학과나 기술경영학과에서 가르칠 리 있나”고 아쉬움을 토로했다.

민간·공공 데이터의 원활한 교류·융합의 중요성도 강조했다.

민간기업이 최근 공공기관에 요구하는 맞춤 데이터와 관련해 문 교수는 “시, 지자체 등 공공기관은 규정에 따라 움직일 뿐”이라면서 “IT전문성을 갖춘 인물이 정계와 요직에 등장하지 못한다면 앞으로도 맞춤 데이터 제공은 없을 것”이라고 내다봤다.

그러면서 “결국 볼만한 데이터가 줄어들면 민간 수요가 함께 추락하는 악순환이 반복될 것”이라고 주의를 당부했다.

문 교수는 빅데이터 전방산업의 전망과 나아가야 할 방향도 제시했다. 그가 꼽은 관건은 소프트웨어(SW) 중에서도 운영체제(OS) 부문이다.

문 교수는 “(우리나라는) 하드웨어 중심 성장으로 SW 부문이 극도로 빈약하다”면서 “자동차도 엔진이 가장 중요하듯, 모든 서비스와 제품 중심에는 OS가 있다”고 강조했다.

그러면서 “(OS는) 그리 복잡하지도 않다. 마이크로소프트의 윈도우95에서 시작된 역사는 이제 30년도 채 안됐다”면서 “메모리반도체, CPU 등을 움직이는 핵심 요소인 만큼 신경써서 살펴봐야 할 부문”이라고 조언했다.

 

☞문송천 KAIST 명예교수

세계 최초로 수퍼컴퓨터 제작에 성공한 미국 일리노이대학교(University of Illinois at Urbana-Champaign)에서 박사학위를 취득한 ‘국가전산학박사 1호’ 교수다. 24세에 대학교수 생활을 시작한 문 교수는 KAIST와 영국 케임브리지대(University of Cambridge) 전산학과 및 경영대학원 교수로서 ‘블록체인SW엔진’을 세계 5번째로 개발하고, ‘DB엔진’을 아시아 최초로 개발하는 공적을 남겼다. ‘클라우드’라는 용어를 세계 최초로 만든 이들 중 한명이기도 하다. 그는 41년 교수로 활동하며 △빅데이터 △블록체인 △DB △해킹 분야 강의 및 연구를 통해 저서 22권, 논문 205편을 내고 박사제자 30명을 배출했다. 미국·영국 현지 학술활동을 비롯해 △Y2K한국대표 △대한적십자사 친선대사 △UNDP전문가로서 개발도상국 30여개국 현지 봉사활동을 진행하며 ‘IT 대한민국’의 위상을 세계 만방에 알린 공로를 인정받아 지난 2018년, 대학교수로서는 최고 훈장에 해당하는 ‘국가녹조훈장’을 서훈받은 바 있다. 현재 유럽IT학회 아시아 대표이사로 재직 중이다.

※ 여러분의 제보가 뉴스가 됩니다. 각종 비리와 부당대우, 사건사고와 미담, 소비자 고발 등 모든 얘깃거리를 알려주세요

이메일 : webmaster@enewstoday.co.kr

카카오톡 : @이뉴스투데이

저작권자 © 이뉴스투데이 무단전재 및 재배포 금지