생성형 AI 기술이 우리 일상에 빠르게 스며들면서 텍스트를 넘어 음성, 이미지, 영상 등 데이터 형태의 구분 없이 처리하는 멀티모달(Multi-Modal)로 혁신을 거듭하고 있다. [사진=Freepik]
생성형 AI 기술이 우리 일상에 빠르게 스며들면서 텍스트를 넘어 음성, 이미지, 영상 등 데이터 형태의 구분 없이 처리하는 멀티모달(Multi-Modal)로 혁신을 거듭하고 있다. [사진=Freepik]

[이뉴스투데이 이승준 기자] 대규모언어모델(LLM)이 의료 분야로 확대되는 가운데 미소정보기술의 ‘데이터 스캔’이 데이터 표준화 솔루션으로 이목을 끌고 있다.

17일 업계에 따르면 생성형 AI 기술이 우리 일상에 빠르게 스며들면서 텍스트를 넘어 음성, 이미지, 영상 등 데이터 형태의 구분 없이 처리하는 멀티모달(Multi-Modal)로 혁신을 거듭하고 있다.

생성형 AI 개발 트렌드 역시 챗GPT를 비롯한 대규모언어모델(LLM)과 작지만 강한 소형화·최적화(파인튜닝)로 양분되는 분위기다. 정부도 올해를 초거대AI 도입 원년으로 계획을 잡고 국가 차원에서 AI 산업 육성을 위해 각종 지원을 아끼지 않는 분위기다. 특히 생성형 AI의 중요한 경쟁력인 AI 학습 데이터를 모으는 데 주력한다.

LLM은 의료 분야로도 확대될 조짐이 나타난다. 패브릭 기반 멀티모달 데이터 플랫폼 전문기업 미소정보기술이 의료·산업 분야 대규모언어모델(LLM) AI 구축과 소규모언어모델(sLLM) AI 구축 시 양질의 빅데이터 확보에 꼭 필요한 비(非)라벨링 데이터 표준화 솔루션 ‘데이터스캔(Data Scan)’을 출시하면서다.

‘데이터스캔’은 의료·산업 분야에서 사람의 손으로 가공된 라벨링 데이터(지도학습)가 아닌 챗GPT 등 초거대 AI 개발에 필수인 양질의 빅데이터를 확보할 수 있는 비라벨링 데이터 표준화 솔루션이다.

초거대 AI 사전학습에 필요한 빅데이터 구축(텍스트)을 위해 데이터 등록부터 분류체계, 단어사전 구축을 통한 자연어 처리, 분류·분석, 텍스트 분석, 산업별 적용 도메인에 따른 데이터 후처리 등을 실시간 분석하며 기업·공공기관의 내부 문서 보안이 강화된 패브릭 기반 멀티모달 데이터 플랫폼 ‘스마트빅(smart BIG)’을 통해 LLM, sLLM 구축 시 고도화된 언어처리 기술을 원스톱으로 제공한다.

‘데이터스캔’의 생성형 AI 분야는 일상생활과 직결되는 의료에서 의료영상 판독을 통한 건강검진·진료 소견서 작성, 과거 진료기록 요약, 치료 방법·처방전, 개인건강관리, 반려동물 질병 상담 등에 활용될 전망이다.

금융 분야에서도 고객 상담, 금융상품 추천, 신용평가, 금융사고 감지 등 금융 전반의 AI 서비스에 녹아들 것으로 예상하고 있다. 법률 분야에서는 계약서, 소장, 법조문 제시, 판결문(법원)등 서류 작성 시간을 획기적으로 줄이고 유사 판례를 쉽게 찾아주는 서비스 등을 통해 업무 효율성과 국민 편의성까지 높아질 것으로 기대를 모은다.

다만 현재 초거대 AI에 필요한 ‘비라벨링(텍스트) 데이터’는 의료·산업 분야에 매우 부족한 실정이다. 단순·반복 작업 중심이었던 라벨링 데이터 중심의 AI 학습용 데이터로는 사람이 직접 라벨링 하지 않고 비지도학습 즉 모델이 스스로 예측하며 학습하는 방식의 ‘챗GPT’ 같은 초거대 AI를 지원하기 어렵다. 국가 차원의 초거대 AI 학습용 핵심 데이터 구축으로 빠르게 전환이 필요하다.

미소정보기술은 주력사업인 디지털 헬스케어 사업 호조 및 대학병원 및 공공·의료기관 등 의료데이터 개방에 맞춰 임상연구 분석에 최적화된 워크플로 전과정을 통합 제공하는 ‘CRaaS’ 솔루션 고도화, 정형, 비정형, 텍스트, 비디오, 오디오 등 데이터들을 통합하고 인터랙션을 제공하는 멀티모달 데이터 플랫폼(MDP) 사업에 집중하고 있다. 

미소정보기술의 강점인 의료 데이터에서 산업 데이터까지 데이터 구분 없이 분석이 가능한 전문 도메인 날리지(Knowledge)와 패브릭 기반 멀티모달 데이터 플랫폼 ‘스마트빅’을 통해 기업 및 공공기관에 한국형 챗GPT, LLM, Sllm등 생성형 AI 서비스 품질을 높일 수 있도록 고도화에 집중 투자하고 있다.

안동욱 미소정보기술 대표이사는 “생성형 AI 시대를 맞아 양질의 데이터는 AI 경쟁력의 핵심이”이라면서 “의료·산업 데이터 분석 및 멀티모달 데이터 플랫폼으로 똘똘한 데이터를 제공해 초거대 AI 기업들의 경쟁력을 지원하는 데이터 인에이블러(Data Enabler) 역할을 담당할 것”이라고 말했다.

※ 여러분의 제보가 뉴스가 됩니다. 각종 비리와 부당대우, 사건사고와 미담, 소비자 고발 등 모든 얘깃거리를 알려주세요

이메일 : webmaster@enewstoday.co.kr

카카오톡 : @이뉴스투데이

저작권자 © 이뉴스투데이 무단전재 및 재배포 금지