노범석 서치퍼트 대표
노범석 서치퍼트 대표

[이뉴스투데이 김용호 기자] "서치퍼트는 일을 효율적으로 하고자 하는 전문가들의 업무 능력을 획기적으로 향상시킬 수 있을 것이다."

회계사 출신으로 게임회사 창업 경험이 있는 노범석 서치퍼트 대표는 6일 미디어 브리핑 자리에서 이같이 밝혔다.

문서검색 포털기업 서치퍼트(Searchpert, Search for Expert)는 6일 패스트파이브 을지로점에서 미디어 브리핑을 진행했다. 노범석 대표, 유병우 개발본부장, 박준 연구소장 등 관계자들이 참석해 서비스를 소개하고 앞으로의 비전을 발표했다.

서치퍼트는 약 7개월간의 베타 서비스 기간을 거쳐 지난 10월 16일 정식 출시했다. 214곳의 공공기관 및 정부부처, 연구소 등을 대상으로 500만 건의 문서(약 1억 6000만 페이지, 약 6테라 바이트 규모)를 제공하고 있다. 문서 데이터로는 국내 최대 규모다.

기존 웹페이지는 검색 후 웹페이지 내에서 해당 링크를 찾는 방식이었으나, 서치퍼트는 문서는 물론, 해당 페이지까지 찾아 하이라이트 해서 보여주는 것이 특징이다. 사이트 방문이 간편하고, 정확하고 충분한 검색 결과를 가지고 편리하게 문서를 확인하며, 문서 사후 관리까지 안정적으로 되도록 해 일이 쉬워지고, 일에 들어가는 시간도 절약할 수 있도록 했다.

노 대표는 “서치퍼트는 국내 최초로 문서검색 포털 서비스를 표방한다. 문서 데이터의 양이 점점 방대해지고, 특정 문서의 경우 검색에 제한적일 수도 있다”며 “서치퍼트는 일을 효율적으로 하고자 하는 전문가들의 업무 능력을 획기적으로 향상시킬 수 있을 것”이라고 말했다.

노범석 서치퍼트 대표
노범석 서치퍼트 대표

서치퍼트는 입법 정보, 법무 정보, 중앙정부, 준법경영, 준법감시, 지방정부, 재무회계와 감사, 세무정보, 자본시장, 공정거래, 기업공시, 경제와 산업, 대통령위원회, 정책연구, 지방정책연구, 연구개발, 재정정보, 바이오의료, 중소벤쳐, 선거와 정당 등 카테고리를 데이터 세트로 구분해 문서를 제공한다. 입법정보의 경우, 16대 이후 국회에서 발행된 모든 문서를 포함하고 있으며, 중앙정부는 각 부처에서 발행한 최초일부터 최근일까지 모든 문서를 제공한다. 기업공시는 2009년 이후 기업 공시 전체 데이터를 선보인다.

올해 11월 현재 200개 이상 사이트에서, 500만 개 문서, 1.6억 페이지를 보유하고, 매일 10만 페이지를 수집하고 있는 가운데, 내년 2월까지 400개 이상 사이트에서 700만 개 문서, 2억 페이지를 보유하고, 매일 20만 페이지를 수집한다는 계획이다.

서치퍼트는 문서검색 서비스와 더불어 △문서모니터링(와이드워처, 업무에 필요한 최신 문서를 신속하게 모니터링) △자기문서검색(서치다큐, 개인과 조직이 보유한 자기문서를 손쉽게 저장하고 검색) △저작권문서거래(딥페이퍼, 절판 도서와 잡지 등을 스트리밍 방식으로 검색) 등 문서와 관련된 모든 불편을 해소하는 통합 서비스로 발전한다는 계획이다.

이와 함께 서치퍼트는 보유한 문서 빅데이터를 연구목적으로 비정형데이터를 필요로 하는 대학 및 연구소, 서비스 개발 목적으로 비정형 데이터 필요로 하는 기업 등에 무상으로 제공할 계획을 전하며 오픈 데이터 운동에 동참함을 밝혔다.

이는 새로운 한글 비정형 문서 데이터 제공으로 국내 AI 연구를 활성화하고, 대용량 비정형 데이터 문서 수집 비용 절감으로 AI 연구를 확산하며, AI 기반 한글 자연어처리를 위한 벤치마크 데이터로의 활용이 가능토록 하기 위함이다.

해당 데이터는 연구 목적으로 제공하는 국내 최대의 텍스트 데이터로, 매월 업데이트를 통해 텍스트 데이터 최신성 확보했으며, 특허나 법률에 국한되지 않는 광범위한 주제의 데이터이자 오탈자나 구문 오류가 적은 정제된 데이터라는 것이 서치퍼트의 설명했다.

서치퍼트는 제공하는 문서데이터를 통해 한국어 자연어처리 기반기술 향상, 고유명사 사전생성, 검색 기술 향상, Q&A 및 챗봇, 문서 기반 분류 서비스 개발 등의 효과를 기대하고 있다.

박준 연구소장은 "서치퍼트의 문서 빅데이터를 무상 제공하게 되면 대용량의 비정형 데이터 문서 수집 비용을 절감할 수 있어 국내 인공지능 연구의 활성화를 기대할 수 있다"며 "AI 기반 한글 자연어 처리를 위한 데이터 활용이 보다 폭넓게 적용될 것"이라고 말했다.

노범석 대표는 “서치퍼트는 출처가 명확하고 공개가 허용된 문서를 대상으로 제공하고 있으며, 내년에는 미국 정부 및 UN(United Nation) 관련 문서도 제공할 계획”이라고 밝혔다.

노범석 서치퍼트 대표는 안진 및 삼일회계법인 등에서 오랫동안 경력을 쌓은 회계사 출신으로 게임 회사 창업 이력이 있다. 공동 창업자인 유병우 개발본부장은 엠파스 재직 시절 검색 고도화를 주도한 바 있으며, 기술표준관련 오픈 API 개발 등 개발자로 활동했다. 인공지능(AI) 전문가로 경력을 쌓아 온 박준 연구소장은 서치퍼트의 AI 적용 및 고도화에 주력하고 있다.

※ 여러분의 제보가 뉴스가 됩니다. 각종 비리와 부당대우, 사건사고와 미담, 소비자 고발 등 모든 얘깃거리를 알려주세요

이메일 : webmaster@enewstoday.co.kr

카카오톡 : @이뉴스투데이

저작권자 © 이뉴스투데이 무단전재 및 재배포 금지