세계 최고 AI OCR 기술?, 업스테이지 국제 AI 경진대회 4부문 석권 아마존과 엔비디아 등 제쳐

홈 > 최신뉴스 > 주요뉴스
주요뉴스

IT | 세계 최고 AI OCR 기술?, 업스테이지 국제 AI 경진대회 4부문 석권 아마존과 엔비디아 등 제쳐

권경욱 기자 0   0

AI OCR 세계 최고 권위 대회 ‘ICDAR 로버스트 리딩 컴페티션’에서 업스테이지가 4개 부문을 석권하며 글로벌 톱 AI기술력을 뽐냈다.  


업스테이지(https://www.upstage.ai)는 21일 국제패턴인식협회인 ‘IAPR’이 시작한 국제 경진 대회인 ‘ICDAR 로버스트 리딩 컴페티션’ HierText-1/2, VQAonBD, IHTR 4종목에서 모두 1위를 기록하며 명실상부 글로벌 최고 OCR 기술력을 다시 한 번 입증했다. 


‘ICDAR 로버스트 리딩 컴페티션’은 디지털 이미지와 비디오 상에서 텍스트를 감지/인식하는 기술인 Robust Reading 분야에서 가장 권위있는 국제경진대회다. ICDAR는 'International Conference on Document Analysis and Recognition’의 약자로서, 1991년을 시작으로 매년 열리는 국제 학회로 문서 분석 및 인식 분야에서 활동하는 글로벌 기업 및 연구자와 전문가들이 참여하는 국제 학회다. 


OCR(Optical Character Recognition)은 크게 이미지에서 ▲문자의 위치를 찾는 ‘검출 기술’과 ▲문자가 무엇인지 알아내는 ‘인식 기술’로 나뉜다. 업스테이지는 문자 검출 기술과 인식기술 모두에서 아마존, 엔비디아, 알리바바, 화웨이 등 글로벌 빅테크 기업들과의 경쟁에서 가장 높은 점수를 기록했다.


20일 업스테이지가 1위의 결과를 받은 IHTR 종목은 인도에서 쓰이는 대표 10종의 언어에 대한 글자 인식 문제를 다루었다. 업스테이지는 글자 인식 기술을 활용하여 대회에 참가해 이전에 경험이 없던 신규 언어 임에도 불구하고 최고 성능의 모델을 구축, 빛나는 성과를 보여주었다. 


특히 단어, 줄 및 단락의 구조를 나타내는 계층적 주석을 제공하는 첫 번째 실제 이미지 데이터셋인 ‘HierText’를 사용, OCR의 새로운 작업을 수행하는 'Hierarchical Text Detection and Recognition’ 종목에서는 업스테이지 팀과 홍콩지사가 1위와 2위를 모두 휩쓸며 압도적인 기술력의 격차를 보여주기도 했다. 


단순 OCR기술만으로 좋은 평가를 받을 수 없는 VQAonBD 종목에서도 업스테이지는 2위와 엄청난 점수 차이로 글로벌 톱의 성적을 거두며 두각을 나타냈다. VQAonBD는 문서 이미지를 주고 이미지 내 데이터의 답을 얻는 과제를 수행하는 종목으로, 예를 들면 계산이 복잡한 세금문서를 준 후 "2019년의 세금 합계가 뭐야?"와 같은 질문에 대해 정확한 답변을 추출하는 것뿐만 아니라 그 값을 이용, 비율, 평균, 최소 최대 값 등을 구하는 연산 작업까지 수행하는 문제도 제시됐다.  


특히 이번에 입상한 업스테이지 팀은 국내 유일의 캐글대회 두자리수 금메달에 빛나는 업스테이지 챌린지스 팀과 OCR팀이 의기투합해 구성했다. 21년과 22년 연속으로 캐글 대회에서 세계 1위와 2위를 기록하며 국내 최연소 그랜드마스터에 이름을 올린 김윤수 엔지니어를 포함, 두명의 그랜드마스터와 한명의 마스터를 보유한  챌린지스 팀의 역량과 현업에서 실제 다양한 기업의 OCR 과제를 수행 하고 있는 업스테이지의 우수한 연구원들이 힘을 합쳐 최고의 성과를 만들어 냈다는 평가다. 


업스테이지는 이번 대회에서 우수한 성과를 받을 수 있었던 이유로 치열한 연구를 통한 새로운 방법론을 사용, 기존과 다른 방식을 활용했다고 밝혔다. 기존 검출 기술은 인접한 단어 영역이 서로 겹치지 않도록 하기 위해 단어 영역을 크게 줄여 학습에 사용했다. 업스테이지 팀은 단어 영역은 조금만 줄이는 대신 단어 영역 사이에 갭을 넣어 학습에 활용하면서 단어 상자를 예측하는 방식으로 모델 성능을 대폭 개선시켰다.  


이를 통해 업스테이지 팀은 이번 대회부터 신설된 평가 기준 중 하나인 예측된 박스와 정답 박스 사이의 유사도(tightness)를 크게 향상 시킬 수 있었다. 


AI OCR 기술은 AI 기술 중에서도 디지털 전환의 기반이 되는 기술로 데이터의 디지털 자산화를 위한 고도화에 여러 기업들이 속도를 내고 있다. 업스테이지는 최고의 OCR 기술을 활용한 OCR팩을 개발, 올 초 한화생명과 삼성SDS, 포스코그룹 등 다양한 산업의 기업의 AI 혁신에 앞장서고 있다. 


업스테이지는 이번 대회에서 기술력을 재확인한 OCR기술을 비롯, 고객 정보와 제품 및 서비스 특징을 고려한 추천 기술 등 AI 기술을 고객들이 한 번에 맞춤형으로 활용 할 수 있도록 돕는 노코드-로코드 솔루션 AI팩과 이를 코드 복사만으로 편리하게 활용할 수 있는 API 시리즈를 출시, 고객사들의 AI 혁신을 돕고 있다. 업스테이지 AI팩을 이용하면 데이터 가공, AI 모델링, 지표 관리를 쉽게 활용할 수 있을 뿐 아니라 지속적인 업데이트를 지원, 상시 최신화 된 AI 기술을 편리하게 사용할 수 있다.  


업스테이지 김성훈 대표는 “AI OCR 분야 최고 권위의 대회인 ‘ICDAR 로버스트 리딩 컴페티션’에서 4개 부문의 1위를 휩쓸며 다시 한 번 업스테이지가 글로벌 톱 AI기술력을 인정 받아 무척 기쁘다” 며 "세계최고의 기술력이 검증된 업스테이지의 AI OCR로 문서 자동화가 필요한 전 산업의 디지털 전환과 AI 글로벌 혁신을 도울 것"이라고 전했다.


한편 업스테이지는 AI팩을 기업들을 위한 서비스로 API시리즈, AI팩과 더불어 OCR 기술로 ‘눈달린 챗GPT’로 국내최고 Chat AI AskUp의 비즈니스 버전 AskUp Biz도 운영하고 있다. AskUp Biz는 비즈니스 환경에 맞게 최적화해 기업들의 업무 효율과 만족도를 높일 수 있는 서비스로 다양한 문서를 읽고 Chat AI로 정보를 얻을 수 있는 AskUp Doc, 홈페이지 정보를 홈페이지 방문자들에게 정보를 제공할수 있는 AskUp Web, 업무용 툴인 슬랙에서 활용할 수 있는 AskUp Slack 등 세 가지로 구성되어 있으며 공개 후 수백개의 기업에서 신청을 받는 등 뜨거운 관심을 받고 있다.

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , ,

0 Comments
많이 본 뉴스
인기기사