카카오, 자체 개발 LLM 오케스트레이션 평가 벤치마크 'ICLR 2026' 채택

사진카카오
[사진=카카오]

카카오의 인공지능(AI) 연구 개발 성과가 글로벌 학회를 통해 인정받으며 기술 경쟁력을 입증했다.

카카오는 자체 개발한 AI 모델의 오케스트레이션 능력 평가 지표인 ‘오케스트레이션 벤치마크’가 세계 3대 AI 학회인 'ICLR 2026'의 논문으로 채택됐다고 3일 밝혔다.

ICLR(국제표현학습학회)은 글로벌 빅테크 기업들이 주목하는 인공지능 분야의 최고 학술대회다. ICLR 2026에는 약 1만9000여 건의 논문이 제출됐으며, 이 가운데 상위 28%만 채택됐을 정도로 경쟁이 치열하다.

카카오는 최근 대형 언어모델(LLM)이 단순 질의응답을 넘어 이용자가 요구하는 다양한 종류의 작업을 계획하고 조율하는 에이전틱 AI로 고도화되고 있는 기술 트렌드에 주목해 이번 벤치마크를 개발했다. 

특히, 실제 서비스 환경에서의 멀티 스텝(Multi-step)과 멀티 도메인(Multi-domain) 처리 능력을 평가하는 데 초점을 맞췄다.

기존의 LLM 벤치마크는 단편적인 성능 평가에 그쳐, 복잡한 사용자 요청을 해석해 적절한 도구를 호출하고 다양한 작업 간 의존 관계를 관리하는 오케스트레이션 능력을 평가하는데 한계가 존재했다. 

이에 카카오는 실제 서비스 시나리오를 기반으로 AI 모델의 작업 계획(Planning)과 도구 실행(Tool Execution)을 분리하여 정밀하게 평가하는 새로운 프레임워크를 제시했다.

이번 오케스트레이션 벤치마크는 여행·쇼핑·금융·일정 등 17개 서비스 도메인과 100여 개의 가상 도구를 포함해 구성했으며, 사용자 요청 변경이나 추가 질문 등과 같은 실제 서비스 상의 대화 흐름을 토대로 시나리오를 구축해 실용성을 높였다. 

모든 평가 데이터는 AI 어노테이터의 수작업을 통해 구축 및 검증됐으며, 한국어와 영어 두 가지 언어를 지원한다. 한국어의 경우 문화적 특성과 맥락을 반영해 평가의 정확도와 신뢰도를 높인 것이 특징이다.

카카오는 글로벌 AI 생태계의 활성화에 기여하고, 연구 개발 성과의 자유로운 활용을 위해 해당 논문을 오픈소스 플랫폼 깃허브에 공개했다.

카카오 관계자는 “오케스트레이션 벤치마크는 에이전틱 AI가 실제 서비스 환경에서 안정적으로 작동하는지를 평가하는 핵심 도구로, 스스로 판단하고 이행하는 에이전틱 AI로 진화하는 현 시점에서 의미있는 연구 성과”라며 “향후에도 에이전트 간 협업 및 오케스트레이션 능력 강화를 위한 연구를 지속할 예정이며, 카카오의 에이전틱 AI 방향성에 부합하는 기술의 고도화를 추진해 갈 계획”이라고 말했다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기