네이버가 자연어처리 분야의 세계 최고 권위 학회인 ‘EMNLP(Empirical Methods in Natural Language Processing) 2021’에서 초대규모 인공지능(AI) ‘하이퍼클로바’ 연구 성과를 공유한다고 3일 밝혔다.
네이버 클로바, AI랩 연구진은 하이퍼클로바 핵심 연구 논문을 포함한 총 7개의 논문을 발표할 예정이다.
25년 전통을 가진 EMNLP는 ACL과 함께 자연어처리(NLP) 분야의 최고 AI 학회로 꼽힌다. 올해는 11월 7일부터 11일까지 도미니카공화국에서 열리며, 온라인으로도 동시 진행된다.
올해 행사에선 네이버의 초대규모 AI인 하이퍼클로바의 핵심 연구 논문이 메인 콘퍼런스 발표에 채택됐다. 이 논문은 하이퍼클로바와 그 학습에 사용된 데이터를 소개하고, 다양한 크기의 모델들이 갖는 성능을 검증하는 내용을 담고 있다. 초거대 언어모델을 통해 ‘프롬프트 최적화’, 데이터 토큰화 등에 대한 논의를 발전시키고, 하이퍼클로바 스튜디오를 통해 ‘노 코드 AI(No Code AI)’ 등 초대규모 AI가 가져올 AI 서비스 개발 방법론의 혁신적인 변화에 대해서도 설명한다.
하정우 네이버 AI랩 소장은 “작년 하반기부터 초대규모 AI 기술에 집중적으로 투자하고 연구 역량을 결집한 결과, 국내 최초로 하이퍼클로바 기술을 공개하고 성공적으로 상용화한 데 이어 세계 최고 권위의 학회에서 그 기술력을 인정받는 쾌거를 거뒀다”며 “이번 논문은 영어 중심이었던 기존의 언어모델 연구를 넘어, 한국어 AI의 가치를 글로벌 자연어처리 학계가 인정했다는 점에서도 매우 의미 있는 성과”라고 말했다.
이외에도 네이버는 하이퍼클로바와 관련, 초거대 언어모델을 활용해 데이터를 자동 생성하고 라벨링해 데이터를 효율적으로 증강·증류시키는 기법에 대한 연구도 소개할 예정이다.
또한 OCR 과제에서 문서의 정보를 더 효율적으로 추출할 수 있는 방식을 제안하는 논문과 AI 언어모델이 바이오메디컬 분야의 지식 베이스로서 활용될 가능성을 탐구하는 논문 등 다양한 주제를 망라하는 선행연구 결과를 발표할 예정이다. 이는 KAIST, 고려대, 서울대 등 다양한 국내외 대학들과 적극적으로 협력한 결과다.
네이버 클로바, AI랩 연구진은 하이퍼클로바 핵심 연구 논문을 포함한 총 7개의 논문을 발표할 예정이다.
25년 전통을 가진 EMNLP는 ACL과 함께 자연어처리(NLP) 분야의 최고 AI 학회로 꼽힌다. 올해는 11월 7일부터 11일까지 도미니카공화국에서 열리며, 온라인으로도 동시 진행된다.
올해 행사에선 네이버의 초대규모 AI인 하이퍼클로바의 핵심 연구 논문이 메인 콘퍼런스 발표에 채택됐다. 이 논문은 하이퍼클로바와 그 학습에 사용된 데이터를 소개하고, 다양한 크기의 모델들이 갖는 성능을 검증하는 내용을 담고 있다. 초거대 언어모델을 통해 ‘프롬프트 최적화’, 데이터 토큰화 등에 대한 논의를 발전시키고, 하이퍼클로바 스튜디오를 통해 ‘노 코드 AI(No Code AI)’ 등 초대규모 AI가 가져올 AI 서비스 개발 방법론의 혁신적인 변화에 대해서도 설명한다.
이외에도 네이버는 하이퍼클로바와 관련, 초거대 언어모델을 활용해 데이터를 자동 생성하고 라벨링해 데이터를 효율적으로 증강·증류시키는 기법에 대한 연구도 소개할 예정이다.
또한 OCR 과제에서 문서의 정보를 더 효율적으로 추출할 수 있는 방식을 제안하는 논문과 AI 언어모델이 바이오메디컬 분야의 지식 베이스로서 활용될 가능성을 탐구하는 논문 등 다양한 주제를 망라하는 선행연구 결과를 발표할 예정이다. 이는 KAIST, 고려대, 서울대 등 다양한 국내외 대학들과 적극적으로 협력한 결과다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지