카카오표 멀티모달·MoE 모델 동시 공개
소버린 AI 중시 기조에 ‘자체 개발’ 강조
 |
정신아 카카오 대표가 지난해 10월 열린 카카오 개발자 컨퍼런스 이프카카오에서 인공지능(AI) 서비스 카나나를 소개하고 있다. [사진 = 카카오] |
카카오가 멀티모달 언어모델과 전문·특화(MoE) 언어모델을 오픈소스로 공개했다.
한국어 특화와 독자 기술력으로 구현한 대규모언어모델(LLM)이 기반이라는 점에서 이재명 정부의 소버린 인공지능(AI) 확보 전략과 맞닿아 있다.
25일 정보기술(IT)업계에 따르면
카카오는 최근 허깅페이스를 통해 이미지를 이해하고 지시를 이행하는 능력을 갖춘 경량 멀티모달 언어모델 ‘카나나-1.5-v-3b’와 MoE 언어모델 ‘카나나-1.5-15.7b-a3b’를 개방했다.
설계부터 평가까지 모든 과정을 독자 기술로 완성한 프롬스크래치 방식으로 구축됐다.
정부가 추진하는 독자 AI 파운데이션 모델 프로젝트에 출사표를 제출한 상황에서, 자체 모델 개발 역량과 대국민 서비스 운영 경험을 무기로 내세우며 AI에 대한 국민의 접근성을 높이겠다는 의지로 풀이된다.
구체적으로 카나나-1.5-v-3b는 텍스트뿐만 아니라 이미지 정보도 처리할 수 있는 멀티모달 모델이다.
이용자의 질문 의도를 정확하게 파악하고 요구 사항을 이용자 맞춤형으로 이행한다.
특히 한국어 벤치마크에서 유사한 사이즈의 국내·외 오픈소스 공개모델을 제치고 최고 점수를 기록했다.
한국인이 개발한 AI가 한국어 구사에서 강점을 보이는 것은 자연스러운 일이지만, 이를 상용 기술에 연결하고 지속해서 고도화하는 것은 또 다른 차원의 역량이다.
카나나-1.5-v-3b는 한국어뿐만 아니라 외국어(영어) 벤치마크에서도 글로벌 오픈소스 공개모델과 성능이 유사했다.
협업사인 오픈AI의 GPT-4o에 견줄 수 있다는 것이
카카오의 설명이다.
지시 이행 능력 벤치마크는 국내 오픈소스 멀티모달 모델과 비교해 두 배 이상 뛰어난 성능을 자랑했다.
카카오는 인간 선호 반영 학습과 지식 증류를 통해 카나나-1.5-v-3b의 성능을 극대화했다.
지식 증류는 고성능의 대형 모델(Teacher Model)로부터 비교적 작은 모델(Student Model)을 학습하는 방법이다.
작은 모델의 단순 정답 도출에 대형 모델의 예측 확률 분포가 반영돼, 작은 모델이더라도 대형 모델의 성능을 넘볼 수 있다.
카나나-1.5-v-3b는 ▲문화유산 및 관광지 소개 ▲도표 이해 ▲수학 문제 풀이 ▲소설 및 시 창작 등 다양한 분야에서 활용했을 때 만족도가 더욱 높아진다.
실제로 카나나-1.5-v-3b에게 청계천 사진을 보여 준 뒤 어떤 장소인지 특징을 설명해 달라고 요청했더니 “이 사진은 서울 청계천을 배경으로 하고 있다”라며 “자연과 도시가 어우러진 공간”이라고 답변했다.
 |
카나나-1.5-v-3b가 이미지를 인식해 추론형 답변을 내놨다. [사진 = 카카오] |
카카오는 MoE 모델도 함께 내놨다.
MoE는 입력된 데이터 처리 시 모든 파라미터가 연산에 참여하는 기존 밀집 모델과 달리 특정 작업에 최적화된 일부 전문 모델만 활성화되는 구조다.
카나나-1.5-15.7b-a3b는 추론 시 157억개의 파라미터 중 30억개 남짓의 파라미터만 동작한다.
덕분에 효율적 자원 활용과 비용 절감이 가능하다.
파라미터는 AI 모델의 성능에 직접적으로 영향을 미친다.
데이터를 학습하고 패턴을 인식하는 데 핵심적인 역할을 하기 때문이다.
일반적으로 양질의 파라미터가 많을수록 똑똑한 AI가 된다.
카나나-1.5-15.7b-a3b는 활성화 파라미터가 3B에 불과하더라도 전문성에 집중했기에 성능은 80억개의 파라미터가 작동하는 ‘카나나-1.5-8B’와 동등하다.
카카오는 AI가 사람처럼 생각하고 행동하는 능력을 갖출 수 있도록 모델을 발전시키는 데 주력하고 있다.
올해 안에 에이전트형 AI를 구현하는 데 필수적인 추론 모델의 개발 현황 및 성과를 발표할 예정이다.
김병학
카카오 카나나 성과리더는 “이번 오픈소스 공개는 비용 효율성과 성능 고도화라는 유의미한 기술 개발의 결실”이라며 “단순한 모델 아키텍처의 진보를 넘어 서비스 적용과 기술 자립이라는 두 가지 측면의 목표에 부합하는 결과물”이라고 말했다.
AI 모델 개발 꾸준…낮은 허들·상생 협력
 |
정신아 카카오 대표와 샘 올트먼 오픈AI 최고경영자(CEO)가 지난 2월 4일 서울 중구 태평로 더플라자호텔에서 전략적 제휴를 발표했다. [이가람 기자] |
카카오는 지난 2021년 LLM ‘KoGPT’를 선보이며 AI 시장에 참전했다.
KoGPT는 60억개 파라미터와 2000억개 토큰을 학습했다.
토큰은 AI가 이해할 수 있는 가장 작은 텍스트 단위다.
당시 오픈AI의 GPT-3를 기반으로 해 한국판 챗GPT로 불리기도 했다.
KoGPT는 고객센터 챗봇에 적용됐다.
그러다 2024년 카나나를 론칭하면서 본격적으로 AI 신사업을 개시했다.
카카오가 보유한 막대한 데이터와 서비스 기획·운영 경험이 결합된 카나나는 이용자의 기대를 모았다.
모바일용 초경량 LLM ‘카나나
나노’, 범용성에 집중한 ‘카나나 에센스’ 대규모 서비스용 ‘카나나 플래그’, 멀티모달 모델 ‘카나나-o’, 코딩·수학 능력을 강화한 ‘카나나 1.5’ 등을 줄줄이 공개했다.
카나나 1.5는 오픈소스로 풀었다.
누구나 원본 코드에 접근해 수정·사용할 수 있다.
연구용에서 나아가 상업용으로도 쓸 수 있다.
이처럼 자유로운 기술 공유를 통해 AI 생태계의 자립성과 경쟁력 강화에 이바지하겠다는 목적이다.
다만 아쉬움은 여전하다.
카나나는 챗GPT, 제미나이, 클로바X 등 라이벌 AI에 비해 출시가 늦었다.
그럼에도 차별성이 드러나지 않았다.
문서요약, 질의응답, 감정분석 등은 AI의 기본 능력이다.
그 사이 주가는 반 토막 났다.
카카오의 막강한 장점도 살리지 못했다.
AI 메이트 카나와 나나는
카카오톡이 아닌 별개의 애플리케이션에서 활약하고 있다.
카카오톡이 4500만명의 이용자를 확보한 만큼 AI의 대중화와 사업성에 대한 기대가 컸지만, 앱을 추가로 설치해야 한다는 점에서 외면받았다.
실제로 지난 5월 베타 버전 카나나 앱은 지난 5월에는 하루 1만9000건에 달하는 다운로드 수를 기록했지만 지난 6월부터는 100건 안팎으로 급감했다.
IT업계 관계자는 “그래도
카카오라는 믿음과 경영 위기·비전 부재에 대한 실망이 공존하는 상태”라며 “진행 중인 것으로 알려진 대규모 서비스 개편이 완료되고 카나나가 정식 출시되는 시점을 기다리고 있다”고 전했다.
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]