• 최종편집 2025-03-21(금)
 

72-2.png

 

 

[시큐리티팩트=김상규 기자] 카카오, LG, 네이버가 초거대 AI서비스를 잇달아 소개하며 시장 선점에 나서고 있다.

 

초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라를 바탕으로 데이터를 스스로 학습해서 인간처럼 사고·학습·판단하는 AI를 의미한다. AI 중에서도 인간에 가장 가까운 '우등생 AI'인 셈이다. 특정 용도에 국한되지 않고 다양한 분야에서 활용이 가능하다는 점에서 향후 쓰임새가 무궁무진하다는 게 업계의 평가다.

 

카카오브레인은 초거대 AI 멀티모달(multimodal) 'minDALL-E'를 세계 최대 오픈소스 커뮤니티 깃허브(github)에 공개했다고 15일 밝혔다. 지난 달 한국어 특화 AI 언어모델 'KoGPT'를 선보인 지 한달 만에 두번째 초거대 AI 모델을 오픈소스로 공개한 것이다.

 

'minDALL-E'는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다. Open AI의 'DALL-E'를 누구나 접근하기 쉽게 작은 사이즈 모델로 만든 것으로 1400만장의 텍스트와 이미지 세트를 사전 학습했다.

 

예를 들어 "바나나 껍질로 만든 의자 그려줘", "보름달과 파리 에펠탑이 같이 있는 그림 보여줘", "살바도르 달리 화가 스타일로 그려줘" 라는 명령어를 입력하면, AI가 명령어의 맥락을 이해하고 바로 이미지를 도출한다. 검색을 통해 이미지를 찾아내는 것이 아니라, AI가 스스로 명령을 이해하고 직접 이미지를 그리는 것이다. 스토리텔링 콘텐츠의 삽화를 만들거나, 교육 자료 제작 등에 활용하는 등 다양한 콘텐츠 산업에 적용할 수 있을 것으로 기대된다.

 

카카오브레인은 지난 달 공개한 KoGPT 모델의 성능 고도화에도 집중하고 있다. 구글에서 개발한 텐서 처리 장치인 '구글 TPU'를 활용해 1엑사 플롭스(컴퓨터의 연산 속도 단위/초당 100경 연산처리)를 뛰어넘는 국내 최대 규모의 딥러닝 슈퍼컴퓨팅 인프라를 도입해 연구 효율을 높였다. 아울러 KoGPT 모델의 매개변수(파라미터)를 60억개에서 300억개의 사이즈까지 5배 늘려 이전보다 더 정확하게 명령을 이행할 수 있도록 만들었다.

 

김일두 카카오브레인 대표는 "인공지능이 사람처럼 생각하고 말하려면 어떤 요소가 필요할 지, 인공지능에게 기억력, 추론 능력, 이해 능력이 있다면 사람처럼 소통할 수 있을지 등 끝없이 질문을 던지며 연구하고 있다" 며 "최근 공개한 언어 모델 KoGPT과 이번에 공개한 DALL-E를 시작으로 순차적으로 초거대AI의 다양한 모델을 공개할 것이다. 이는 차세대 딥러닝 구축을 위한 필수 연구 과정으로 해당 모델을 오픈 소스로 공개해 국내 IT 생태계 기술 발전에 기여할 것" 이라고 말했다.

 

72-1.png
카카오브레인이 개발한 한국어 초거대AI '민달리(minDALL-E)' 모델이 그린 그림 예시 / 사진=카카오브레인

 

LG는 14일 현존하는 AI 중 학습 능력이 뛰어난 초거대 AI '엑사원(EXAONE)'을 처음 공개했다.

 

엑사원은 국내 최대인 약 3000억개의 파라미터를 보유하고 있으며, 언어뿐 아니라 이미지와 영상에 이르기까지 인간의 의사 소통과 관련된 다양한 정보를 습득하고 다룰 수 있는 멀티 모달리티(Multi-Modality) 능력을 갖췄다.

 

LG AI연구원은 멀티 모달 AI로 가는 첫 단계로 자체 개발한 알고리즘으로 언어를 이미지로, 이미지를 언어로 변환하는 기술을 구현했을 뿐 아니라 품질 역시 글로벌 최고 수준의 성능을 의미하는 SOTA(State-of-the-art)를 달성했다고 했다고 강조했다. 또 향후 멀티 모달 AI 기술이 고도화되면, AI가 데이터를 습득해 이해하는 수준을 넘어 추론하고, 시각과 청각 등 다양한 감각 영역을 넘나드는 창조적 생성을 할 수 있다고 설명했다.

 

예를 들어, 기존 AI는 텍스트를 분석해 이미지를 찾는 수준이었다면, '엑사원'은 "호박 모양의 모자를 만들어 줘"라고 말하면, 학습된 정보를 기반으로 스스로 판단해 '호박 모양의 모자' 이미지를 새롭게 만들어 낸다는 것이다.

 

엑사원은 또 말뭉치 6000억개 및 언어와 이미지가 결합되어 있는 고해상도 이미지 2억 5천만장 이상을 학습한 것으로 알려졌다. 특히 LG전자, LG화학, LG유플러스, LG CNS 등 LG 계열사들이 보유하고 있는 전문 데이터를 포함해 논문, 특허 등의 정제된 말뭉치들을 학습해 다양한 산업 분야에서 전문가로 활약할 수 있는 가능성을 높여 가고 있다.

 

또, 엑사원은 원어민 수준으로 한국어와 영어를 이해하고 구사하는 이중 언어 AI라는 점도 차별화 포인트다.

 

LG AI연구원은 엑사원을 제조, 연구, 교육, 금융 등 사실상 모든 분야에서 상위 1% 수준의 전문가 AI로 활약할 수 있도록 만든다는 계획이다.

 

72.png
배경훈 LG AI연구원장

 

배경훈 LG AI연구원장은 "어려운 난제를 해결하기 위해 끊임없이 도전하고, 우수한 연구 성과를 바탕으로 고객에게 꼭 필요한 전문가 AI를 만드는 연구원이 되고자 한다"며, "캐나다 토론토대, 미국 미시건대, 서울대, 카이스트 등 국내외 주요 대학 및 석학들과 연구개발 연계 체계를 더욱 강화하고, 향후 API 공개 및 외부 파트너십을 통해 집단 지성으로 글로벌 초거대 AI 생태계를 만드는 데 기여할 것"이라고 말했다.

 

네이버는 지난 5월 세계최초 한국어 초 대규모 언어모델 '하이퍼클로바(HyperCLOVA)'를 개발해 선보였다.

 

하이퍼클로바는 AI 모델의 크기를 나타내는 파라미터가 2040억 개로, 2020년 미국에서 공개된 오픈AI의 GPT-3의 파라미터(1750억 개)를 능가한다. AI 모델 크기를 나타내는 파라미터의 수가 높아질수록 AI는 더욱 많은 문제를 해결할 수 있다. 특히 하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습하는 등 '한국어 최적화'가 가장 큰 장점으로 꼽힌다.

 

네이버는 15일 ‘하이퍼클로바를 어떻게 클라우드에서 활용할 수 있는지’를 소개했다.

 

클라우드를 접목한 하이퍼클로바를 고객의 서비스에 활용하면 비즈니스 생산성을 향상시킬 수 있다. 제품 리뷰 내 감정과 정보를 분리해 분석할 수 있어 소상공인(SME)들은 인사이트 획득에 도움 되며, 네이버 쇼핑에 등록한 상품명을 소비자의 상품 이해도를 높이는 방향으로 노출할 수 있다.

 

독거 어르신 등 돌봄이 필요한 시민의 안위를 체크하는 클로바 케이콜(CLOVA Care call)은 편안하고 자유롭게 대화하며 정서적 지지까지 보낼 수 있게 됐다. 이 밖에 올해 국민 앱으로 선정된 클로바 노트(CLOVA Note)는 하이퍼클로바 기술 적용 후 오류율이 15% 이상 개선돼 정확도를 높인 것은 물론, 정보 분석 및 탐색까지 능동적으로 제안하는 신규 기능을 추가할 예정이다.

 

네이버의 다양한 데이터를 활용가능한 인텔리전스로 전환한 하이퍼클로바를 사용자와 스타트업에게 실질적인 도움이 될 수 있도록 공유하기 위한 준비도 막바지에 이르렀다. 이번 달 내에 일부 파트너가 참여 가능한 클로바 스튜디오(CLOVA Studio)를 클로즈드 베타 버전으로 외부로 공개해 ROI가 높은 AI 트랜스포메이션 전략을 고도화하며 새로운 AI 패러다임을 주도해 나갈 계획이다.

 

네이버는 국내외 유수 기관들과 협업에도 적극적이다. 서울대뿐만 아니라 KAIST, 베트남 HUST와 PTIT, 독일 튀빙겐 대학 등 다양한 국내외의 유수 연구기관들과 공동 연구센터를 설립하며, 초대규모 AI 분야의 리더십을 공고히 해나가고 있다.

 

 

태그

전체댓글 0

  • 40687
비밀번호 :
메일보내기닫기
기사제목
[시큐뉴스] LG·네이버·카카오, '초거대 AI' 잇달아 내놔
보내는 분 이메일
받는 분 이메일