본문 바로가기
나눔/인공지능 소식

제미나이 1.5 공개 컨텍스트 윈도우 대폭 확대, 100만 토큰

by 나누는 뭐맘 2024. 2. 23.
반응형

들어가기 전

안녕하세요. 뭐라도 해보는 엄마 '뭐맘'입니다. 저는 디자이너로 8여 년간 근무 한 경력이 있으며, 현재는 육아가 본업인 평범한 엄마입니다. 따라서 많은 공부와 자료조사를 토대로 포스팅을 함에도 전문성이 다소 떨어질 수 있으니 이 점 유의하시고 너그러운 마음으로 포스팅 봐주시면 감사하겠습니다. 혹시 오류를 정정해주고 싶으시면 mueomom@naver.com으로 메일 주시면 감사한 마음으로 배우고 수정하겠습니다.

 

구글 제미나이

제미나이

 

제미나이는 구글에서 내놓은 인공지능 모델로  AI 모델 중 가장 범용적이며, 다양한 유형의 정보를 효율적으로 처리할 수 있도록 설계되었습니다. 구글 전반의 대규모 협업 결과물로 처음부터 멀티모달로 설계되었는데 멀티모달이란 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 유형의 정보를 이해하며 여러 정보를 동시에 활용할 수 있다는 뜻입니다.

제미나이는 울트라(Ultra), 프로(Pro), 나노(Nano) 세가지 버전으로 나뉘며, 제미나이 울트라(Gemini Ultra)는 복잡한 작업에 적합한 가장 규모가 큰 모델, 제미나이 프로(Gemini Pro)는 다양한 작업에서 확장할 수 있는 모델, 제미나이 나노 (Gemini Nano)는 온 디바이스 작업에 가장 효율적인 모델입니다. 갤럭시 S24에도 제미나이 나노가 적용 되었죠.

이 중 1.5로 업데이트 된 것은 제미나이 프로입니다.

 

제미나이 1.5 프로

제미나이 1.5 프로는 더 적은 컴퓨팅 자원으로 제미나이 1.0 울트라에 준하는 성능을 보이는데, 특히 이해할 수 있는 컨텍스트 윈도우의(context window) 양이 대폭 확대되었습니다.

컨텍스트 윈도우란 인공지능 모델이 주어진 단어나 문장을 이해하고 해설할 때 참조하는 주변 단어들의 범위로 인공지능에게 일을 시키기 전 넣어놓을 수 있는 자료라고 생각하시면 됩니다. 이는 모델의 이해도와 성능에 중요한 영향을 미치는데 기존 제미나이 1.0의 3만 2천 토큰을 넘어 제미나이 1.5 프로는 최대 100만 토큰까지 처리할 수 있게 되었습니다.

출처 : 구글 블로그

구글 블로그의 이미지를 보시면 기존 제미나이 1.0 프로가 32K, 사람들에게 익숙한 GPT-4가 128K 그리고 컨텍스트 윈도우의 양이 많다고 알려진 Claude 2.1이 200K인데 이번에 공개하는 제미나이 1.5프로가 1M(100만)입니다. 

1시간 분량의 영상, 11시간 분량의 음성, 3만 줄 이상의 코드 및 70만 개가 넘는 단어 등을 포함해 엄청난 양의 정보를 한 번에 처리할 수 있다고 합니다. 이게 어느 정도인지 구글의 예시를 말씀드리자면 44분짜리 무성영화 한 편을 제미나이 1.5 프로에 보여주고 영화 중간의 특정 장면을 이야기하면 바로 찾을 수 있는 수준입니다. 엄청난 발전입니다.

 

제미나이 1.5프로 사용하려면

안타깝게도 모든 사람이 바로 제미나이 1.5 프로를 사용할 수 있는 것은 아닙니다. 제미나이 1.5 프로 테스트에 관심 있는 개발자들은 구글 AI 스튜디오(Google AI Studio)에서 등록해 이용할 수 있으며, 기업 고객은 구글 버텍스 AI 담당자에게 문의 후 이용 가능하다고 합니다.

 

마무리

놀라운 발표인데 영상 인공지능 Sora에 살짝 밀린 감이 있습니다. 공개 시기가 겹쳐서 안타깝습니다.저는 주로 GPT를 이용했는데 제미나이에도 호기심이 생겼습니다. 틈틈이 번갈아 사용해 보고 나눌 정보가 있다면 또 포스팅하겠습니다. 감사합니다.

 

 

 

 

반응형