구글 Gemini, 사용자의 정보를 기억하는 기능 출시
오늘 Google의 유료 언어모델인 Gemini에 사용자의 정보를 기억하여 추후 답변에 활용하는 기능이 나왔습니다. 예를 들어 사용자가 "우리팀 부장님 이름은 김길동이야, 기억해줘" 라고 했다고 가정해봅시다. Gemini에서는 이런 정보를 기억해두었다가 추구 사용자가 "부장님한테 보낼 메일을 작성해줘" 라고 요청할 때 알아서 수신인에 김길동을 넣어줄 수 있는 것이죠.
ChatGPT나 Claude와 같은 언어모델에서도 비슷한 기능을 지원하나, 세션이 바뀌게 되면 이러한 정보도 날라갑니다. 그러나 구글은 이런 정보를 모든 대화에서 기억하게 할 수 있는 것으로 보입니다. "개인화"된 인공지능 모델인 샘이지요.

관심이 없으시는 분들께서는 구글에도 언어모델이 있었는지 의아하실 것 같습니다. 이번 레터에서는 구글의 언어모델의 특징과 어떻게 구글이 사용자의 대화를 기억하는지, 추후 어떤 긍정적인 효과를 낳을지 정리해보았습니다.
구글의 언어모델 Gemini의 특징
Gemini의 가장 큰 특징은 최대 입력 토큰의 수가 매우 많다는 점입니다. 최대 입력 토큰은 모델이 한번에 인지할 수 있는 길이로, 최대 입력 토큰 수를 벗어난 길이의 입력은 처리할 수 없습니다. 언어모델이 이전에 대화했던 내용에서 이어지며 대화할 수 있는 것도 이전에 대화했던 내용을 전부 모델에게 알려주어 가능한 것입니다.
Gemini는 이 입력 토큰을 매우 많이 넣을 수 있습니다. 이전 대화를 더 많이 기억할 수 있다는 의미입니다. 다른 의미로는 더 많은 코드를 집어넣고 물어볼 수 있다는 것이고, 더 많은 책과 문서를 입력으로 하여 요약시킬 수 있다는 의미입니다.
Gemini는 2백만 토큰(단어랑 비슷한 개념)을 입력으로 줄 수 있습니다. 이것은 책 2,000페이지를 한번에 넣을 수 있는 수준이며, 2시간 분량의 동영상, 19시간의 오디오, 6만줄의 코드 베이스를 한번에 이해하고 처리할 수 있습니다. Claude가 20만, OpenAI가 12만 8천개의 입력 토큰을 처리할 수 있는 것에 비하면 매우 높은 수치입니다.

어떻게 기억할 수 있나요?
내부 구현 방식은 정확히 알 수 없습니다. 다만, 유추해보자면 다음과 같습니다. 만약 사용자가 어떠한 내용을 기억해달라고 요청하면, 기억해야하는 내용을 요약하여 저장해둡니다. 그리고 추후 모든 입력에 적절한 정보를 알려주는 방식으로 기억을 구현할 것입니다. 기존 모델과 비교해 더 큰 수의 입력을 처리할 수 있기 때문에, 이런 방식을 구현하기 유용할 것입니다.
나의 정보를 기억하는 것이 왜 중요할까요?
이것이 개인화된 AI의 시작입니다. 애플의 인공지능인 Apple Intelligence가 주목 받은 이유도, 사용자의 개인화된 정보를 기억하고 이를 바탕으로 답변할 수 있기를 기대해서 입니다.
현재 구글 Gemini의 기능이 이런 주목을 받을 수 있을지 없을지는 지켜봐야 합니다. 구글의 언어모델이 현재 유명하지 않기 때문에, 파급력은 크지 않을 수 있습니다. 다만, 각 회사별 언어모델의 각기 다른 페르소나와 목적에 주목하여 업무에 적용하는 것이 필요할 것으로 생각됩니다.