OpenAI의 새로운 기능 출시: 더 쉽게, 더 강력한 AI 에이전트를 만들어보세요!

OpenAI가 개발자와 기업을 위한 강력한 AI 에이전트 구축 도구들을 선보였습니다! 이제 복잡한 작업도 쉽고 빠르게 자동화할 수 있도록 돕는 다양한 기능이 준비되어 있습니다. 2025를 Agent의 해로 선포한 OpenAI의 첫번째 행보를 한번 확인해봅시다.

안녕하세요! 오랜만에 인사드립니다. 개인적인 힘든 사정으로 뉴스레터를 전달드리지 못했습니다. 한달간의 힘든 일이 잘 마무리 되어, 새로운 소식으로 인사드립니다.

🚀 새롭게 출시된 핵심 기능은 무엇인가요?

1️⃣ Responses API 출시

기존 모델 호출 API와 다양한 도구를 결합하여 복잡한 작업을 한번에 처리할 수 있는 기능을 공개했습니다. 기존의 Chat Completions API의 간편함과 Assistants API의 도구 활용 기능이 결합된 형태로 웹 검색, 파일 검색, 컴퓨터 사용 등 내장된 도구를 한번에 지원하게 됩니다. 또한, 직접 정의한 도구를 사용할 수도 있습니다.

from openai import OpenAI
client = OpenAI()

response = client.responses.create(
    model="gpt-4o",
    input="Write a one-sentence bedtime story about a unicorn."
)

print(response.output_text)

기존 모델 호출 방식인 create 대신에 response를 사용하면 됩니다. 이미지, 도구 호출, Realtime API, Agent Build와 결합되어 있습니다.

2️⃣ 새로운 내장 도구들

① 웹 검색 도구

실시간 최신 정보를 AI가 직접 찾아 제공하고, 출처까지 명확히 제시합니다. Agent나 RAG시스템을 위해 직접 검색기능을 추가해야하는 불편함을 덜 수 있게 되었습니다. 현재는 프리뷰 버전이며, 일반적인 모델의 입출력을 통한 결과보다 높은 성능을 보입니다.

클릭하여 크게 보기

비용의 경우 1,000개의 쿼리당 GPT-4o-search의 경우 $30, GPT-4o-mini-search의 경우 $25 부터 시작합니다. 비슷한 Perplexity의 경우 1,000호출 당 5달러이고 1백만 토큰당 입출력 비용이 모델별로 1달러 ~ 8달러까지 책정되어 있습니다. 구글에서 제공하는 구글 검색 API기능이 1,000건의 검색 호출당 5$입니다. 보통 RAG를 사용하여 검색을 수행한다면, 사용자 의도분석, 생성 등 추가적인 생성 비용이 들 것입니다. 또한, 웹페이지를 효과적으로 크롤링하고 정리하는 기술적 개발 비용이 소요될 것입니다.

종합적으로 고려했을 때, 기존 검색을 지원하는 생성모델과 비슷한 수준이고, 직접 구축하는 것보다는 다소 비용이 들어가는 솔루션으로 여겨집니다. 그러므로, 직접 구현하거나, 혹은 자신에게 딱 맞게 제작하는 것보다 얼마다 더 좋은 성능을 보이는 지가 해당 비용을 지불할 가치가 있는지를 평가하는 기준이 될 것입니다.

② 파일 검색 도구

대량의 문서에서 필요한 정보를 신속하고 정확하게 검색할 수 있도록 최적화합니다. 법률 사례 검색, 고객 지원 FAQ 조회, 기술 문서 검색 등에 강력하게 활용 가능하고, 맞춤형 쿼리 최적화와 메타데이터 필터링 제공합니다. 앞서 설명한 Response API와 결합하여 손쉽게 사용할 수 있다고 합니다.

비용의 경우, 1,000개의 쿼리당 $2.50의 비용이 소요되며, 파일 저장에 대해 1기가 당 하루에 $0.10의 비용이 소요됩니다. 생성 기능없이 해당 도구를 호출하는데에 소요되는 비용만을 의미합니다. 이는 기존 벡터 서치 기반 혹은 Agent기반의 파일 탐색 기능을 대체할 수 있는 기능으로, 여겨집니다. 온프라미스 혹은 클라우드로 구축하는 비용에 비해 다소 높은 비용으로 책정되어 있는데, 이를 상쇄할 수 있는 성능과 직접 구현하는 엔지니어링 난이도에 비교하여 사용을 고려하면 될 것입니다.

두 도구 모두 직접 구현하는 비용, 난이도와 해당 기능을 사용하는 것 간에 적절하게 성능 평가를 수행하고 비용 효율성을 고려하여 선택해야 할 것 같습니다.

③ 컴퓨터 사용 도구 (Computer Use)

웹 브라우저나 운영체제 상의 작업을 자동화할 수 있는 강력한 도구입니다. 데이터 입력, 웹사이트 테스트 등 반복적인 작업을 AI가 직접 수행하며, 사전 안전 점검과 확인 프로세스가 있어 안전하게 사용 가능한 기능이라고 소개합니다.

빌트인 Computer Use Tool은 마우스와 키보드 액션을 모델의 생성결과로부터 받아서 실제 개발자가 자동화할 수 있도록 실행가능한 커멘드로 변경하여 자동으로 실행할 수 있도록 지원합니다. 여러 회사들이 이 Computer Use Tool을 사용하여 정형화되지 않은 작업들을 수행할 수 있게 되었다고 소개합니다.

비용의 경우, 3-5티어의 개발자를 대상으로 공개되며, 1백만 토큰 입출력당 각각 $3, $2라고 합니다. 이는 컴퓨터 자동화를 얼마나 효과적이고 정확하게 수행할 수 있을지, 이를 통해 얼마나 높은 비용을 절약할 수 있을지가 사용 여부를 결정할 것으로 보입니다.

🚀 Agent SDK 출시

OpenAI의 적용 예시 영상부터 보고 오시죠.

OpenAI는 오픈소스로 Agent 작업 흐름을 관리하는 오픈소스를 출시하였습니다. 이는 다음의 기능을 포함합니다.

에이전트(Agents): 명확한 지시사항과 내장된 도구를 통해 쉽게 설정할 수 있는 에이전트
핸드오프(Handoffs): 여러 에이전트 간의 작업 제어권을 지능적으로 전달하는 기능
가드레일(Guardrails): 입력 및 출력의 유효성을 검사할 수 있는 설정 가능한 안전성 검사 기능
추적 및 관측 가능성(Tracing & Observability): 에이전트의 작업 실행 과정을 시각적으로 추적하여 디버깅과 성능 최적화 지원

영상처럼 다양한 Agent 기술 개발을 지원하며, 이를 모니터링 할 수 있게 되었습니다.

정리하자면,

기존 여러 회사에서 경쟁적으로 지원하던 기능, 혹은 직접 구현해야 사용할 수 있던 기능을 OpenAI에서 솔루션으로 지원하게 되면서 해당 기업들은 OpenAI와 직접 기술적, 비용적으로 경쟁해야하는 위치에 놓이게 되었습니다. 특히, Perplexity와 같은 기업뿐만 아니라, 온프라미스로 RAG, Agent 시스템을 지원하던 SaaS, SI 기업들 역시 OpenAI와의 차별성을 강조해야하는 시기가 되었습니다.

생각보다 빠른 시기에 Agent 기능이 공개되었고, AI를 잘 모르더라도 이런 기능을 충실하게 사용하면 빠른 시기에 좋은 성능의 Agent와 RAG 시스템을 구축할 수 있게 되었습니다. 사용자로서는 직접 구축하는 것과 비용을 지불하고 사용하는 것 간에 장단점을 명확하게 분석하여 사용할 수 있는 힘을 기르는 것이 필요해보입니다.