AI ToolsEN

AgentScope 실시간 음성 에이전트 — OpenAI/Gemini/DashScope Realtime API

TTS 모델 6종, RealtimeAgent, 음성+도구 결합, 멀티모달 파이프라인으로 실시간 음성 에이전트 구축.

AgentScope 실시간 음성 에이전트 — OpenAI/Gemini/DashScope Realtime API

AgentScope 실시간 음성 에이전트 — OpenAI/Gemini/DashScope Realtime API

텍스트 에이전트의 한계는 명확합니다. 고객이 전화로 문의하면? 운전 중에 에이전트를 써야 하면? 시각 장애인 사용자가 접근하려면?

AgentScope는 실시간 음성 에이전트를 일급 기능으로 지원합니다. OpenAI, Gemini, DashScope의 Realtime API를 동일한 인터페이스로 사용하고, 기존 도구와 파이프라인을 그대로 음성 에이전트에 연결할 수 있습니다.

시리즈: Part 1: 시작하기 | Part 2: 멀티 에이전트 | Part 3: MCP 서버 연동 | Part 4: RAG + 메모리 | Part 5 (이 글) | Part 6: 프로덕션 배포

1. 음성 에이전트 개요

🔒

이어서 읽으려면 로그인이 필요합니다

무료 회원가입으로 전체 콘텐츠를 확인하세요.

관련 포스트