PaperBanana: AI가 논문 그림까지 자동으로 그려준다
Google과 북경대가 발표한 PaperBanana는 논문 텍스트만으로 출판 수준의 학술 일러스트레이션을 자동 생성하는 에이전트 시스템입니다.

PaperBanana: AI가 논문 그림까지 자동으로 그려준다

논문 쓸 때 가장 시간 잡아먹는 게 뭘까요? 실험? 글쓰기? 많은 연구자들이 "그림 그리기"를 꼽습니다. 방법론 다이어그램, 아키텍처 도식, 결과 시각화... 하나하나 만들다 보면 며칠이 훌쩍 지나가죠.
Google과 북경대 연구팀이 이 문제를 해결하기 위해 PaperBanana를 발표했습니다. 논문 텍스트만 주면 출판 수준의 학술 일러스트레이션을 자동으로 생성해주는 에이전트 시스템입니다.
왜 필요한가?
LLM이 논문 작성, 코드 생성, 실험 설계까지 도와주는 시대입니다. 하지만 그림은? 여전히 사람이 PowerPoint, Figma, TikZ로 하나하나 만들어야 합니다.
- 방법론 다이어그램 하나에 반나절
- 수정 요청 오면 처음부터 다시
- 일관된 스타일 유지하기도 어려움
PaperBanana는 이 병목을 해결합니다.
어떻게 작동하나?

PaperBanana는 4개의 전문화된 에이전트가 협업하는 구조입니다:
1. Reference Retrieval Agent
- 유사한 논문들의 그림 스타일 검색
- 해당 분야의 시각적 컨벤션 파악
- 참고할 레이아웃 패턴 수집
2. Content Planning Agent
- 논문 텍스트에서 핵심 개념 추출
- 그림에 포함할 요소 결정
- 정보 계층 구조 설계
3. Image Rendering Agent
- Vision-Language Model 활용
- 실제 이미지 생성
- 텍스트, 화살표, 박스 등 배치
4. Iterative Refinement Agent
- 생성된 그림 자체 평가
- 개선점 식별 및 수정
- 품질 기준 충족까지 반복
성능: PaperBananaBench

연구팀은 NeurIPS 2025 논문에서 292개 테스트 케이스를 수집해 벤치마크를 만들었습니다.
평가 기준:
- Faithfulness: 논문 내용과 일치하는가
- Conciseness: 불필요한 요소 없이 간결한가
- Readability: 이해하기 쉬운가
- Aesthetics: 시각적으로 보기 좋은가
PaperBanana는 모든 기준에서 기존 방법들을 앞섰습니다.
확장 가능성

방법론 다이어그램뿐 아니라 통계 플롯 생성도 가능합니다:
- 실험 결과 그래프
- 비교 차트
- 데이터 분포 시각화
한계와 전망
현재 한계:
- 복잡한 3D 구조는 아직 어려움
- 도메인별 특수 표기법 지원 제한적
- 생성 시간이 수 분 소요
하지만 AI 연구 워크플로우 자동화의 마지막 퍼즐 조각으로서 의미가 큽니다. 논문 작성의 전 과정이 AI 지원을 받을 수 있는 시대가 다가오고 있습니다.
리소스
- 논문: PaperBanana: Automating Academic Illustration for AI Scientists
- 저자: Google Research, 북경대학교
이메일로 받아보기
관련 포스트

스스로 진화하는 AI 에이전트 — 2026년의 새로운 패러다임
GenericAgent, Evolver, Open Agents — 스스로 스킬을 만들고, 실행 경로를 기억하고, 실패에서 배우는 자가 진화 에이전트 3종 비교.

Paperclip — AI 에이전트로 "무인 회사"를 운영하는 오픈소스 프레임워크
3주 만에 GitHub 3만 스타. AI 에이전트들을 조직도, 예산, 거버넌스로 관리하는 오픈소스 멀티에이전트 오케스트레이션 플랫폼. Heartbeat 시스템, 에이전트별 월 예산, 회사 템플릿까지.

MIRAGE — 멀티모달 AI는 정말로 이미지를 "보고" 있을까?
GPT-5.1, Gemini 3 Pro, Claude Opus 4.5가 이미지 없이도 벤치마크 점수의 70-80%를 유지. 3B 텍스트 전용 모델이 흉부 X-ray 벤치마크에서 모든 멀티모달 모델과 방사선과 전문의를 능가. 스탠포드 MIRAGE 논문 리뷰.