PaperBanana: AI가 논문 그림까지 자동으로 그려준다

PaperBanana 프레임워크 전체 구조

논문 쓸 때 가장 시간 잡아먹는 게 뭘까요? 실험? 글쓰기? 많은 연구자들이 "그림 그리기"를 꼽습니다. 방법론 다이어그램, 아키텍처 도식, 결과 시각화... 하나하나 만들다 보면 며칠이 훌쩍 지나가죠.

Google과 북경대 연구팀이 이 문제를 해결하기 위해 PaperBanana를 발표했습니다. 논문 텍스트만 주면 출판 수준의 학술 일러스트레이션을 자동으로 생성해주는 에이전트 시스템입니다.

왜 필요한가?

LLM이 논문 작성, 코드 생성, 실험 설계까지 도와주는 시대입니다. 하지만 그림은? 여전히 사람이 PowerPoint, Figma, TikZ로 하나하나 만들어야 합니다.

방법론 다이어그램 하나에 반나절
수정 요청 오면 처음부터 다시
일관된 스타일 유지하기도 어려움

PaperBanana는 이 병목을 해결합니다.

어떻게 작동하나?

에이전트 파이프라인 상세

PaperBanana는 4개의 전문화된 에이전트가 협업하는 구조입니다:

1. Reference Retrieval Agent

유사한 논문들의 그림 스타일 검색
해당 분야의 시각적 컨벤션 파악
참고할 레이아웃 패턴 수집

2. Content Planning Agent

논문 텍스트에서 핵심 개념 추출
그림에 포함할 요소 결정
정보 계층 구조 설계

3. Image Rendering Agent

Vision-Language Model 활용
실제 이미지 생성
텍스트, 화살표, 박스 등 배치

4. Iterative Refinement Agent

생성된 그림 자체 평가
개선점 식별 및 수정
품질 기준 충족까지 반복

성능: PaperBananaBench

평가 결과 비교

연구팀은 NeurIPS 2025 논문에서 292개 테스트 케이스를 수집해 벤치마크를 만들었습니다.

평가 기준:

Faithfulness: 논문 내용과 일치하는가
Conciseness: 불필요한 요소 없이 간결한가
Readability: 이해하기 쉬운가
Aesthetics: 시각적으로 보기 좋은가

PaperBanana는 모든 기준에서 기존 방법들을 앞섰습니다.

확장 가능성

생성된 일러스트레이션 예시

방법론 다이어그램뿐 아니라 통계 플롯 생성도 가능합니다:

실험 결과 그래프
비교 차트
데이터 분포 시각화

한계와 전망

현재 한계:

복잡한 3D 구조는 아직 어려움
도메인별 특수 표기법 지원 제한적
생성 시간이 수 분 소요

하지만 AI 연구 워크플로우 자동화의 마지막 퍼즐 조각으로서 의미가 큽니다. 논문 작성의 전 과정이 AI 지원을 받을 수 있는 시대가 다가오고 있습니다.

리소스

논문: PaperBanana: Automating Academic Illustration for AI Scientists
저자: Google Research, 북경대학교

PaperBanana: AI가 논문 그림까지 자동으로 그려준다