AI ResearchEN

PaperBanana: AI가 논문 그림까지 자동으로 그려준다

Google과 북경대가 발표한 PaperBanana는 논문 텍스트만으로 출판 수준의 학술 일러스트레이션을 자동 생성하는 에이전트 시스템입니다.

PaperBanana: AI가 논문 그림까지 자동으로 그려준다

PaperBanana: AI가 논문 그림까지 자동으로 그려준다

Blog Image
PaperBanana 프레임워크 전체 구조

논문 쓸 때 가장 시간 잡아먹는 게 뭘까요? 실험? 글쓰기? 많은 연구자들이 "그림 그리기"를 꼽습니다. 방법론 다이어그램, 아키텍처 도식, 결과 시각화... 하나하나 만들다 보면 며칠이 훌쩍 지나가죠.

Google과 북경대 연구팀이 이 문제를 해결하기 위해 PaperBanana를 발표했습니다. 논문 텍스트만 주면 출판 수준의 학술 일러스트레이션을 자동으로 생성해주는 에이전트 시스템입니다.

왜 필요한가?

LLM이 논문 작성, 코드 생성, 실험 설계까지 도와주는 시대입니다. 하지만 그림은? 여전히 사람이 PowerPoint, Figma, TikZ로 하나하나 만들어야 합니다.

  • 방법론 다이어그램 하나에 반나절
  • 수정 요청 오면 처음부터 다시
  • 일관된 스타일 유지하기도 어려움

PaperBanana는 이 병목을 해결합니다.

어떻게 작동하나?

Blog Image
에이전트 파이프라인 상세

PaperBanana는 4개의 전문화된 에이전트가 협업하는 구조입니다:

1. Reference Retrieval Agent

  • 유사한 논문들의 그림 스타일 검색
  • 해당 분야의 시각적 컨벤션 파악
  • 참고할 레이아웃 패턴 수집

2. Content Planning Agent

  • 논문 텍스트에서 핵심 개념 추출
  • 그림에 포함할 요소 결정
  • 정보 계층 구조 설계

3. Image Rendering Agent

  • Vision-Language Model 활용
  • 실제 이미지 생성
  • 텍스트, 화살표, 박스 등 배치

4. Iterative Refinement Agent

  • 생성된 그림 자체 평가
  • 개선점 식별 및 수정
  • 품질 기준 충족까지 반복

성능: PaperBananaBench

Blog Image
평가 결과 비교

연구팀은 NeurIPS 2025 논문에서 292개 테스트 케이스를 수집해 벤치마크를 만들었습니다.

평가 기준:

  • Faithfulness: 논문 내용과 일치하는가
  • Conciseness: 불필요한 요소 없이 간결한가
  • Readability: 이해하기 쉬운가
  • Aesthetics: 시각적으로 보기 좋은가

PaperBanana는 모든 기준에서 기존 방법들을 앞섰습니다.

확장 가능성

Blog Image
생성된 일러스트레이션 예시

방법론 다이어그램뿐 아니라 통계 플롯 생성도 가능합니다:

  • 실험 결과 그래프
  • 비교 차트
  • 데이터 분포 시각화

한계와 전망

현재 한계:

  • 복잡한 3D 구조는 아직 어려움
  • 도메인별 특수 표기법 지원 제한적
  • 생성 시간이 수 분 소요

하지만 AI 연구 워크플로우 자동화의 마지막 퍼즐 조각으로서 의미가 큽니다. 논문 작성의 전 과정이 AI 지원을 받을 수 있는 시대가 다가오고 있습니다.

리소스

더 많은 콘텐츠를 받아보세요

SNS에서 새로운 글과 튜토리얼 소식을 가장 먼저 받아보세요

이메일로 받아보기

관련 포스트