Spectrum: 학습 없이 Diffusion 모델 3~5배 빠르게 -- 체비셰프 다항식의 마법
Stanford/ByteDance의 CVPR 2026 논문. 체비셰프 다항식 기반 feature forecasting으로 FLUX.1 4.79배, HunyuanVideo 4.56배 스피드업. Training-free로 어떤 모델에도 즉시 적용.

Spectrum: 학습 없이 Diffusion 모델 3~5배 빠르게 -- 체비셰프 다항식의 마법
Diffusion 모델은 놀라운 이미지와 영상을 만들어내지만, 느립니다. 50스텝 샘플링이 기본이고, 각 스텝마다 수십억 파라미터의 네트워크를 통과해야 합니다. DDIM이나 DPM-Solver 같은 방법들이 스텝 수를 줄여주지만, 여전히 각 스텝의 연산 비용은 그대로입니다.
Stanford와 ByteDance 팀이 CVPR 2026에서 발표한 Spectrum은 완전히 다른 접근법을 택합니다. 추가 학습 없이(training-free), 각 스텝의 네트워크 연산 자체를 건너뛰는 방법입니다. 핵심 아이디어는 디퓨전 경로를 따라 변하는 feature를 체비셰프 다항식으로 근사하고, 중간 스텝의 feature를 예측(forecasting)하는 것입니다.
결과는 인상적입니다: FLUX.1에서 3.47~4.79배 스피드업, HunyuanVideo에서 3.36~4.56배 스피드업 -- 화질 저하 최소화하면서.
배경: Diffusion 가속화의 두 가지 방향
관련 포스트

Claude Sonnet 4.6: Opus급 성능, 40% 저렴 — 벤치마크 심층 분석
Claude Sonnet 4.6은 SWE-bench 79.6%, OSWorld 72.5%, GDPval-AA 1633 Elo로 실무 태스크에서 Opus 4.6과 동급이거나 우위. $3/$15 vs $5/$25. Adaptive Thinking, Context Compaction, OSWorld 성장 추이 분석.

MiniMax M2.5: 1시간 1달러로 Opus급 성능을 쓰는 시대
MiniMax M2.5는 230B MoE 아키텍처에서 10B만 활성화하여 SWE-bench 80.2%를 달성합니다. Claude Opus의 1/20 가격에 동등한 코딩 성능. Forge RL 프레임워크, 벤치마크 분석, 가격 비교.

역전파를 처음부터: Chain Rule, 계산 그래프, 위상 정렬
microgpt.py의 backward() 15줄이 작동하는 원리. 고등학교 미분부터 시작해 chain rule, 계산 그래프, 위상 정렬, 역전파까지 연결합니다.