최근 포스트

Blackwell Serving

1편에서 B300의 아키텍처가 왜 다른지, 2편에서 인프라를 왜 먼저 준비해야 하는지를 다뤘다. 이번 3편에서는 그 위에서 실제로 서빙을 올리기 위한 소프트웨어 스택을 왜 지금부터 맞춰야 하는지를 다룬다.

Blackwell Hardware

1편에서 B300이 Hopper와 설계 철학부터 다른 칩이라는 이야기를 했다. 이번 글에서는 그 칩을 물리적으로 운용하기 위해 왜 미리 준비해야 하는지를 다룬다.

Blackwell Architecture

올해 팀에서 B300을 다수 도입할 예정이다. 학습도 하지만 주로 서빙 용도로, vLLM/SGLang/KServe 기반 Kubeflow 파이프라인 위에서 운용하게 된다.