DeepSeek API의 속도 제한 관련 문서 업데이트: V4 Pro의 동시 요청 한도는 500, Flash의 경우 2500입니다.

DeepSeek는 API 문서에 동시 요청 제한 관련 내용을 업데이트했습니다. deepseek-v4-pro 모델 계정의 최대 동시 요청 수는 500회이며, deepseek-v4-flash의 경우 2,500회입니다. 이 한도를 초과하면 HTTP 429 오류가 반환됩니다. 더 높은 동시 요청 수가 필요한 사용자는 무료로 할당량 확장을 신청할 수 있습니다. 승인이 완료되면 계정 전체의 동시 요청 한도 외에도 각 user_id마다 해당 모델에 맞는 개별 동시 요청 제한이 적용됩니다.

이번 업데이트에서는 user_id 매개변수도 도입되어 하나의 계정 내에서 콘텐츠 안전성, KVCache, 스케줄링이라는 세 가지 측면에서 보다 세밀한 관리가 가능해졌습니다. 일반 API 사용자의 경우 모든 user_id에 대한 동시 요청 수가 계정 총 한도에 합산됩니다. 반면 할당량이 확장된 계정은 계정 단위 제한 외에도 각 user_id별 동시 요청 상한이 추가로 적용됩니다. 이 기능은 주로 여러 하위 사용자의 트래픽을 개별적으로 격리해야 하는 멀티테넌트 환경에서 개발자들이 활용하기에 적합합니다.

DeepSeek API 문서