- 24 GB GDDR6X
- 16 384 CUDA
- 82.6 TFLOPS FP16
- Хост: Ryzen 9 · 128 GB
RTX 4090, RTX 5090, A100 и H100 с преднастроенным CUDA-стеком. Под инференс LLM, обучение нейросетей, генерацию изображений, видео-транскод и рендер. Активация за час.
От лучшего соотношения цена/производительность до флагмана для тренировки больших моделей.
| Карта | VRAM | CUDA-ядра | FP16 | Цена / мес |
|---|---|---|---|---|
| RTX 4090Ada · инференс | 24 GB GDDR6X | 16 384 | 82.6 TFLOPS | 45 000 ₽ |
| RTX 5090Blackwell · new | 32 GB GDDR7 | 21 760 | 104.8 TFLOPS | 85 000 ₽ |
| A100 80GBAmpere · обучение | 80 GB HBM2e | 6 912 | 312 TFLOPS | 190 000 ₽ |
| H100 PCIeHopper · флагман | 80 GB HBM3 | 14 592 | 756 TFLOPS | от 390 000 ₽ |
GPU-сервер содержит дискретный ускоритель NVIDIA с CUDA-ядрами и большим объёмом видеопамяти. На задачах обучения и инференса нейросетей это даёт прирост в 50–500 раз по сравнению с обычным CPU-сервером.
Сервер приходит готовым к работе: установлены драйверы NVIDIA, CUDA, cuDNN, Docker с GPU-runtime. Вам остаётся развернуть свой контейнер или модель. По запросу поставим vLLM / Ollama / ComfyUI под ключ.
RTX 4090 / 5090 — лучший $/TFLOPS для инференса и диффузии, для большинства задач до 32 GB VRAM их достаточно. A100 80GB — для обучения foundation-моделей и нагрузок, где нужна большая видеопамять и NVLink. H100 — флагман для тренировки и инференса самых больших трансформеров с FP8.
RTX-карты активируем за час, A100 — за сутки. H100 — под заказ от 24 часов до 3 дней. Для разовых задач возможна аренда на короткий срок — обсудим в Telegram.