Доступные ускорители

Выберите карту под нагрузку

От лучшего соотношения цена/производительность до флагмана для тренировки больших моделей.

Ada · 24 GB

RTX 4090

24 GB GDDR6X
16 384 CUDA
82.6 TFLOPS FP16
Хост: Ryzen 9 · 128 GB

45 000₽/мес

Запросить

NEW · Blackwell

Blackwell · 32 GB

RTX 5090

32 GB GDDR7
21 760 CUDA
104.8 TFLOPS FP16
Хост: Ryzen 9 · 192 GB

85 000₽/мес

Запросить

Ampere · 80 GB

A100 80GB

80 GB HBM2e
6 912 CUDA
312 TFLOPS FP16
Хост: EPYC · 512 GB · NVLink

190 000₽/мес

Запросить

Hopper · по заказу

H100 PCIe

80 GB HBM3
14 592 CUDA
756 TFLOPS FP16
Хост: EPYC · 1 TB · 10G

от 390 000₽/мес

Запросить

Сравнение

Характеристики ускорителей

Карта	VRAM	CUDA-ядра	FP16	Цена / мес
RTX 4090Ada · инференс	24 GB GDDR6X	16 384	82.6 TFLOPS	45 000 ₽
RTX 5090Blackwell · new	32 GB GDDR7	21 760	104.8 TFLOPS	85 000 ₽
A100 80GBAmpere · обучение	80 GB HBM2e	6 912	312 TFLOPS	190 000 ₽
H100 PCIeHopper · флагман	80 GB HBM3	14 592	756 TFLOPS	от 390 000 ₽

Под какие задачи берут GPU-серверы

GPU-сервер содержит дискретный ускоритель NVIDIA с CUDA-ядрами и большим объёмом видеопамяти. На задачах обучения и инференса нейросетей это даёт прирост в 50–500 раз по сравнению с обычным CPU-сервером.

Инференс LLM — vLLM, llama.cpp, Ollama, TGI, Triton. Запуск Llama, Mistral, Qwen в production
Обучение и дообучение моделей — PyTorch, fine-tuning, LoRA, RAG-пайплайны
Генерация изображений — Stable Diffusion, ComfyUI, Flux
Видео и рендер — транскодирование, Blender, V-Ray, OctaneRender, DaVinci Resolve
Научные вычисления — HPC, симуляции, обработка больших данных

Что преднастроено

Сервер приходит готовым к работе: установлены драйверы NVIDIA, CUDA, cuDNN, Docker с GPU-runtime. Вам остаётся развернуть свой контейнер или модель. По запросу поставим vLLM / Ollama / ComfyUI под ключ.

Какую карту выбрать

RTX 4090 / 5090 — лучший $/TFLOPS для инференса и диффузии, для большинства задач до 32 GB VRAM их достаточно. A100 80GB — для обучения foundation-моделей и нагрузок, где нужна большая видеопамять и NVLink. H100 — флагман для тренировки и инференса самых больших трансформеров с FP8.

RTX-карты активируем за час, A100 — за сутки. H100 — под заказ от 24 часов до 3 дней. Для разовых задач возможна аренда на короткий срок — обсудим в Telegram.

GPU-серверы NVIDIA для AI

Выберите карту под нагрузку

Характеристики ускорителей

Под какие задачи берут GPU-серверы

Что преднастроено

Какую карту выбрать

Не уверены, какая карта нужна?