Перейти к содержимому

Тарифы Yandex AI Studio

Yandex AI Studio использует модель pay-as-you-go — платите только за фактическое использование ресурсов. Все цены указаны с учетом НДС.

Yandex AI Studio использует юниты для детализации потребления в Yandex Cloud Billing.

УслугаСтоимость юнита
1000 юнитов (генерация текста)0,20 ₽
1000 юнитов (векторизация)0,01 ₽
1 юнит (выделенный инстанс)1,00 ₽

Быстрая модель для массовых задач

РежимЦена за 1000 токенов
Синхронный0,20 ₽
Асинхронный0,10 ₽

Применение:

  • Чат-боты для сайтов
  • Массовая обработка запросов
  • Простая генерация контента

Экономия: Асинхронный режим дешевле на 50%

Продвинутая модель для сложных задач

РежимЦена за 1000 токенов
Синхронный1,20 ₽
Асинхронный0,60 ₽

Применение:

  • Анализ документов
  • Бизнес-аналитика
  • Сложная генерация контента

Новейшая версия со скидкой 50%

РежимЦена за 1000 токеновС учетом скидки
Синхронный0,80 ₽0,40 ₽
Асинхронный0,40 ₽0,20 ₽
МодельРежимЦена за 1000 токеновСкидка
Qwen3 235BСинхронный1,00 ₽0,50 ₽ (-50%)
Qwen 2.5 72B InstructПакетный0,60 ₽
Qwen 2.5 32B InstructПакетный0,40 ₽
Qwen 2.5 7B InstructПакетный0,10 ₽

Особенности Qwen3 235B:

  • Самая мощная опенсорс-модель в галерее
  • 235 млрд параметров
  • Конкурирует с GPT-4
МодельРежимЦена за 1000 токеновСкидка
Gemma3 27BСинхронный0,80 ₽0,40 ₽ (-50%)
Gemma3 12B itПакетный0,20 ₽
Gemma3 4B itПакетный0,10 ₽
Gemma3 1B itПакетный0,10 ₽

Преимущества:

  • Разработка Google
  • Хорошее качество при низкой стоимости
  • Несколько размеров под разные задачи
МодельРежимЦена за 1000 токенов
DeepSeek-R1-Distill-Llama-70BПакетный0,60 ₽
DeepSeek-R1-Distill-Qwen-32BПакетный0,40 ₽
DeepSeek 2 VLПакетный0,40 ₽
DeepSeek 2 VL TinyПакетный0,10 ₽

Vision models (VL):

  • Мультимодальные модели
  • Анализ изображений + текст
  • Подходят для документов с визуальным контентом
МодельРежимЦена за 1000 токенов
Llama-3.3-70B-InstructПакетный0,60 ₽
Llama-3.1-70B-InstructПакетный0,60 ₽

Особенности:

  • Популярная опенсорс-модель
  • Сильное сообщество
  • Хорошая производительность
МодельРежимЦена за 1000 токенов
gpt-oss-120bСинхронный0,30 ₽
gpt-oss-20bСинхронный0,10 ₽
phi-4Пакетный0,20 ₽
QwQ 32B InstructПакетный0,40 ₽

Когда использовать:

  • Обработка больших датасетов
  • Ночная аналитика
  • ETL-процессы
  • Массовая генерация

Преимущества:

  • Ниже стоимость за токен
  • Оптимизировано для больших объемов
  • Нет ограничения на время выполнения

Dedicated ресурсы для предсказуемой производительности

Цена указана за 1 час использования. Тарификация посекундная.

МодельS (1x GPU)M (2x GPU)L (3x GPU)
Qwen 2.5 72B Instruct804 ₽/час1 608 ₽/час2 412 ₽/час
Qwen 2.5 VL 32B Instruct804 ₽/час1 608 ₽/час2 412 ₽/час
gpt-oss-120b804 ₽/час1 608 ₽/час2 412 ₽/час
Gemma 3 12B it402 ₽/час804 ₽/час1 206 ₽/час
Gemma 3 4B it402 ₽/час804 ₽/час1 206 ₽/час
gpt-oss-20b402 ₽/час804 ₽/час1 206 ₽/час
T-pro-it-2.0-FP8744 ₽/час1 488 ₽/час2 232 ₽/час

Применение:

  • Высоконагруженные продакшн-системы
  • Требования к SLA
  • Предсказуемая латентность
  • Отсутствие noisy neighbors

Расчет стоимости:

  • Конфигурация M для Qwen 2.5 72B: 1 608 ₽/час
  • При работе 24/7 в месяц: 1 608 × 24 × 30 = 1 157 760 ₽

Что можно дообучить:

  • YandexGPT Lite
  • Дообученная модель тарифицируется как базовая YandexGPT Lite (0,20 ₽ за 1000 токенов)

Применение:

  • Адаптация под доменную специфику
  • Обучение на корпоративных данных
  • Улучшение качества для конкретных задач

Использование токенизатора не тарифицируется

  • TokenizerService — бесплатно
  • Методы Tokenizer — бесплатно

Применение:

  • Подсчет токенов перед запросом
  • Оптимизация промптов
  • Оценка стоимости операций

Стоимость:

УслугаЦена за 1000 токенов
Получение эмбеддингов0,01 ₽

Применение:

  • RAG-системы
  • Семантический поиск
  • Классификация документов
  • Поиск похожих текстов

Расчет:

  • Векторизация 1 млн токенов: 10 ₽
  • Средний документ 500 токенов: 2000 документов за 10 ₽

МодельЕдиница тарификацииЦена
YandexGPT Lite1 запрос (до 1000 токенов)0,15 ₽
YandexGPT Pro1 запрос (до 250 токенов)0,15 ₽
Дообученный классификатор1 запрос (до 250 токенов)0,15 ₽

YandexGPT Lite:

  • Текст 770 токенов = 1 запрос (0,15 ₽)
  • Текст 1500 токенов = 2 запроса (0,30 ₽)

YandexGPT Pro / Дообученный:

  • Текст 770 токенов = 4 запроса (0,60 ₽)
  • Округление всегда в большую сторону

Применение:

  • Категоризация обращений
  • Фильтрация контента
  • Определение sentiment
  • Маршрутизация запросов

Стоимость:

УслугаЦена
1 запрос на генерацию изображения2,20 ₽

Особенности:

  • Один запрос = одно изображение
  • Максимальная длина промта: 500 символов
  • Результат генерации уникален каждый раз

Расчет:

  • 100 изображений: 220 ₽
  • 1000 изображений: 2 200 ₽

Использование AI Assistant API и Responses API:

  • Хранение файлов — бесплатно
  • Хранение поисковых индексов — бесплатно
  • API вызовы — бесплатно
  • Оплачиваются только токены по тарифам Model Gallery

Модель: speech-realtime-250923

УслугаЦена за единицуСкидка до 01.11.2025
Входящее аудио (распознавание)0,052 ₽/сек0,026 ₽/сек (-50%)
Исходящее аудио (синтез)0,04 ₽/сек0,02 ₽/сек (-50%)
Генерация текста1,60 ₽/1000 токенов0,80 ₽/1000 токенов (-50%)

Расчет стоимости звонка:

Пример: 5-минутный разговор

  • Входящее аудио: 300 сек × 0,026 ₽ = 7,80 ₽
  • Исходящее аудио: 300 сек × 0,02 ₽ = 6,00 ₽
  • Генерация текста: 2000 токенов × 0,80 ₽ / 1000 = 1,60 ₽
  • Итого: 15,40 ₽ за звонок
ИнструментСтоимостьПримечание
Вызов инструментов AI Assistant APIБесплатно
File Search (поиск по файлам)Бесплатно
Web Search (поиск в интернете)Бесплатно до 17.11.2025Далее: 900 ₽ за 1000 запросов

Что оплачивается:

  • Использование инструментов в MCP-серверах (например, Yandex Cloud Functions)
  • Внешние API (оплата партнерам напрямую): Контур.Фокус, amoCRM и др.

Что бесплатно:

  • Создание MCP-серверов
  • Подключение серверов к агентам
  • Хранение конфигураций

Что покрывается:

  • Ошибки на стороне Yandex Cloud
  • Недоступность сервиса
  • Технические сбои

Что не покрывается:

  • Ошибки в промптах (4xx)
  • Превышение квот
  • Некорректные запросы

МодельYandex AI StudioGigaChatOpenAI GPT-4
Lite/Базовая0,20 ₽ (синхр) / 0,10 ₽ (асинхр)0,20 ₽~2,50 $
Pro/Продвинутая0,40 ₽ (Pro 5.1)1,50 ₽~10 $
Max/Топ1,95 ₽~30 $
СервисЦена
Yandex AI Studio0,01 ₽
GigaChat0,04 ₽
OpenAI~0,10 $
СервисЦена
Yandex AI Studio (YandexART)2,20 ₽
GigaChatУточняйте
OpenAI (DALL-E 3)~4 $

  • Экономия: 50% на генерации текста
  • Подходит для: фоновых задач, массовой обработки
  • Не подходит для: интерактивных приложений
  • Lite — для простых задач (0,10 ₽ асинхр)
  • Pro 5.1 — лучшее соотношение цена/качество (0,20 ₽ асинхр)
  • Опенсорс — альтернативы с хорошим качеством
  • Обрабатывайте данные батчами
  • Минимум 200K токенов на запуск
  • Дешевле синхронного режима
  • Сохраняйте частые ответы
  • Используйте векторный поиск для похожих запросов
  • Снижайте повторные обращения к API
  • Короткие промпты = меньше токенов
  • Используйте токенизатор для подсчета (бесплатно)
  • Убирайте лишний контекст

Нужна помощь с выбором модели и оптимизацией расходов? Свяжитесь со мной для консультации!