Тарифы Yandex AI Studio

Yandex AI Studio использует модель pay-as-you-go — платите только за фактическое использование ресурсов. Все цены указаны с учетом НДС.

Единицы тарификации

Yandex AI Studio использует юниты для детализации потребления в Yandex Cloud Billing.

Услуга	Стоимость юнита
1000 юнитов (генерация текста)	0,20 ₽
1000 юнитов (векторизация)	0,01 ₽
1 юнит (выделенный инстанс)	1,00 ₽

Model Gallery

YandexGPT — модели Яндекса

YandexGPT Lite

Быстрая модель для массовых задач

Режим	Цена за 1000 токенов
Синхронный	0,20 ₽
Асинхронный	0,10 ₽

Применение:

Чат-боты для сайтов
Массовая обработка запросов
Простая генерация контента

Экономия: Асинхронный режим дешевле на 50%

YandexGPT Pro 5.0 и младше

Продвинутая модель для сложных задач

Режим	Цена за 1000 токенов
Синхронный	1,20 ₽
Асинхронный	0,60 ₽

Применение:

Анализ документов
Бизнес-аналитика
Сложная генерация контента

YandexGPT Pro 5.1

Новейшая версия со скидкой 50%

Режим	Цена за 1000 токенов	С учетом скидки
Синхронный	0,80 ₽	0,40 ₽ ✨
Асинхронный	0,40 ₽	0,20 ₽ ✨

Опенсорс-модели

Qwen (Alibaba Cloud)

Модель	Режим	Цена за 1000 токенов	Скидка
Qwen3 235B	Синхронный	1,00 ₽	0,50 ₽ (-50%)
Qwen 2.5 72B Instruct	Пакетный	0,60 ₽	—
Qwen 2.5 32B Instruct	Пакетный	0,40 ₽	—
Qwen 2.5 7B Instruct	Пакетный	0,10 ₽	—

Особенности Qwen3 235B:

Самая мощная опенсорс-модель в галерее
235 млрд параметров
Конкурирует с GPT-4

Gemma (Google)

Модель	Режим	Цена за 1000 токенов	Скидка
Gemma3 27B	Синхронный	0,80 ₽	0,40 ₽ (-50%)
Gemma3 12B it	Пакетный	0,20 ₽	—
Gemma3 4B it	Пакетный	0,10 ₽	—
Gemma3 1B it	Пакетный	0,10 ₽	—

Преимущества:

Разработка Google
Хорошее качество при низкой стоимости
Несколько размеров под разные задачи

DeepSeek

Модель	Режим	Цена за 1000 токенов
DeepSeek-R1-Distill-Llama-70B	Пакетный	0,60 ₽
DeepSeek-R1-Distill-Qwen-32B	Пакетный	0,40 ₽
DeepSeek 2 VL	Пакетный	0,40 ₽
DeepSeek 2 VL Tiny	Пакетный	0,10 ₽

Vision models (VL):

Мультимодальные модели
Анализ изображений + текст
Подходят для документов с визуальным контентом

Llama (Meta)

Модель	Режим	Цена за 1000 токенов
Llama-3.3-70B-Instruct	Пакетный	0,60 ₽
Llama-3.1-70B-Instruct	Пакетный	0,60 ₽

Особенности:

Популярная опенсорс-модель
Сильное сообщество
Хорошая производительность

Другие модели

Модель	Режим	Цена за 1000 токенов
gpt-oss-120b	Синхронный	0,30 ₽
gpt-oss-20b	Синхронный	0,10 ₽
phi-4	Пакетный	0,20 ₽
QwQ 32B Instruct	Пакетный	0,40 ₽

Пакетный режим

Когда использовать:

Обработка больших датасетов
Ночная аналитика
ETL-процессы
Массовая генерация

Преимущества:

Ниже стоимость за токен
Оптимизировано для больших объемов
Нет ограничения на время выполнения

Выделенные инстансы

Dedicated ресурсы для предсказуемой производительности

Цена указана за 1 час использования. Тарификация посекундная.

Модель	S (1x GPU)	M (2x GPU)	L (3x GPU)
Qwen 2.5 72B Instruct	804 ₽/час	1 608 ₽/час	2 412 ₽/час
Qwen 2.5 VL 32B Instruct	804 ₽/час	1 608 ₽/час	2 412 ₽/час
gpt-oss-120b	804 ₽/час	1 608 ₽/час	2 412 ₽/час
Gemma 3 12B it	402 ₽/час	804 ₽/час	1 206 ₽/час
Gemma 3 4B it	402 ₽/час	804 ₽/час	1 206 ₽/час
gpt-oss-20b	402 ₽/час	804 ₽/час	1 206 ₽/час
T-pro-it-2.0-FP8	744 ₽/час	1 488 ₽/час	2 232 ₽/час

Применение:

Высоконагруженные продакшн-системы
Требования к SLA
Предсказуемая латентность
Отсутствие noisy neighbors

Расчет стоимости:

Конфигурация M для Qwen 2.5 72B: 1 608 ₽/час
При работе 24/7 в месяц: 1 608 × 24 × 30 = 1 157 760 ₽

Дообучение (Fine-tuning)

Что можно дообучить:

YandexGPT Lite
Дообученная модель тарифицируется как базовая YandexGPT Lite (0,20 ₽ за 1000 токенов)

Применение:

Адаптация под доменную специфику
Обучение на корпоративных данных
Улучшение качества для конкретных задач

Токенизация

Использование токенизатора не тарифицируется

TokenizerService — бесплатно
Методы Tokenizer — бесплатно

Применение:

Подсчет токенов перед запросом
Оптимизация промптов
Оценка стоимости операций

Векторизация текста (Embeddings)

Стоимость:

Услуга	Цена за 1000 токенов
Получение эмбеддингов	0,01 ₽

Применение:

RAG-системы
Семантический поиск
Классификация документов
Поиск похожих текстов

Расчет:

Векторизация 1 млн токенов: 10 ₽
Средний документ 500 токенов: 2000 документов за 10 ₽

Классификация текста

Единицы тарификации

Модель	Единица тарификации	Цена
YandexGPT Lite	1 запрос (до 1000 токенов)	0,15 ₽
YandexGPT Pro	1 запрос (до 250 токенов)	0,15 ₽
Дообученный классификатор	1 запрос (до 250 токенов)	0,15 ₽

Правила округления

YandexGPT Lite:

Текст 770 токенов = 1 запрос (0,15 ₽)
Текст 1500 токенов = 2 запроса (0,30 ₽)

YandexGPT Pro / Дообученный:

Текст 770 токенов = 4 запроса (0,60 ₽)
Округление всегда в большую сторону

Применение:

Категоризация обращений
Фильтрация контента
Определение sentiment
Маршрутизация запросов

Генерация изображений (YandexART)

Стоимость:

Услуга	Цена
1 запрос на генерацию изображения	2,20 ₽

Особенности:

Один запрос = одно изображение
Максимальная длина промта: 500 символов
Результат генерации уникален каждый раз

Расчет:

100 изображений: 220 ₽
1000 изображений: 2 200 ₽

Agent Atelier

Ассистенты и текстовые агенты

Использование AI Assistant API и Responses API:

Хранение файлов — бесплатно
Хранение поисковых индексов — бесплатно
API вызовы — бесплатно
Оплачиваются только токены по тарифам Model Gallery

Голосовые агенты (Realtime API)

Модель: speech-realtime-250923

Услуга	Цена за единицу	Скидка до 01.11.2025
Входящее аудио (распознавание)	0,052 ₽/сек	0,026 ₽/сек (-50%)
Исходящее аудио (синтез)	0,04 ₽/сек	0,02 ₽/сек (-50%)
Генерация текста	1,60 ₽/1000 токенов	0,80 ₽/1000 токенов (-50%)

Расчет стоимости звонка:

Пример: 5-минутный разговор

Входящее аудио: 300 сек × 0,026 ₽ = 7,80 ₽
Исходящее аудио: 300 сек × 0,02 ₽ = 6,00 ₽
Генерация текста: 2000 токенов × 0,80 ₽ / 1000 = 1,60 ₽
Итого: 15,40 ₽ за звонок

Инструменты в агентах

Инструмент	Стоимость	Примечание
Вызов инструментов AI Assistant API	Бесплатно	—
File Search (поиск по файлам)	Бесплатно	—
Web Search (поиск в интернете)	Бесплатно до 17.11.2025	Далее: 900 ₽ за 1000 запросов

MCP Hub

Что оплачивается:

Использование инструментов в MCP-серверах (например, Yandex Cloud Functions)
Внешние API (оплата партнерам напрямую): Контур.Фокус, amoCRM и др.

Что бесплатно:

Создание MCP-серверов
Подключение серверов к агентам
Хранение конфигураций

Внутренние ошибки

Что покрывается:

Ошибки на стороне Yandex Cloud
Недоступность сервиса
Технические сбои

Что не покрывается:

Ошибки в промптах (4xx)
Превышение квот
Некорректные запросы

Сравнение стоимости

Генерация текста (за 1000 токенов)

Модель	Yandex AI Studio	GigaChat	OpenAI GPT-4
Lite/Базовая	0,20 ₽ (синхр) / 0,10 ₽ (асинхр)	0,20 ₽	~2,50 $
Pro/Продвинутая	0,40 ₽ (Pro 5.1)	1,50 ₽	~10 $
Max/Топ	—	1,95 ₽	~30 $

Векторизация (за 1000 токенов)

Сервис	Цена
Yandex AI Studio	0,01 ₽
GigaChat	0,04 ₽
OpenAI	~0,10 $

Генерация изображений

Сервис	Цена
Yandex AI Studio (YandexART)	2,20 ₽
GigaChat	Уточняйте
OpenAI (DALL-E 3)	~4 $

Оптимизация расходов

1. Используйте асинхронный режим

Экономия: 50% на генерации текста
Подходит для: фоновых задач, массовой обработки
Не подходит для: интерактивных приложений

2. Выбирайте подходящую модель

Lite — для простых задач (0,10 ₽ асинхр)
Pro 5.1 — лучшее соотношение цена/качество (0,20 ₽ асинхр)
Опенсорс — альтернативы с хорошим качеством

3. Пакетный режим для больших объемов

Обрабатывайте данные батчами
Минимум 200K токенов на запуск
Дешевле синхронного режима

4. Кэшируйте результаты

Сохраняйте частые ответы
Используйте векторный поиск для похожих запросов
Снижайте повторные обращения к API

5. Оптимизируйте промпты

Короткие промпты = меньше токенов
Используйте токенизатор для подсчета (бесплатно)
Убирайте лишний контекст

Нужна помощь с выбором модели и оптимизацией расходов? Свяжитесь со мной для консультации!