Тарифы Yandex AI Studio
Yandex AI Studio использует модель pay-as-you-go — платите только за фактическое использование ресурсов. Все цены указаны с учетом НДС.
Единицы тарификации
Заголовок раздела «Единицы тарификации»Yandex AI Studio использует юниты для детализации потребления в Yandex Cloud Billing.
| Услуга | Стоимость юнита |
|---|---|
| 1000 юнитов (генерация текста) | 0,20 ₽ |
| 1000 юнитов (векторизация) | 0,01 ₽ |
| 1 юнит (выделенный инстанс) | 1,00 ₽ |
Model Gallery
Заголовок раздела «Model Gallery»YandexGPT — модели Яндекса
Заголовок раздела «YandexGPT — модели Яндекса»YandexGPT Lite
Заголовок раздела «YandexGPT Lite»Быстрая модель для массовых задач
| Режим | Цена за 1000 токенов |
|---|---|
| Синхронный | 0,20 ₽ |
| Асинхронный | 0,10 ₽ |
Применение:
- Чат-боты для сайтов
- Массовая обработка запросов
- Простая генерация контента
Экономия: Асинхронный режим дешевле на 50%
YandexGPT Pro 5.0 и младше
Заголовок раздела «YandexGPT Pro 5.0 и младше»Продвинутая модель для сложных задач
| Режим | Цена за 1000 токенов |
|---|---|
| Синхронный | 1,20 ₽ |
| Асинхронный | 0,60 ₽ |
Применение:
- Анализ документов
- Бизнес-аналитика
- Сложная генерация контента
YandexGPT Pro 5.1
Заголовок раздела «YandexGPT Pro 5.1»Новейшая версия со скидкой 50%
| Режим | Цена за 1000 токенов | С учетом скидки |
|---|---|---|
| Синхронный | 0,80 ₽ | 0,40 ₽ ✨ |
| Асинхронный | 0,40 ₽ | 0,20 ₽ ✨ |
Опенсорс-модели
Заголовок раздела «Опенсорс-модели»Qwen (Alibaba Cloud)
Заголовок раздела «Qwen (Alibaba Cloud)»| Модель | Режим | Цена за 1000 токенов | Скидка |
|---|---|---|---|
| Qwen3 235B | Синхронный | 1,00 ₽ | 0,50 ₽ (-50%) |
| Qwen 2.5 72B Instruct | Пакетный | 0,60 ₽ | — |
| Qwen 2.5 32B Instruct | Пакетный | 0,40 ₽ | — |
| Qwen 2.5 7B Instruct | Пакетный | 0,10 ₽ | — |
Особенности Qwen3 235B:
- Самая мощная опенсорс-модель в галерее
- 235 млрд параметров
- Конкурирует с GPT-4
Gemma (Google)
Заголовок раздела «Gemma (Google)»| Модель | Режим | Цена за 1000 токенов | Скидка |
|---|---|---|---|
| Gemma3 27B | Синхронный | 0,80 ₽ | 0,40 ₽ (-50%) |
| Gemma3 12B it | Пакетный | 0,20 ₽ | — |
| Gemma3 4B it | Пакетный | 0,10 ₽ | — |
| Gemma3 1B it | Пакетный | 0,10 ₽ | — |
Преимущества:
- Разработка Google
- Хорошее качество при низкой стоимости
- Несколько размеров под разные задачи
DeepSeek
Заголовок раздела «DeepSeek»| Модель | Режим | Цена за 1000 токенов |
|---|---|---|
| DeepSeek-R1-Distill-Llama-70B | Пакетный | 0,60 ₽ |
| DeepSeek-R1-Distill-Qwen-32B | Пакетный | 0,40 ₽ |
| DeepSeek 2 VL | Пакетный | 0,40 ₽ |
| DeepSeek 2 VL Tiny | Пакетный | 0,10 ₽ |
Vision models (VL):
- Мультимодальные модели
- Анализ изображений + текст
- Подходят для документов с визуальным контентом
Llama (Meta)
Заголовок раздела «Llama (Meta)»| Модель | Режим | Цена за 1000 токенов |
|---|---|---|
| Llama-3.3-70B-Instruct | Пакетный | 0,60 ₽ |
| Llama-3.1-70B-Instruct | Пакетный | 0,60 ₽ |
Особенности:
- Популярная опенсорс-модель
- Сильное сообщество
- Хорошая производительность
Другие модели
Заголовок раздела «Другие модели»| Модель | Режим | Цена за 1000 токенов |
|---|---|---|
| gpt-oss-120b | Синхронный | 0,30 ₽ |
| gpt-oss-20b | Синхронный | 0,10 ₽ |
| phi-4 | Пакетный | 0,20 ₽ |
| QwQ 32B Instruct | Пакетный | 0,40 ₽ |
Пакетный режим
Заголовок раздела «Пакетный режим»Когда использовать:
- Обработка больших датасетов
- Ночная аналитика
- ETL-процессы
- Массовая генерация
Преимущества:
- Ниже стоимость за токен
- Оптимизировано для больших объемов
- Нет ограничения на время выполнения
Выделенные инстансы
Заголовок раздела «Выделенные инстансы»Dedicated ресурсы для предсказуемой производительности
Цена указана за 1 час использования. Тарификация посекундная.
| Модель | S (1x GPU) | M (2x GPU) | L (3x GPU) |
|---|---|---|---|
| Qwen 2.5 72B Instruct | 804 ₽/час | 1 608 ₽/час | 2 412 ₽/час |
| Qwen 2.5 VL 32B Instruct | 804 ₽/час | 1 608 ₽/час | 2 412 ₽/час |
| gpt-oss-120b | 804 ₽/час | 1 608 ₽/час | 2 412 ₽/час |
| Gemma 3 12B it | 402 ₽/час | 804 ₽/час | 1 206 ₽/час |
| Gemma 3 4B it | 402 ₽/час | 804 ₽/час | 1 206 ₽/час |
| gpt-oss-20b | 402 ₽/час | 804 ₽/час | 1 206 ₽/час |
| T-pro-it-2.0-FP8 | 744 ₽/час | 1 488 ₽/час | 2 232 ₽/час |
Применение:
- Высоконагруженные продакшн-системы
- Требования к SLA
- Предсказуемая латентность
- Отсутствие noisy neighbors
Расчет стоимости:
- Конфигурация M для Qwen 2.5 72B: 1 608 ₽/час
- При работе 24/7 в месяц: 1 608 × 24 × 30 = 1 157 760 ₽
Дообучение (Fine-tuning)
Заголовок раздела «Дообучение (Fine-tuning)»Что можно дообучить:
- YandexGPT Lite
- Дообученная модель тарифицируется как базовая YandexGPT Lite (0,20 ₽ за 1000 токенов)
Применение:
- Адаптация под доменную специфику
- Обучение на корпоративных данных
- Улучшение качества для конкретных задач
Токенизация
Заголовок раздела «Токенизация»Использование токенизатора не тарифицируется
TokenizerService— бесплатно- Методы
Tokenizer— бесплатно
Применение:
- Подсчет токенов перед запросом
- Оптимизация промптов
- Оценка стоимости операций
Векторизация текста (Embeddings)
Заголовок раздела «Векторизация текста (Embeddings)»Стоимость:
| Услуга | Цена за 1000 токенов |
|---|---|
| Получение эмбеддингов | 0,01 ₽ |
Применение:
- RAG-системы
- Семантический поиск
- Классификация документов
- Поиск похожих текстов
Расчет:
- Векторизация 1 млн токенов: 10 ₽
- Средний документ 500 токенов: 2000 документов за 10 ₽
Классификация текста
Заголовок раздела «Классификация текста»Единицы тарификации
Заголовок раздела «Единицы тарификации»| Модель | Единица тарификации | Цена |
|---|---|---|
| YandexGPT Lite | 1 запрос (до 1000 токенов) | 0,15 ₽ |
| YandexGPT Pro | 1 запрос (до 250 токенов) | 0,15 ₽ |
| Дообученный классификатор | 1 запрос (до 250 токенов) | 0,15 ₽ |
Правила округления
Заголовок раздела «Правила округления»YandexGPT Lite:
- Текст 770 токенов = 1 запрос (0,15 ₽)
- Текст 1500 токенов = 2 запроса (0,30 ₽)
YandexGPT Pro / Дообученный:
- Текст 770 токенов = 4 запроса (0,60 ₽)
- Округление всегда в большую сторону
Применение:
- Категоризация обращений
- Фильтрация контента
- Определение sentiment
- Маршрутизация запросов
Генерация изображений (YandexART)
Заголовок раздела «Генерация изображений (YandexART)»Стоимость:
| Услуга | Цена |
|---|---|
| 1 запрос на генерацию изображения | 2,20 ₽ |
Особенности:
- Один запрос = одно изображение
- Максимальная длина промта: 500 символов
- Результат генерации уникален каждый раз
Расчет:
- 100 изображений: 220 ₽
- 1000 изображений: 2 200 ₽
Agent Atelier
Заголовок раздела «Agent Atelier»Ассистенты и текстовые агенты
Заголовок раздела «Ассистенты и текстовые агенты»Использование AI Assistant API и Responses API:
- Хранение файлов — бесплатно
- Хранение поисковых индексов — бесплатно
- API вызовы — бесплатно
- Оплачиваются только токены по тарифам Model Gallery
Голосовые агенты (Realtime API)
Заголовок раздела «Голосовые агенты (Realtime API)»Модель: speech-realtime-250923
| Услуга | Цена за единицу | Скидка до 01.11.2025 |
|---|---|---|
| Входящее аудио (распознавание) | 0,052 ₽/сек | 0,026 ₽/сек (-50%) |
| Исходящее аудио (синтез) | 0,04 ₽/сек | 0,02 ₽/сек (-50%) |
| Генерация текста | 1,60 ₽/1000 токенов | 0,80 ₽/1000 токенов (-50%) |
Расчет стоимости звонка:
Пример: 5-минутный разговор
- Входящее аудио: 300 сек × 0,026 ₽ = 7,80 ₽
- Исходящее аудио: 300 сек × 0,02 ₽ = 6,00 ₽
- Генерация текста: 2000 токенов × 0,80 ₽ / 1000 = 1,60 ₽
- Итого: 15,40 ₽ за звонок
Инструменты в агентах
Заголовок раздела «Инструменты в агентах»| Инструмент | Стоимость | Примечание |
|---|---|---|
| Вызов инструментов AI Assistant API | Бесплатно | — |
| File Search (поиск по файлам) | Бесплатно | — |
| Web Search (поиск в интернете) | Бесплатно до 17.11.2025 | Далее: 900 ₽ за 1000 запросов |
MCP Hub
Заголовок раздела «MCP Hub»Что оплачивается:
- Использование инструментов в MCP-серверах (например, Yandex Cloud Functions)
- Внешние API (оплата партнерам напрямую): Контур.Фокус, amoCRM и др.
Что бесплатно:
- Создание MCP-серверов
- Подключение серверов к агентам
- Хранение конфигураций
Внутренние ошибки
Заголовок раздела «Внутренние ошибки»Что покрывается:
- Ошибки на стороне Yandex Cloud
- Недоступность сервиса
- Технические сбои
Что не покрывается:
- Ошибки в промптах (4xx)
- Превышение квот
- Некорректные запросы
Сравнение стоимости
Заголовок раздела «Сравнение стоимости»Генерация текста (за 1000 токенов)
Заголовок раздела «Генерация текста (за 1000 токенов)»| Модель | Yandex AI Studio | GigaChat | OpenAI GPT-4 |
|---|---|---|---|
| Lite/Базовая | 0,20 ₽ (синхр) / 0,10 ₽ (асинхр) | 0,20 ₽ | ~2,50 $ |
| Pro/Продвинутая | 0,40 ₽ (Pro 5.1) | 1,50 ₽ | ~10 $ |
| Max/Топ | — | 1,95 ₽ | ~30 $ |
Векторизация (за 1000 токенов)
Заголовок раздела «Векторизация (за 1000 токенов)»| Сервис | Цена |
|---|---|
| Yandex AI Studio | 0,01 ₽ |
| GigaChat | 0,04 ₽ |
| OpenAI | ~0,10 $ |
Генерация изображений
Заголовок раздела «Генерация изображений»| Сервис | Цена |
|---|---|
| Yandex AI Studio (YandexART) | 2,20 ₽ |
| GigaChat | Уточняйте |
| OpenAI (DALL-E 3) | ~4 $ |
Оптимизация расходов
Заголовок раздела «Оптимизация расходов»1. Используйте асинхронный режим
Заголовок раздела «1. Используйте асинхронный режим»- Экономия: 50% на генерации текста
- Подходит для: фоновых задач, массовой обработки
- Не подходит для: интерактивных приложений
2. Выбирайте подходящую модель
Заголовок раздела «2. Выбирайте подходящую модель»- Lite — для простых задач (0,10 ₽ асинхр)
- Pro 5.1 — лучшее соотношение цена/качество (0,20 ₽ асинхр)
- Опенсорс — альтернативы с хорошим качеством
3. Пакетный режим для больших объемов
Заголовок раздела «3. Пакетный режим для больших объемов»- Обрабатывайте данные батчами
- Минимум 200K токенов на запуск
- Дешевле синхронного режима
4. Кэшируйте результаты
Заголовок раздела «4. Кэшируйте результаты»- Сохраняйте частые ответы
- Используйте векторный поиск для похожих запросов
- Снижайте повторные обращения к API
5. Оптимизируйте промпты
Заголовок раздела «5. Оптимизируйте промпты»- Короткие промпты = меньше токенов
- Используйте токенизатор для подсчета (бесплатно)
- Убирайте лишний контекст
Нужна помощь с выбором модели и оптимизацией расходов? Свяжитесь со мной для консультации!