Компанія Google представила нову модель штучного інтелекту — Gemini 3.1 Flash-Lite, яка стала найдоступнішою за ціною у лінійці Gemini 3. Модель орієнтована на високу швидкість роботи та економічність, що робить її привабливою для масштабних завдань розробників.
Вартість і позиціонування
Вартість використання моделі становить $0,25 за 1 мільйон вхідних токенів та $1,50 за 1 мільйон вихідних токенів. За словами Google, Flash-Lite створена для високочастотних робочих процесів із мінімальною затримкою відповіді.
Модель розрахована насамперед на автоматизовані системи, де важливі швидкість, масштабованість і низька вартість обробки великих обсягів запитів.
Продуктивність
За даними бенчмарку Artificial Analysis, Gemini 3.1 Flash-Lite демонструє суттєві покращення у швидкості роботи. Зокрема:
- показник Time to First Answer Token приблизно у 2,5 раза швидший, ніж у моделі 2.5 Flash;
- швидкість генерації відповідей зросла приблизно на 45% при збереженні подібної або кращої якості результатів.

Результати тестів
У рейтингу Arena.ai Leaderboard нова модель отримала Elo 1432.
Також вона продемонструвала високі результати у низці тестів:
- 86,9% у GPQA Diamond
- 76,8% у MMMU Pro
За цими показниками Flash-Lite випереджає низку моделей аналогічного класу та навіть деякі більші моделі попередніх поколінь.
Для яких задач створена модель
Google позиціонує Flash-Lite як оптимальне рішення для великомасштабних автоматизованих процесів, зокрема:
- масового перекладу текстів;
- модерації контенту;
- класифікації даних;
- аналізу великих кодових баз;
- мультимодальних задач, що потребують швидкої обробки великих обсягів інформації.
Доступність
Модель уже доступна у режимі preview через Gemini API у сервісі Google AI Studio, а також для корпоративних клієнтів через платформу Vertex AI.
Таким чином Google продовжує розширювати лінійку Gemini, роблячи ставку на швидкі та економічні моделі, які можна використовувати у великомасштабних сервісах і автоматизованих системах.





