Чат-бот Grok, створений компанією xAI Ілона Маска, очолив рейтинг надійності штучного інтелекту за результатами дослідження, проведеного у грудні 2025 року. Водночас ChatGPT та Google Gemini опинилися серед аутсайдерів.
Оцінювання здійснила аналітична компанія Relum, яка проаналізувала десять провідних ШІ-чат-ботів з точки зору їхньої придатності для бізнес-застосування. Кожній моделі присвоювали індекс ризику надійності за шкалою від 0 до 99, де вищий показник означав більшу кількість проблем, зокрема помилкових або вигаданих відповідей.
Згідно з результатами, Grok продемонстрував найнижчий рівень галюцинацій — близько 8%. Для порівняння, у ChatGPT цей показник становив 35%, у Gemini — майже 40%, а у Microsoft Copilot — 27%.
Близькі до лідера результати показала китайська модель DeepSeek з рівнем галюцинацій 14%. Також відносно стабільні показники зафіксували у Perplexity (13%) та Claude (17%).
Аналітики Relum наголошують, що мінімізація галюцинацій є ключовою умовою для корпоративного використання ШІ. За їхніми даними, щонайменше 65% компаній у США вже інтегрували чат-боти у свої бізнес-процеси.
Очікується, що залежність від інструментів штучного інтелекту надалі зростатиме, а тому бізнесу доведеться дедалі уважніше обирати моделі з урахуванням їхньої точності, стабільності та відповідності конкретним задачам.
Раніше повідомлялося, що ChatGPT контролює понад 80% світового ринку чат-ботів, а в Україні його частка сягає 92%. Найближчими конкурентами залишаються Perplexity та Microsoft Copilot, на які разом припадає близько 15% користувачів.





