Американский предприниматель Илон Маск объявил о выходе версии Grok 4.20, которая, по его прогнозам, займет первое место в бенчмарке SimpleBench до конца августа. Маск сделал это заявление в комментарии на платформе X, реагируя на сообщение пользователя, заметившего высокие позиции Grok 4.
Grok 4.20 надеюсь в этом месяце достигнет #1 https://t.co/I4xbm17DF2
— Elon Musk (@elonmusk) August 9, 2025
Согласно этому сообщению, в SimpleBench модель Grok 4 уже обходит новую GPT-5 и уступает лишь Gemini 2.5 Pro. Пользователь XFreeze также подчеркнул, что компания xAI достигает этих результатов, имея менее 30% персонала по сравнению с OpenAI и Google.
[see_also ids="648938"]
Кроме SimpleBench, Grok 4 демонстрирует лучшие результаты за GPT-5 в бенчмарках ARC-AGI - 68% против 65%, и ARC-AGI-2 - 16% против 9,9%. Также Grok 4 Heavy немного опережает GPT-5 Pro в Humanity's Last Exam - 44,4% против 42%. Маск отметил, что xAI постоянно обновляет Grok 4 Heavy, улучшая его производительность.
Пока непонятно, что именно имеет в виду Маск под версией Grok 4.20. Согласно планам xAI на 2025 год, кроме Grok 4.20 ожидается выпуск Grok 4 Coder, оптимизированного для программирования, Grok 4 V2 с улучшенными мультимодальными возможностями и Baby Grok - ИИ для детей. Также запланирован выход новых улучшенных версий для генерации изображений и видео.
А выход Grok 5 запланирован уже к концу 2025 года. В комментариях на X пользователи и эксперты поражены скоростью обновлений и развитием Grok.
Хотя Grok 4 обходит GPT-5 в некоторых бенчмарках, известно, что искусственный интеллект от OpenAI - модель o3, одержал победу над Grok 4 в финале шахматного турнира. Несмотря на то, что Grok 4 считался победителем во время предыдущих этапов, он допустил серию грубых ошибок, что позволило модели-конкуренту одержать уверенную победу.