EN

GPT-5-high обошла конкурентов, но GPT-5-chat уступила GPT-4o

Сайт Lmarena опубликовал обновленный рейтинг языковых моделей, где отдельно оценены версии GPT-5.

Как передает Vesti.az со ссылкой на зарубежные СМИ, новая модель неожиданно уступила своей предшественнице.

Рейтинг формируется на основе пользовательских выборов: участникам предлагаются два анонимных ответа на один и тот же вопрос, после чего они голосуют за лучший.

Лидером остается GPT-5-high — версия с расширенными возможностями рассуждений, которая опережает Gemini 2.5 Pro от Google. В то же время GPT-5-medium, доступная подписчикам ChatGPT Plus, в таблице не выделена отдельно, хотя тесты показывают лишь минимальное отставание.

Наибольшие споры вызвала GPT-5-chat, созданная для быстрых ответов и диалогов. Она уступила GPT-4o в многоэтапных беседах, программировании, создании длинных текстов и обработке сложных запросов, но при этом показала лучшие результаты в математике и следовании инструкциям. Отмечается и ее слабое место — русский язык: 1418 баллов против 1441 у GPT-4o.

Таким образом, несмотря на лидерство в ряде направлений, GPT-5 не смогла закрепить общий перевес над конкурентами, а ее разные версии показали неоднозначные результаты.

Chosen
5
2
vesti.az

2Sources