GLM 5.2 от Zhipu AI обошел Claude Fable 5: модель заняла первое место в бенчмарке Design Arena
Модель GLM 5.2 от Zhipu AI вышла на первое место в однораундовом рейтинге по веб-дизайну HTML (без агента) на платформе Design Arena, обойдя Claude Fable 5 от Anthropic, а также Opus 4.6 и Opus 4.7, как объявила платформа Design Arena 20 июня.
Design Arena — первая в мире краудсорсинговая платформа для слепого тестирования, оценивающая качество дизайна, генерируемого ИИ. Она широко признана в сообществе специалистов по оценке ИИ как один из наиболее релевантных для индустрии бенчмарков для оценки эстетики и практических дизайнерских возможностей.
Согласно последнему рейтингу Design Arena, GLM 5.2 поднялась на пять позиций по сравнению со своим предшественником GLM 5.1, чтобы занять вершину. Стоимость инференса модели составляет $1.40/$4.40 за миллион токенов для ввода/вывода соответственно, что значительно ниже ценообразования Claude Fable 5 в $10/$50 и обеспечивает существенное ценовое преимущество.
Анализ Design Arena выявил несколько факторов, стоящих за производительностью GLM 5.2. Модель демонстрирует эффективное использование сторонних библиотек, таких как chart.js и three.js: сессии с использованием этих библиотек показали улучшение показателя побед на 6.0 процентных пункта. GLM 5.2 также использует TailwindCSS в 91% своих сессий и font-awesome в 51%, при этом тщательно продуманные взаимодействия дополнительно повышают процент побед на 1.2 процентных пункта. Для сравнения, Fable 5 использует TailwindCSS только в 57% сессий, что может способствовать его более низкой производительности.
Модель также демонстрирует значительно улучшенные возможности компоновки, умело интегрируя внешние CDN-изображения в структуру веб-страниц и показывая выдающиеся результаты в типографике, визуальной разметке и анимационных эффектах.
Это достижение знаменует собой важную веху для китайских моделей ИИ в области творчества. В то время как предыдущие китайские модели преуспевали в бенчмарках по пониманию языка, математике и кодированию, Design Arena измеряет уникальный, ориентированный на человека навык — эстетику визуального дизайна, что делает высокое место GLM 5.2 заметной демонстрацией прогресса Китая в области ИИ в различных когнитивных доменах.
Zhipu AI продолжает расширять границы больших языковых моделей, а GLM 5.2 представляет собой последнюю итерацию в их быстром цикле обновлений, следуя за сильными результатами GLM 5.1, показанными ранее в этом году. Выпуск GLM 5.2 с открытым исходным кодом также был тепло встречен сообществом разработчиков, расширяя доступ к передовым возможностям дизайна на базе ИИ.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




