Обходя Claude и Fable 5: GLM 5.2 от Zhipu AI возглавил рейтинг Design Arena

Glm 5.2 Zhipu Ai Design Arena веб-дизайн бенчмарк Claude Fable 5 pandaily.com

Модель GLM 5.2 от Zhipu AI превзошла Claude Fable 5, заняв первое место в бенчмарке Design Arena по веб-дизайну HTML, благодаря превосходному использованию сторонних библиотек и ценовому преимуществу. — pandaily.com

GLM 5.2 от Zhipu AI обошел Claude Fable 5: модель заняла первое место в бенчмарке Design Arena

Модель GLM 5.2 от Zhipu AI вышла на первое место в однораундовом рейтинге по веб-дизайну HTML (без агента) на платформе Design Arena, обойдя Claude Fable 5 от Anthropic, а также Opus 4.6 и Opus 4.7, как объявила платформа Design Arena 20 июня.

Design Arena — первая в мире краудсорсинговая платформа для слепого тестирования, оценивающая качество дизайна, генерируемого ИИ. Она широко признана в сообществе специалистов по оценке ИИ как один из наиболее релевантных для индустрии бенчмарков для оценки эстетики и практических дизайнерских возможностей.

Согласно последнему рейтингу Design Arena, GLM 5.2 поднялась на пять позиций по сравнению со своим предшественником GLM 5.1, чтобы занять вершину. Стоимость инференса модели составляет $1.40/$4.40 за миллион токенов для ввода/вывода соответственно, что значительно ниже ценообразования Claude Fable 5 в $10/$50 и обеспечивает существенное ценовое преимущество.

Анализ Design Arena выявил несколько факторов, стоящих за производительностью GLM 5.2. Модель демонстрирует эффективное использование сторонних библиотек, таких как chart.js и three.js: сессии с использованием этих библиотек показали улучшение показателя побед на 6.0 процентных пункта. GLM 5.2 также использует TailwindCSS в 91% своих сессий и font-awesome в 51%, при этом тщательно продуманные взаимодействия дополнительно повышают процент побед на 1.2 процентных пункта. Для сравнения, Fable 5 использует TailwindCSS только в 57% сессий, что может способствовать его более низкой производительности.

Модель также демонстрирует значительно улучшенные возможности компоновки, умело интегрируя внешние CDN-изображения в структуру веб-страниц и показывая выдающиеся результаты в типографике, визуальной разметке и анимационных эффектах.

Это достижение знаменует собой важную веху для китайских моделей ИИ в области творчества. В то время как предыдущие китайские модели преуспевали в бенчмарках по пониманию языка, математике и кодированию, Design Arena измеряет уникальный, ориентированный на человека навык — эстетику визуального дизайна, что делает высокое место GLM 5.2 заметной демонстрацией прогресса Китая в области ИИ в различных когнитивных доменах.

Zhipu AI продолжает расширять границы больших языковых моделей, а GLM 5.2 представляет собой последнюю итерацию в их быстром цикле обновлений, следуя за сильными результатами GLM 5.1, показанными ранее в этом году. Выпуск GLM 5.2 с открытым исходным кодом также был тепло встречен сообществом разработчиков, расширяя доступ к передовым возможностям дизайна на базе ИИ.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: