Новости: тестирование
Самая сложная часть «purple teaming» начинается после обнаружения.
Пурпурный тиминг (purple teaming) утратил глубину, превратившись в формальность. Стандартные тесты успокаивают, но не выявляют реальные уязвимости. ИИ не решает проблему. Нужен новый подход, ориентированный на результат и реальную устойчивость. — csoonline.com

ChatGPT начнет показывать рекламу пользователям бесплатной версии и Go в США
OpenAI заявила, что реклама никак не повлияет на ответы ChatGPT. В официальном блоге компания объявила о начале тестирования рекламы в ChatGPT для бесплатных пользователей и подписчиков Go в США. Объявления будут показываться только авторизованным совершеннолетним пользователям. — gsmarena.com

Coinbase тестирует USDF от Flipcash в рамках запуска системы кастомных стейблкоинов
Coinbase начала внутреннее тестирование стейблкоина USDF от Flipcash в рамках своей программы Custom Stablecoins, позволяющей бизнесу выпускать собственные брендированные токены, обеспеченные USDC. Это расширяет возможности корпоративных платежей и управления ликвидностью.

Microsoft тестирует новый веб-интерфейс Xbox Cloud Gaming и ждет отзывов игроков
Пользователи Xbox Cloud Gaming могут опробовать совершенно новый веб-интерфейс: Microsoft обновила дизайн и опции навигации облачного игрового сервиса. Участники могут протестировать изменения и повлиять на финальный продукт.

Google, OpenAI и Anthropic соревнуются в том, чей AI лучше всех играет в Pokémon.
Крупные ИИ-модели, включая Gemini и GPT, теперь проходят тесты на производительность, играя в старые игры Pokémon в прямом эфире на Twitch. Эта задача, требующая логического мышления и оценки рисков, сложнее Pong и помогает оценить стратегические способности ИИ на пути к AGI.

Anthropic приходится постоянно обновлять задания для технических собеседований, чтобы кандидаты не могли списать их с помощью Claude.
С 2024 года команда Anthropic по оптимизации производительности использует домашнее тестирование для соискателей. Однако по мере совершенствования инструментов кодирования на базе ИИ, тест вынужден постоянно усложняться, чтобы противостоять помощи ИИ при выполнении заданий.

Участники BF Labs первыми протестируют новую карту второго сезона Battlefield 6 и классическую локацию из Battlefield 4, которую воссоздают с учетом современных стандартов серии.
Задержка Второго сезона Battlefield 6 даёт шанс игрокам BF Labs протестировать новую карту Contaminated, вертолёт Little Bird и будущие изменения, включая возрождение Golmud Railway из BF4. EA изучает фидбэк для улучшения игры.

Ошибки в конфигурации демо-сред превращаются в облачные бэкдоры в корпоративные сети
Новое исследование Pentera Labs выявило критическую уязвимость: тестовые и демонстрационные среды кибербезопасности, оставленные без должной конфигурации, становятся точками входа для хакеров. Обнаружены случаи эксплуатации таких сред у ведущих компаний, что привело к доступу к облачным данным и секретам.

Самое просматриваемое:
- Bitcoin Depot оштрафован на $18,5 млн – сталкивается…
- Как настроить ComfyUI для генерации изображений ИИ…
- WatchGuard бьёт тревогу: критическая уязвимость…
- Результаты еженедельного опроса: Samsung Galaxy Z…
- США прикрыли платформу для хранения паролей, которой…
- ECARX берет управление бизнесом Flyme OS в свои руки…
- Тим Суини из Epic: «нечестность» и «грубое…
- Мод Last Escape для Resident Evil 3 Remake вернет…
- Критическая уязвимость в n8n позволяет посторонним…
- Новейший датчик присутствия от Aqara определяет,…

