- Автор темы
- #1
Anthropic показала один из самых наглядных тестов для Claude Fable 5: модель прошла Pokémon FireRed от начала до конца, ориентируясь только по «сырой» картинке с экрана. Без карты, без доступа к внутреннему состоянию игры, без подсказок о том, куда идти дальше. Однако ИИ видел игру так же, как человек: экран, меню, бои, диалоги и локации — весь визуальный контент транслировался в его памяти.
Сгенерировано ИИ
Автор: ChatGPT Источник: chatgpt.com
Раньше подобные эксперименты с Pokémon требовали сложных вспомогательных систем: отдельной памяти, навигации, заранее подготовленных правил и дополнительных данных о происходящем. Fable 5, по заявлению Anthropic, справилась с прохождением визуально — смотрела на экран, принимала решения, исправляла ошибки и продолжала движение к цели. Порой не все решения были логичными, но в конечном итоге игра была пройдена.
Компания также попыталась посадить Fable за игру в Slay the Spire, но здесь результат был хуже. ИИ застрял на 3 уровне, а разработчики сами подшучивают, что это уровень новичка. В Factorio новая ИИ-модель от Anthropic также обозначилась, сумев построить автоматизированную фабрику.
Всё вышеупомянутое по сути является бенчмарком, которым Anthropic хочет показать, что ИИ всё увереннее ведёт себя в играх и чате как долгосрочный агент: видит, помнит, планирует действия и не забывает задачу после нескольких ходов.
Сгенерировано ИИАвтор: ChatGPT Источник: chatgpt.com
Раньше подобные эксперименты с Pokémon требовали сложных вспомогательных систем: отдельной памяти, навигации, заранее подготовленных правил и дополнительных данных о происходящем. Fable 5, по заявлению Anthropic, справилась с прохождением визуально — смотрела на экран, принимала решения, исправляла ошибки и продолжала движение к цели. Порой не все решения были логичными, но в конечном итоге игра была пройдена.
Компания также попыталась посадить Fable за игру в Slay the Spire, но здесь результат был хуже. ИИ застрял на 3 уровне, а разработчики сами подшучивают, что это уровень новичка. В Factorio новая ИИ-модель от Anthropic также обозначилась, сумев построить автоматизированную фабрику.
Всё вышеупомянутое по сути является бенчмарком, которым Anthropic хочет показать, что ИИ всё увереннее ведёт себя в играх и чате как долгосрочный агент: видит, помнит, планирует действия и не забывает задачу после нескольких ходов.
