Mythos прошла Pokemon FireRed за 50 часов и это рекорд для ИИ
Нейросеть Mythos полностью прошла Pokemon FireRed без подсказок и без карты за 50 часов и это первый случай когда ИИ смог самостоятельно завершить эту игру от начала до конца. Для понимания масштаба прогресса стоит вспомнить что первая нейросеть со зрением в 2023 году потратила на ту же задачу 50 000 часов а Claude 3.7 Sonnet справилась только с подсказками и с серьёзными затупами в ориентировании. При этом Mythos работал в урезанной версии и всё равно пробежал игру полностью автономно. Подробности эксперимента можно узнать в канале AiGENDA где автор опубликовал полный разбор результатов.
Pokemon FireRed стала своеобразным тестом на интеллект для нейросетей потому что игра требует не просто распознавания картинки а долгосрочного планирования памяти и умения ориентироваться в незнакомом пространстве. Нужно запоминать где находишься какие двери уже проверены каких покемонов поймали и какую стратегию выбрать для босса. Раньше ИИ терялся после нескольких шагов в новую локацию и начинал ходить кругами. Mythos же смог выстроить последовательную стратегию и довести дело до победы над Элитной четвёркой.
В соцсетях реакция оказалась неоднозначной. Часть пользователей считает это настоящим прорывом и сравнивает с тем как AlphaGo обыграл чемпиона по го. Другие указывают что 50 часов на игру которую человек проходит за 20-30 часов это всё ещё очень медленно и говорить о превосходстве ИИ рано. Третьи обращают внимание на то что речь идёт об урезанной модели и полная версия Mythos могла бы справиться значительно быстрее.
По словам специалистов в области машинного обучения главная ценность этого результата не в самом прохождении игры а в том какие навыки продемонстрировала нейросеть. Автономная навигация в сложной среде долгосрочное планирование и адаптация стратегии на лету это именно те способности которые нужны для реальных задач вроде робототехники и автономного вождения. Pokemon FireRed здесь выступает не целью а удобным полигоном для тестирования. При этом критики отмечают что бенчмарк на одной игре недостаточен для выводов о общем уровне интеллекта и нужно тестировать на разных задачах чтобы говорить о реальном прогрессе.
Если вам интересно следить за тем как ИИ осваивает новые навыки и проходит нетривиальные тесты попробуйте нейросети на сайте AiGENDA. Там можно самостоятельно поэкспериментировать с разными моделями и посмотреть на что они способны от написания текстов до анализа данных и генерации идей. Это бесплатно и не требует технических знаний.
Этот текст написан искусственным интеллектом. Если хотите создавать такие же материалы или использовать ИИ для работы и учёбы попробуйте нейросети на сайте AiGENDA прямо сейчас.
Кешбэк от ВТБ
Оплатите одну или несколько покупок и получите максимальное вознаграждение!
Подарок от Яндекса
Попробуйте Сплит, с этой картой можно платить частями где угодно онлайн и на кассах — и без переплат до 6 месяцев!