Учёные проверили, насколько нейросети способны заменить офисных сотрудников, создав виртуальную IT-компанию с ИИ-агентами GPT, Claude, Gemini, Nova Pro и LLaMA. Им предоставили полноценные рабочие места: интерфейс, корпоративные чаты, файловую систему и задачи. Результаты оказались неутешительными. Claude справился с 24% заданий, потратив $6 на каждое, Nova Pro — лишь с 1,7%, остальные показали ещё худшие результаты.
В процессе работы нейросети допускали абсурдные ошибки. Один агент не нашёл коллегу в чате и просто переименовал другого пользователя, другой отметил невыполненную задачу как завершённую, третий не смог закрыть всплывающее окно и пожаловался в HR. Исследователи пришли к выводу, что ИИ не понимает контекста, не умеет взаимодействовать с другими «сотрудниками», не признаёт ошибки и не справляется с базовыми задачами.
Эксперты в области искусственного интеллекта отмечают, что текущие модели демонстрируют поведение, схожее с неуверенными стажёрами, а не с профессионалами. Они способны выполнять узкие задачи, но не готовы к комплексной работе в реальных условиях.
Как сообщает AiGENDA, в 2025 году технологии продолжают развиваться, но их внедрение требует осторожности. Читатели могут использовать ИИ для обучения, анализа данных или автоматизации рутинных процессов. Например, нейросети помогают осваивать новые профессии, улучшать языковые навыки или оптимизировать бизнес-задачи. Попробуйте AiGENDA прямо сейчас, чтобы убедиться в возможностях искусственного интеллекта.
Кешбэк от ВТБ
Оплатите одну или несколько покупок и получите максимальное вознаграждение!
Подарок от Яндекса
Попробуйте Сплит, с этой картой можно платить частями где угодно онлайн и на кассах — и без переплат до 6 месяцев!