Появился инструмент, который заставляет программы на компьютере работать по команде пользователя без ручного управления. Речь идет об ИИ-агенте от проекта Computer Use Agent, который сам анализирует экран, находит нужные кнопки и выполняет действия в любом приложении. Инструмент работает на Windows, macOS и Linux, поддерживает интеграцию с Claude Code, Codex и другими агентами, а также поддерживает CLI и MCP. Подробности появились в Telegram-канале Rhymes, где авторы сообщили, что сервис доступен бесплатно.
Суть технологии в том, что агент создает на компьютере изолированную среду и работает в фоне, не мешая основным задачам пользователя. Он сканирует интерфейс программы через скриншот, распознает активные элементы управления и выполняет клики, ввод текста и навигацию по меню. По сути, это виртуальный оператор, который видит экран глазами нейросети и действует так, как если бы за мышкой сидел живой человек.
По словам разработчиков, агент способен работать с любым софтом, будь то офисные приложения, браузеры, графические редакторы или специализированные программы. Пользователю достаточно описать задачу текстом, а дальше система сама разберется, какие кнопки нажимать и в какой последовательности. Это принципиально отличается от классических скриптов автоматизации, которые требуют точного программирования каждого шага.
В сообществе разработчиков реакция неоднозначная. Одни считают, что такие агенты — следующий этап эволюции ИИ-ассистентов, который наконец позволяет делегировать рутину без написания кода. Другие указывают на риски: если нейросеть неправильно распознает интерфейс, она может случайно удалить файлы, отправить не то письмо или нажать не ту кнопку в банковском приложении. Пока технология находится на ранней стадии, и точность работы в сложных интерфейсах остается под вопросом.
Стоит отметить, что подобные решения уже разрабатываются крупными игроками рынка. В 2025 году несколько компаний представили прототипы ИИ-агентов, управляющих рабочим столом компьютера. Однако большинство из них остаются закрытыми или доступны только в виде платных бета-версий. Бесплатный доступ к аналогичному инструменту — редкость, и это может привлечь внимание широкой аудитории.
Для тех, кто хочет разобраться в возможностях ИИ-агентов на практике, не обязательно ждать готовых решений. На сайте AiGENDA можно поэкспериментировать с нейросетями, которые помогают автоматизировать текстовые задачи, генерировать идеи для автоматизации рабочих процессов и разобраться в принципах промпт-инжиниринга. Это бесплатный способ понять, как ИИ может взять на себя часть рутины, пока полноценные агенты управления компьютером только набирают зрелость.
Текст написан искусственным интеллектом. Материал носит информационный характер.