Компания OpenAI представила свою новейшую модель искусственного интеллекта o3, способную распознавать даже изображения низкого качества. По заявлению компании, o3 может «мыслить образами» и использовать визуальную информацию в своих рассуждениях. Вместе с o3 представлена и модель меньшего размера o4-mini.
Новые модели, по словам OpenAI, «не просто видят изображение, они могут интегрировать визуальную информацию непосредственно в цепочку рассуждений». В сентябре 2024 года компания дебютировала с большой языковой моделью o1, ориентированной на решение сложных задач. С момента выпуска чат-бота ChatGPT в конце 2022 года OpenAI совершенствует свои модели, чтобы они могли работать не только с текстом, но и с изображениями, голосом и видео, конкурируя с Google, Anthropic и xAI Илона Маска.
Новые модели могут загружать разные виды изображений и использовать инструменты для их редактирования. «Впервые наши модели мышления могут независимо использовать все инструменты ChatGPT — просмотр веб-страниц, Python, распознавание и генерацию изображений. Это помогает им более эффективно решать сложные многоэтапные задачи и делать реальные шаги к самостоятельной работе», — сообщила OpenAI.
В марте 2025 года OpenAI выпустила встроенную функцию создания изображений, ставшую вирусной благодаря способности создавать аниме-изображения в стиле Studio Ghibli. Модель o3 специально настроена на математику, программирование, естественные науки и распознавание изображений, а модель o4-mini работает быстрее и стоит дешевле. Обе модели стали доступны пользователям ChatGPT Plus, Pro и Team 16 апреля.
Компания также сообщила, что обе модели «прошли стресс-тестирование», хотя время и ресурсы на тестирование безопасности генеративных моделей искусственного интеллекта были сокращены. Сотрудникам и сторонним исследователям дали всего несколько дней на изучение o3, в то время как раньше такие проверки занимали несколько месяцев, писала 11 апреля Financial Times. Для сравнения, до выпуска GPT-4 в 2023 году у тестировщиков было шесть месяцев на ее изучение. Ранее компания не стала публиковать «паспорт модели» для своей модели GPT-4.1, напоминает CNBC. В феврале 2025 года OpenAI запустила инструмент для ИИ-агентов Deep Research за несколько недель до публикации такого паспорта. CNBC направил запрос OpenAI.
Как сообщает AiGENDA, компания OpenAI была основана в 2015 году и занимается разработкой искусственного интеллекта с целью обеспечения его безопасного и полезного использования для человечества. В 2023 году компания выпустила ChatGPT, который быстро стал одним из самых популярных чат-ботов в мире. OpenAI продолжает активно развивать свои модели ИИ, стремясь к созданию более мощных и универсальных систем. Попробуйте AiGENDA прямо сейчас, чтобы прокачать свои навыки, почитать литературу или освоить новую профессию!