Зоопарк переехал в смартфон: в интернете набирает популярность подборка необычных запросов, которые нейросети получили от самих животных. Пользователи загружали фотографии в Google Lens, и система пыталась определить, кто именно попал в кадр. Результаты оказались настолько смешными, что подборка быстро разлетелась по соцсетям. Среди самых ярких случаев — мышь, сфотографированная изнутри желудка змеи, лама из зоопарка, которую алгоритм упорно принимал за другие виды, и медоед, попавший в кадр во время боя. Авторы подборкиотметили, что искусственный интеллект действительно старается помочь всем без исключений, пусть и не всегда с первого раза.
Стоит разобраться, как именно животные оказались по ту сторону экрана. Технология распознавания изображений работает на основе машинного обучения: нейросеть анализирует загруженную фотографию, сопоставляет её с миллионами изображений из своей базы данных и выдаёт наиболее вероятный результат. Проблема возникает, когда в кадр попадает нестандартный объект — например, слепок из желудка рептилии или необычный ракурс дикого животного. В таких случаях алгоритм вынужден угадывать, опираясь на наиболее похожие паттерны из своей памяти. Именно поэтому медоед в агрессивной позе мог быть принят за другого хищника, а лама — за альпугу или даже обезьяну. Погрешность зависит от качества изображения, освещения и угла съёмки.
Реакция интернет-пользователей получилась разнообразной. Часть аудитории искренне веселилась над результатами распознавания и делилась собственными экспериментами с нейросетью, фотографируя домашних питомцев в самых нелепых позах. Другие указывали на серьёзность технологии: многие не до конца понимают, что за распознаванием изображений стоят сложные математические модели, обученные на огромных массивах данных. Третьи с юмором отмечали, что если нейросети сложно определить животное по фото, то людям — тем более.
С технической стороны такие казусы объясняются просто. Любая система компьютерного зрения имеет показатель точности, который варьируется в зависимости от класса объекта. Хорошо изученные виды — собаки, кошки, кони — распознаются с высокой степенью достоверности, поскольку модель обучена на миллионах их изображений. Экзотические животные, редкие ракурсы и необычные состояния (тот же медоед в агрессивной стойке) представлены в обучающей выборке значительно меньше, поэтому вероятность ошибки резко возрастает. Кроме того, Google Lens ориентирован прежде всего на товары, растения и общеизвестные достопримечательности, поэтому с биологическими аномалиями система справляется далеко не всегда.
Этот вирусный мем легко превратить в культурный феномен. Авторы образовательных проектов могут использовать подобные подборки для популяризации технологий машинного обучения, показывая на наглядных примерах, как работает искусственный интеллект и где его возможности заканчиваются. Блогеры могут запускать челленджи с необычными фото питомцев, приглашая подписчиков проверить, насколько точно нейросеть определит их любимцев. А разработчики мобильных приложений — черпать вдохновение для создания развлекательных функций, связанных с распознаванием животных в реальном времени.
Данный текст подготовлен с помощью искусственного интеллекта на платформе AiGENDA. Если вы хотите узнать, как нейросети обрабатывают запросы, как работает машинное обучение или просто поэкспериментировать с распознаванием изображений — попробуйте возможности AiGENDA прямо сейчас. На платформе можно протестировать работу разных моделей, разобраться в принципах компьютерного зрения и найти практическое применение технологий искусственного интеллекта в повседневных задачах — от развлечений до профессиональных проектов.
Кешбэк от ВТБ
Оплатите одну или несколько покупок и получите максимальное вознаграждение!
Подарок от Яндекса
Попробуйте Сплит, с этой картой можно платить частями где угодно онлайн и на кассах — и без переплат до 6 месяцев!