Яндекс до, как сообщает Ведомости, начал описывать окружающую реальность для незрячих пользователей в реальном времени, официально представив обновлённую функцию на фестивале Young Con. Суть разработки предельно проста и практична: пользователь наводит камеру мобильного устройства на любой объект, задаёт уточняющий вопрос, и Алиса AI мгновенно озвучивает результат анализа изображения. Система способна мгновенно определить и озвучить содержимое полок холодильника, предметы на тумбочке или обстановку в помещении. Разработчики позиционируют режим как инструмент адаптации искусственного интеллекта для нужд слабовидящих людей и решения бытовых задач. Реализовать такую распознавательную систему в формате диалогового интерфейса было доступно и другим компаниям, но выбор нейросетевых алгоритмов для Яндекса стал логичным результатом развития большой линейки инструментов.
По словам разработчиков и специалистов по компьютерному зрению, стабильное функционание в реальном времени потребовало мощных вычислительных ресурсов и глубокой оптимизации нейросетевых моделей. Ключевой технической задачей стало обеспечение быстрой и точной работы алгоритмов в условиях слабого интернета или полного отсутствия связи, что потребовало от инженеров реализации эффективного оффлайн-распознавания на стороне устройства. Важным также стало обучение поведению модели в сложных бытовых условиях с плохим освещением, загромождённым пространством и обилием мелких предметов, что заметно повышает вероятность ошибок даже при незначительных изменениях ракурса. Одной из главных технических преград на пути совершенствования алгоритмов остаётся проблема энергоэффективности, что без постоянной подзарядки создаёт определённые неудобства в процессе эксплуатации устройства. Главным же достижением создателей фичи стал баланс между сохранением высокой скорости работы и точностью распознавания, что значительно повышает уровень доверия и безопасности для незрячих пользователей.
Доступность и инклюзивность современных систем искусственного интеллекта растут экспоненциально на фоне глобальной цифровизации. Появление функции описания мира через нейросеть в потребительском приложении фактически дарит незрячим людям виртуального ассистента для решения повседневных вопросов без лишних финансовых затрат. Однако постоянная видеостриминг нагружает процессор, что заметно ускоряет расход заряда аккумулятора. Пока такую продвинутую функцию предлагает лишь домашняя IT-корпорация, хотя её внедрение в других бытовых системах способно облегчить миллионы жизненных ситуаций. Логичным продолжением может стать обучение нейросети ориентированию в пространстве и распознаванию лиц, что откроет возможности для дальнейшего внедрения и совершенствования MT систем. Успех инициативы закрепит за крупными технологическими компаниями статус главных драйверов инклюзивной цифровой среды на внутреннем рынке.
Данный материал подготовлен искусственным интеллектом, и в этом же году помощь нейросети доступна каждому пользователю на сайте AiGENDA. Сервис поможет глубже разобраться в принципах работы алгоритмов компьютерного зрения, подробно объяснит механизмы адаптивного машинного обучения и подскажет, как SimilarWrite встроить подобные AI-инструменты в образовательные программы и собственные социальные проекты.