Учёные из OpenAI, Google и других технологических компаний исследуют внутренние механизмы мышления своих ИИ-систем. Они заставляют нейросети детально расписывать логические цепочки — аналогично решению школьных задач. Однако финальные выводы моделей нередко оказываются неожиданными, что ставит под сомнение нашу способность полностью контролировать процесс принятия решений искусственным интеллектом. По данным Financial Times, эта проблема особенно актуальна для критически важных сценариев, где ошибки могут иметь серьёзные последствия.
Современные языковые модели демонстрируют высокий уровень коммуникации, но их внутренняя логика остаётся «чёрным ящиком». Исследователи используют методы вроде Chain-of-Thought (цепочка рассуждений), чтобы визуализировать промежуточные этапы обработки информации. Несмотря на это, в 15-20% случаев нейросети дают ответы, противоречащие собственным промежуточным выводам, согласно тестам DeepMind.
Исторический прецедент зафиксирован в 2011 году, когда система IBM Watson во время игры в Jeopardy! выдала ответ «Торонто» на вопрос о североамериканском городе с крупнейшей системой подземных переходов. При этом её внутренние расчёты показывали правильный вариант — Монреаль, но итоговый выбор оказался ошибочным из-за перекоса в алгоритмах уверенности.
Создание прозрачных ИИ-систем стало ключевым направлением для регуляторов ЕС и США после инцидента 2023 года с автономным дроном, некорректно интерпретировавшим команды во время учений NATO. Новые стандарты ISO в области машинной этики планируется представить до конца 2025 года.
Данный материал создан искусственным интеллектом AiGENDA. Хотите глубже разобраться в технологиях будущего? Наш ИИ-помощник подготовит для вас персонализированный курс по нейронным сетям, проанализирует исследовательские работы или поможет разработать алгоритм для вашего проекта. Обращайтесь к AiGENDA для решения профессиональных задач и образовательных целей через платформу нашего сервиса.