Искусственный интеллект распознает изображения хуже человека
У компьютерного зрения нет тех физиологических особенностей, которые есть у человека, поэтому оно хуже распознает изображения. К такому выводу пришли ученые из ВШЭ и Московского политехнического университета. Результаты исследования опубликованы в сборнике Proceedings of Seventh International Congress on Information and Communication Technology.
Чтобы понять, как машинное восприятие изображений отличается от человеческого, российские ученые загрузили изображения классических визуальных иллюзий в онлайн-сервис распознавания образов IBM Watson Visual Recognition. Большая часть из них представляла собой геометрические силуэты, частично скрытые геометрическими формами цвета заднего плана. Система пыталась определить, что представляет собой поступившее изображение, и указывала степень уверенности в своем ответе.
Оказалось, что искусственный интеллект не способен распознать ни одну воображаемую фигуру. Исключение составил раскрашенный воображаемый треугольник. В силу высокого контраста с фоном он был распознан правильно.
Владимир Винников
«Объекты, похожие на те, что мы использовали в ходе эксперимента, встречаются в реальной жизни, — комментирует автор исследования Владимир Винников, аналитик Научно-учебной лаборатории методов анализа больших данных факультета компьютерных наук ВШЭ. — Например, прицеп трейлера или радиобашня, которые по ночам обозначаются только габаритными огнями, автопилот автомобиля или самолета воспринимает таким же образом, как мы — воображаемые геометрические фигуры».
Человеческий глаз постоянно непроизвольно движется, а светочувствительная поверхность его сетчатки имеет форму полусферы. Чтобы человек увидел иллюзию, изображению достаточно быть векторным — состоять из опорных точек и соединяющих их кривых. Человеческое воображение достроит картинку благодаря физиологической особенности зрения — постоянному движению глаз.
В оптико-электронных системах все устроено иначе. Их светочувствительная матрица имеет плоскую, как правило прямоугольную, форму, а сама система линз далеко не так свободна в движении, как человеческий глаз. Поэтому искусственный интеллект не может достроить воображаемые линии, которые связывают фрагменты геометрической иллюзии. Машинное зрение видит только то, что реально изображено, тогда как человек достраивает в воображении полное изображение по его очертаниям.
Нейросетевые системы распознавания образов сегодня активно распространяются в коммерческом секторе. Однако вопрос, насколько точно машина распознает изображение, до сих остается открытым. От точности его распознавания могут зависеть человеческие жизни. Например, если автопилот автомобиля или самолета не распознает объект с низкой контрастностью относительно фона и не успеет вовремя уклониться от препятствия, может произойти катастрофа.
Ученые полагают, что недостатки машинного распознавания образов можно исправить.
Например, дополнить распознавание растровых изображений, представляющих собой сетку пикселей, имитацией физиологических особенностей движения глаз, которые позволяют глазу видеть двумерные и трехмерные сцены. Альтернативный способ — добавить векторное описание изображений. Оно позволит запрограммировать машину на обход изображения по траекториям, заданным векторами.
«Воображаемые фигуры обязательно стоит использовать в качестве тестов в системах, которые зависят от распознавания фото- и видеопотоков. Например, в автопилотах машин или беспилотных летательных аппаратов. Это поможет избежать рисков, связанных с использованием систем машинного интеллекта в промышленности и транспортных системах», — полагает Владимир Винников.
Вам также может быть интересно:
Эксперты НИУ ВШЭ исследовали, как ведется подготовка специалистов в области ИИ
Институт статистических исследований и экономики знаний НИУ ВШЭ представил доклад, подготовленный на основе результатов специализированного обследования образовательных организаций высшего образования. Целью впервые проведенной работы стало выявление масштабов и условий обучения технологиям искусственного интеллекта в рамках образовательных программ высшего образования и дополнительных профессиональных программ в вузовском секторе.
«Нам удалось провести настоящий хакатон, когда нет заранее понятного пайплайна, как получить решение»
С 13 по 20 октября в НИУ ВШЭ прошел хакатон “HSE AI Assistant Hack: Python”, организованный факультетом компьютерных наук и Центром искусственного интеллекта ВШЭ. За призовые места боролись 89 студенческих команд из ведущих вузов страны.
Ученые Вышки представили разработки, связанные с применением ИИ в медицине
Искусственный интеллект не заменит врача, но может стать ему отличным помощником. При этом здравоохранение нуждается в высокотехнологичных продуктах, которые способны быстро анализировать и контролировать состояние пациентов. Ученые Вышки применили ИИ для предоперационного планирования и постоперационной оценки результатов в спинальной хирургии и разработали автоматическую интеллектуальную систему для оценки биомеханики рук и ног.
Ученые Вышки представили проекты по этической экспертизе в сфере ИИ
Технологии искусственного интеллекта уже стали неотъемлемой частью повседневной жизни и активно применяются в различных отраслях экономики. Однако этические вопросы использования ИИ все еще требуют обсуждения и осмысления. Сегодня в России с участием ученых НИУ ВШЭ ведется работа над несколькими отраслевыми приложениями к национальному Кодексу этики в сфере ИИ, в которых будут конкретные рекомендации в помощь каждому, кто нуждается в понимании и анализе рисков и угроз со стороны ИИ.
Три команды ВШЭ стали победителями на всероссийском хакатоне «Цифровой прорыв»
В конце сентября в Москве состоялся всероссийский хакатон «Цифровой прорыв. Сезон: Искусственный интеллект». На соревнование собрались 314 команд и 1616 человек со всей страны. Они состязались в решении задач от партнеров хакатона — государственных организаций и компаний: «РЖД», «Росатома», Центра робототехники Сбера, «Сколтеха» и многих других. Три команды студентов факультета компьютерных наук НИУ ВШЭ приняли участие в хакатоне и выиграли в двух кейсах.
С помощью ученых НИУ ВШЭ и Сбера преподаватели смогут повысить качество онлайн-обучения
Ученые Центра искусственного интеллекта НИУ ВШЭ и исследователи Лаборатории искусственного интеллекта Сбербанка научились определять вовлеченность участников онлайн-мероприятий. Метод, основанный на анализе видео лица, помогает выявить, насколько слушатель заинтересован в материале. Научная статья о проведенном исследовании опубликована в рамках Международной конференции по искусственному интеллекту в образовании — AIED 2024.
Вышка расширит сотрудничество с Агентством стратегических инициатив для разработки передовых решений
В Высшей школе экономики прошел День знакомства университета и Агентства стратегических инициатив (АСИ). Стороны представили свои исследовательские и аналитические проекты и наметили направления совместной работы. Задача ученых и экспертов — повысить эффективность и ускорить внедрение в практику прорывных научных разработок по широкому спектру направлений — от экономических прогнозов до нейропротезирования.
Исследователи НИУ ВШЭ и Сбера добавят эмоций искусственному интеллекту
Ученые Центра искусственного интеллекта НИУ ВШЭ и исследователи Лаборатории искусственного интеллекта Сбербанка разработали специальную систему, которая с помощью больших языковых моделей сделает искусственный интеллект (AI) более эмоциональным при общении с человеком. Синтезом AI-эмоций займутся набирающие популярность мультиагентные модели. Научная работа о проведенном исследовании опубликована в рамках Международной совместной конференции по искусственному интеллекту — IJCAI 2024.
Вышка и «Яндекс» научат преподавателей российских вузов ИИ-грамотности
«Яндекс Образование» и факультет компьютерных наук НИУ ВШЭ (ФКН ВШЭ) создали совместный онлайн-гайд, посвященный промптингу — формулированию запросов к нейросетям. Он доступен всем на платформе «Яндекса» и в первую очередь будет полезен преподавателям, которые никогда не пользовались GPT в работе или только начинают применять ИИ-инструменты. Как правильно создать запрос к нейросети? Как грамотно использовать GPT-модели в образовательных целях? Какие задачи преподаватели могут решать с помощью искусственного интеллекта? Гайд отвечает на эти и другие вопросы по работе с нейросетями.
«Оставаться конкурентным специалистом без применения нейросетей может стать нелегкой задачей»
Цифровые технологии прочно вошли в нашу жизнь и продолжают стремительно развиваться. Неудивительно, что все чаще возникает вопрос, сможет ли однажды искусственный интеллект полностью заменить специалистов. О перспективах лингвистики в эпоху нейросетей рассуждает Даниил Осипов, кандидат филологических наук, доцент Школы иностранных языков НИУ ВШЭ.