Выбор редакции

Нейросети ошибаются в распознавании женщин и темнокожих



Идентификация личности при помощи функции распознавания лиц приобретает всё большую популярность. Многие флагманские смартфоны и ноутбуки уже сейчас используют эту технологию. Мы как то обсуждали тему, в которой на полном серьезе говорилось, что уже можно достаточно точно и автоматически определять гомосексуалистов по фотографиям. Однако точность работы таких алгоритмов, как оказалось, еще требует существенной доработки.

Как недавно выяснилось, на результат работы программы распознавания личности, оказывает влияние цвет кожи и половая принадлежность пользователей.



Эксперт Джой Буоламвини из MIT Media Lab при Массачусетском технологическом институте провёл эксперимент, в ходе которого проверил правильность распознавания выборки из 1200 фотографий известных личностей, занятых в политике, из стран, где во власть активно привлекают женщин. Выбранные личности были продемонстрированы трём наиболее популярным алгоритмам по распознаванию лиц: Microsoft, IBM и Megvii из Китая. Системы, основанные на искусственном интеллекте, ошиблись при определении 0,8% мужчин и 7% женщин европеоидной расы. Среди чернокожих мужчин неправильно распознано 12% личностей, а у женщин негроидной расы отклонение достигло непозволительных 34,7%.

Однако в алгоритмах распознавания лиц не закладывается расовое или гендерное неравенство. Проблема заключается в базе, на которой проходит обучение искусственного интеллекта. Так, например, самая большая база фотографий, предлагаемая для обучения программам идентификации личности, содержит 75% изображений мужчин и на 80% из этих снимков запечатлены светлокожие люди. Также, оценив цвет кожи всех людей с фотоснимков, задействованных в эксперименте, по шкале оттенков кожи Фицпатрика, исследователи заметили, что чем темнее оттенок кожного покрова, тем сложнее ИИ справиться с распознанием.



Таким образом, производителям следует расширить кругозор своих нейросетей и предоставить им для изучения фотоматериалы людей из различных регионов Земли с учётом их расовых, этнических и половых различий.

Джой Буоламвини, ведущий автор исследования, впервые столкнулась с проблемой предвзятости алгоритмов несколько лет назад. Для своего аспирантского проекта она использовала коммерческую программу для распознавания лиц. Команда Джой была этнически и расово пестрой, в ходе работы оказалось, что алгоритм надежно работает только с ее единственным белым участником. Буоламвини, сама темнокожая, попыталась проанализировать собственные фото, и оказалось, что система либо вовсе не распознает ее лицо, либо неверно определяет пол.



Исторически, искусственные нейронные сети за свою уже более чем полувековую историю испытывали как периоды стремительных взлетов и повышенного внимания общества, так и сменявшие их периоды скепсиса и равнодушия. В хорошие времена ученым и инженерам кажется, что наконец-то найдена универсальная технология, способная заменить человека в любых когнитивных задачах. Как грибы после дождя, появляются различные новые модели нейронных сетей, между их авторами, профессиональными учеными-математиками, идут напряженные споры о большей или меньшей степени биологичности предложенных ими моделей. Профессиональные ученые-биологи наблюдают эти дискуссии со стороны, периодически срываясь и восклицая «Да такого же в реальной природе не бывает!» – и без особого эффекта, поскольку нейросетевики-математики слушают биологов, как правило, только тогда, когда факты биологов согласуются с их собственными теориями. Однако, с течением времени, постепенно накапливается пул задач, на которых нейронные сети работают откровенно плохо и энтузиазм людей остывает.

В наши дни нейронные сети снова в зените славы благодаря изобретению метода предобучения «без учителя» на основе Ограниченных Больцмановских Машин (Restricted Bolzmann Machines, RBM), что позволяет обучать глубокие нейронные сети (т.е. с экстра-большим, порядка десятков тысяч, количеством нейронов) и успехам глубоких нейронных сетей в практических задачах распознавания устной речи и изображений. К примеру, распознавание речи в Android реализовано именно на глубоких нейронных сетях. Как долго это продлится и насколько сильно глубокие нейронные сети оправдают возложенные на них ожидания – неизвестно.



Между тем, параллельно всем научным спорам, течениям и тенденциям, отчетливо выделяется сообщество пользователей нейронных сетей – инженеров-программистов-практиков, которых интересует прикладной аспект нейросетей, их способность обучаться на собранных данных и решать задачи распознавания. Со многими практическими задачами классификации и прогнозирования великолепно справляются хорошо проработанные, относительно небольшие модели многослойных персептронов (Multilayer Perceptron, MLP) и сети радиальных базисных функций (Radial Basis Function network, RBF). Эти нейронные сети многократно описаны, я бы посоветовать следующие книжки, в порядке моей личной симпатии к ним: Осовский, Бишоп, Хайкин; также есть хорошие курсы на Coursera и подобных ресурсах.

Однако, что касается общего подхода использования нейронных сетей на практике, он кардинально отличается от обычного детерминированного девелоперского подхода «запрограммировал, работает – значит, работает всегда». Нейронные сети по своей природе являются вероятностными моделями, и подход к ним должен быть совершенно иной. К сожалению, многие программисты-новички технологий машинного обучения вообще и нейронных сетей в частности делают системные ошибки при работе с ними, разочаровываются и забрасывают это дело. Идея написания настоящего трактата на Хабр возникла после общения с такими разочарованными пользователями нейронных сетей – отличными, опытными, уверенными в себе программистами.

Источники:
http://24gadget.ru/1161066244-neyroseti-ploho-spravlyayutsya-s-raspoznaniem-zhenschin-i-chernokozhih.html
https://znaj.ua/ru/techno/poteryala-kontrol-nejroset-otkazalas-byt-tolerantnoj
https://geektimes.ru/post/211610/
 http://masterok.media/91543-neyroseti-oshibayutsya-v-raspoznavanii-zhenschin-i-temnokozhih.html