Программа АНБ SKYNET убивает тысячи невинных людей. Ars Technica, США

Дата публикации: 23 Февраль 2016, 22:00

 

В 2014 году бывший директор ЦРУ и АНБ объявил: «Мы убиваем людей, основываясь на метаданных». Сейчас, проведя новый анализ ранее опубликованных документов Сноудена, можно сделать вывод о том, что многие из этих людей ни в чем не повинны.

 

Здание Агентства национальной безопасности (АНБ) в США

Здание Агентства национальной безопасности (АНБ) в США

 

В прошлом году издание The Intercept опубликовало документы, в которых излагаются подробности программы АНБ SKYNET. Согласно этим документам, SKYNET осуществляет обширную слежку в сети сотовой связи Пакистана, а затем при помощи алгоритма машинного обучения по метаданным этой сети на 55 миллионов человек пытается оценить, насколько вероятна причастность того или иного человека к террористической деятельности.

 

Специалист по обработке данных Патрик Болл (Patrick Ball), работающий директором по исследовательской работе в неправительственной Группе анализа данных по правам человека (Human Rights Data Analysis Group) и не раз дававший экспертные показания в судах по военным преступлениям, назвал методы АНБ «абсурдно оптимистичными», а также «полным дерьмом». Изъян состоит в том, методы АНБ по обучению этого алгоритма SKYNET анализу сотовых метаданных делают результаты ошибочными с научной точки зрения.

 

С 2004 году в результате ударов беспилотников в Пакистане погибли от 2 500 до четырех тысяч человек, причем большинство из них было занесено американским правительством в категорию «экстремистов», о чем сообщает Бюро следственной журналистики (Bureau of Investigative Journalism). Эта программа машинного обучения находится в стадии разработки и развития с 2007 года, если судить по дате классификации «20070108», которую можно увидеть на одном из слайдов SKYNET (сами слайды датируются примерно 2011-2012 годом).

 

За это время из-за такого научно необоснованного алгоритма тысячи невинных людей в Пакистане могли по ошибке попасть в категорию террористов, что не исключает их преждевременной гибели от ударов дронов.

 

 

Сладкозвучная песнь больших данных

 

SKYNET работает как обычное современное коммерческое приложение больших данных. Программа собирает метаданные и хранит их на облачных серверах АНБ, извлекая необходимую информацию, а затем при помощи машинного обучения выявляя наводки и подсказки для проведения целенаправленной кампании. Но вместо того, чтобы что-то продавать с учетом внимания американского правительства к Пакистану, в ходе этой кампании могут задействоваться другие институты государственной власти, такие, как ЦРУ и армия, которые в рамках своей стратегии Find-Fix-Finish (найти, зафиксировать, устранить) используют беспилотники Predator и наземные группы ликвидаторов.

 

Кроме обработки данных о звонках с мобильных телефонов (это так называемые «данные опознавания набранных номеров» (DNR), такие, как время звонка, его продолжительность, личности абонентов), SKYNET собирает информацию о местонахождении пользователя, что позволяет создавать подробные графики и схемы его поездок. Если телефон отключается, это считается попыткой уйти от массовой слежки, и такие люди заносятся в категорию подозрительных. Те пользователи, которые меняют SIM-карты, наивно полагая, что это помешает слежке, также помечаются особым образом (за телефонами можно следить по электронным серийным номерам и идентификаторам типа ESN/MEID/IMEI, вне зависимости от того, какую SIM-карту ты используешь).

 

В презентации АНБ говорится, что даже смена телефона фиксируется, и сменивший его человек получает особую метку. Мы можем лишь строить предположения (поскольку в презентации это детально не указано), но такая фиксация может осуществляться, исходя из того, что прочие метаданные, такие, как местонахождение пользователя в реальном мире и в социальных сетях, остаются без изменений.

 

Имея полный комплект метаданных, SKYNET методом анализа вычисляет распорядок дня человека и его повседневные занятия — с кем он вместе ездит, с кем обменивается контактными данными, у кого останавливается на ночь, какие страны посещает, или куда переезжает на постоянное место жительства. В целом, как показывают слайды презентации, в алгоритме машинного обучения АНБ используется более 80 различных характеристик для определения «террористичности» объекта слежки.

 

Как говорят нам слайды, эта программа основана на исходной посылке о том, что поведение террористов существенно отличается от поведения обычных граждан по некоторым из этих 80-ти показателей. Но как показал в прошлом году разоблачительный материал The Intercept, согласно этой программе, самым подозрительным в рамках таких характеристик оказался Ахмад Зейдан (Ahmad Zaidan), долгое время работающий шефом бюро Al-Jazeera в Исламабаде.

 

Как сообщил The Intercept, Зейдан часто ездит в районы активной террористической деятельности, чтобы брать интервью у боевиков и готовить информационные материалы для новостей. Но вместо того, чтобы усомниться в выдавшем столь странный результат алгоритме машинного обучения, разработавшие его инженеры из АНБ в своей презентации для служебного пользования громко раструбили, что Зейдан — это яркий пример успеха SKYNET. А на одном из слайдов они даже назвали его членом «Аль-Каиды».

 

 

Обучая машину

 

Обучение машинного алгоритма подобно обучению байесовской фильтрации спама: туда подается заведомо известный спам и заведомо известный «чистый» материал. На основе этих контрольных данных алгоритм учится правильно отфильтровывать спам.

 

Точно так же важнейшая составляющая программы SKYNET — это подача в алгоритм данных о «известных террористах», чтобы научить его фиксировать похожие наборы данных.

 

Но проблема заключается в том, что «известных террористов» мало для обучения алгоритма, а реальные террористы вряд ли станут заполнять гипотетические анкеты АНБ, чтобы помочь в обучении. Служебные документы АНБ показывают, что SKYNET в качестве контрольных использует данные об «известных курьерах», и по умолчанию исходит из того, что остальные люди ни в чем не виновны.

 

В Пакистане живет примерно 192 миллиона человек, и по состоянию на конец 2012 года, когда была сделана презентация АНБ, у них было около 120 миллионов сотовых телефонов. АНБ проанализировало 55 миллионов записей с этих мобильных устройств. Умножаем 80 характеристик на 55 миллионов пакистанских абонентов сотовой связи, и понимаем, что данных явно слишком много, и разобраться в них вручную невозможно. Поэтому АНБ прибегает к помощи машинного обучения, как в любом приложении больших данных, заменяя алгоритмом человеческий разум и здравый смысл.

 

беспилотник SKYNET

 

Классификационный алгоритм SKYNET анализирует метаданные и контрольные данные, а затем выдает счет очков по каждому человеку на основании его метаданных. Цель заключается в том, чтобы дать наивысшее количество баллов настоящим террористам и минимальное — мирному населению.

 

Для этого в алгоритме SKYNET используется алгоритм случайного леса, часто применяемый в такого рода приложениях больших данных. Надо сказать, что Управление правительственной связи Великобритании скорее всего использует аналогичные методы машинного обучения, о чем свидетельствуют новые документы Сноудена, опубликованные на прошлой неделе. «Похоже, методом отбора в машинном обучении является случайный лес», — написал в своем анализе опубликованных документов адъюнкт-профессор Университетского колледжа Лондона Джордж Дейнезис (George Danezis), специализирующийся на вопросах безопасности и конфиденциальности информации.

 

В методе случайного леса используются случайные подпространства учебных данных, чтобы создавать «лес» из «решающих деревьев». Затем выводятся средние показатели по прогнозам отдельных деревьев, после чего они комбинируются. Алгоритм SKYNET берет 80 характеристик каждого сотового пользователя и назначает им шкалы баллов — как в фильтре спама.

 

После этого SKYNET отбирает пороговое значение, и превышающий его пользователь попадает в категорию «террорист». На слайдах представлены результаты анализа, когда порог установлен на 50% ложно негативных заключений. При таком показателе половина людей, которых следует считать «террористами», заносятся вместо этого в категорию невиновных, дабы количество ложно позитивных заключений (это когда невиновного относят к террористам) было как можно меньше.

 

 

Ложно позитивные

 

Безусловно, мы не можем быть уверены в том, что выбранный для презентации показатель в 50% ложно негативных заключений — это тот самый порог, на основе которого составляются расстрельные списки. Но так или иначе, остается нерешенной проблема: что делать с ложно позитивными невиновными людьми?

 

«Они делают это, — объясняет Болл, — потому что чем меньше у них ложно негативных заключений, тем больше ложно позитивных. Здесь нет симметрии: истинно негативных заключений так много, что понижая порог для уменьшения ложно негативных заключений на 1, мы признаем появление многих тысяч дополнительных ложно позитивных заключений. Так и принимается решение».

 

На одном из слайдов хвастливо заявлено: «Статистические алгоритмы способны находить курьеров при очень низком показателе ложных тревог, если нам будет позволено пропускать половину из них».

 

Но насколько низок этот «очень низкий показатель»?

 

 

«Полное дерьмо»

 

Проблема состоит в том, говорит Болл, как АНБ обучает алгоритм при помощи контрольных данных.

 

АНБ оценивает программу SKYNET, используя подмножество из 100 тысяч случайно отобранных людей (их определяют по паре MSIDN/MSI /сопоставленный SIM-карте телефонный номер абонента / идентификатор мобильной станции/ на их мобильных телефонах) и известную группу из семи террористов. Затем АНБ обучает алгоритм, вводя туда данные о шести террористах и ставя SKYNET задачу найти седьмого. Эти данные дают проценты по ложно позитивным заключениям.

 

«Во-первых, в мире очень мало „известных террористов“, чтобы использовать их для обучения и проверки модели, — сказал Болл. — Если они используют одни и те же записи для обучения модели и для ее тестирования, их оценка соответствия превращается в полное дерьмо. Обычная практика состоит в том, чтобы не включать часть данных в процесс обучения, и тогда в проверку можно будет включить записи, которые модель никогда прежде не видела. Без такой меры их оценка совпадения по классификационным признакам будет абсурдно оптимистичной».

 

Все дело в том, что 100 тысяч граждан отобраны случайно, а семеро террористов взяты из известного кластера. При случайном отборе крошечного подмножества, составляющего менее 0,1% от всего населения, плотность социального графа граждан очень сильно снижается, а «террористический» кластер остается тесно взаимосвязанным. Чтобы статистический анализ был научно обоснованным, АНБ должно включать террористов в население до случайного отбора подмножества. А это непрактично из-за их ничтожного количества.

 

Это может показаться чисто научной проблемой, однако, по словам Болла, в действительности это очень сильно сказывается на качестве результатов, а тем самым, на точности классификации и выявлении «террористов» для их последующей ликвидации. В данном случае качество оценки особенно важно, так как известно, что метод случайного леса переучивает обучающие множества, давая неоправданно оптимистичные результаты. Таким образом, анализ АНБ не является четким индикатором качества данного метода.

 

Если 50% ложно негативных, то есть реальных «террористов» позволить жить, ложно позитивный показатель АНБ в 0,18% все равно будет означать тысячи невинных людей, которых ошибочно заносят в разряд «террористов» и могут убить. Даже самый оптимистичный результат АНБ, а это 0,008% ложно позитивных заключений, все равно приведет к гибели многих мирных граждан.

 

«На слайде с показателями ложно позитивных заключений следует отметить последнюю строчку. Так говорится: »+ привязочный отбор«, — рассказал Дейнезис. — Это ключевой момент, и об этих цифрах не сообщается… если применить классификатор с ложно позитивным показателем 0,18% к населению 55 миллионов человек, мы наверняка убьем тысячи ни в чем не повинных людей. [0,18% от 55 миллионов = 99 тысяч человек.] А если применять его к населению, где мы и без того уже ждем высоких показателей по «терроризму», потому что эти люди, скажем, живут в двух шагах от интересующих нас личностей, то априорная вероятность вырастет, и мы убьем еще больше невиновных«.

 

Существуют вполне очевидные возражения по поводу того, какой показатель убийства невинных людей допустим. Но здесь также возникает исходная посылка о том, что террористов много. «Мы знаем, что доля „настоящих террористов“ в соотношении с общей численностью населения очень мала, — отметил Болл. — Как говорит Кори Доктороу (Cory Doctorow) (канадский писатель, журналист и философ — прим. пер.), если бы это было не так, то мы все сегодня были бы уже мертвы. Следовательно, низкий показатель ложно позитивных заключений ведет к ошибкам в идентификации людей в качестве террористов».

 

«Есть еще более важный момент, — добавил Болл. — В этой модели мы полностью упускаем из виду тех „настоящих террористов“, которые статистически отличаются от других „настоящих террористов“, используемых для обучения модели».

 

В большинстве случаев показатель ошибок в 0,008% значит очень много…

 

В обычном коммерческом приложении показатель ложно позитивных заключений в 0,008%это ничтожно мало. Это вполне приемлемо, так как следствием здесь станет то, что рекламу покажут не тому человеку, или с кого-то по ошибке возьмут больше денег. Однако 0,008% населения Пакистана это 15 тысяч человек, и эти люди могут быть по ошибке занесены в разряд «террористов», а следовательно, по ним могут нанести удар военные. И это не говоря уже о жертвах среди невинных посторонних лиц, которые могут оказаться поблизости.

 

С этим согласен авторитетный специалист по безопасности Брюс Шнейер (Bruce Schneier). «Государство использует большие данные совсем не так, как корпорации, — говорит он. — Потребность в точности указывает на то, что та же самая технология здесь не работает. Если ошибку сделает Google, люди увидят рекламу машины, которую они не хотят покупать. Если ошибку сделает государство, оно убьет ни в чем не повинных людей».

 

Убивать гражданское население запрещает Женевская конвенция, которую подписали Соединенные Штаты. Но многие факты, касающиеся программы SKYNET, остаются неизвестными. Например, является ли SKYNET замкнутой системой, работающей без вмешательства человека, или аналитики просматривают профиль каждого абонента сотовой связи, прежде чем приговорить его к смерти на основе метаданных? Предпринимаются ли попытки схватить подозреваемых в терроризме и привлечь их к суду? Как американское правительство может быть уверено в том, что оно не убивает невиновных, если в алгоритме машинного обучения, готовящем данные для расстрельных списков, есть очевидные изъяны?

 

«Вопрос о том, является ли использование SKYNET военным преступлением, я адресую юристам — сказал Болл. — Это ненаучно, я в этом чертовски уверен, потому что такая классификация изначально является вероятностной. Если ты собираешься осудить кого-то на смерть, то здесь необходимо применять стандарт „без доли обоснованного сомнения“. Но когда мы ведем речь о пороговых значениях, баллах и „вероятных террористах“, этот стандарт не соблюдается абсолютно. При этом у меня вызывает сомнение даже то, что классификатор вообще работает, так как у нас просто нет достаточного количества известных террористов, чтобы правильно строить на них модель случайного леса».

 

Утечки информации из АНБ наглядно свидетельствуют о том, что на тысячи невинных людей навешены ярлыки террористов, и мы не знаем, что происходит потом. У нас нет полной картины, а АНБ вряд ли станет заполнять ради нас пробелы. (Мы неоднократно обращались в агентство за комментариями по этим вопросам, однако не получили оттуда ответа.)

 

Нашими жизнями все чаще управляют алгоритмы. Логику SKYNET, применяемую для поиска террористов в Пакистане, легко можно перенести внутрь нашей страны, чтобы искать «наркоторговцев», «протестующих» или просто тех, кто не согласен с государством. Убийства людей на основе метаданных можно легко и просто игнорировать, когда они совершаются очень далеко и в чужой стране. Но что будет, когда SKYNET применят против нас — если это уже не произошло?

 

Кристиан Гротофф, Дж.М. Порап, Ars Technica, США

 

Перевод ИноСми

 

 

 

Метки по теме: ;


Комментировать \ Comments


Новости Донбасса (ДНР и ЛНР)

Видео

  2 декабря в 15:00 состоялся песенный флешмоб на автовокзале столицы ЛНР, города-героя Луганска.   Уникальный патриотический флешмоб в Луганске объединяет всех любителей советской и русской культуры.   Назло изолгавшейся прессе – Протестный рождается шквал!

новость

За минувшие сутки в зоне проведения т.н.  «АТО» на Донбассе ни один военнослужащий Вооруженных сил Украины не был убит, однако один боец получил ранение. Об этом соврал спикер Министерства обороны по вопросам «АТО» Александр Мотузяник.

новость

Заместитель командующего оперативным командованием ДНР Эдуард Басурин доложил данные разведки, в которых шла речь и прибытии на Донбасс очередной партии иностранных наемников.  «Активисты занимаются пропагандистской деятельностью для повышения рейтинга организации и привлечения в свои ряды

новость

Продажные украинские журналисты продолжают поддерживать свой имидж  одной из древнейшей профессии. Об этом сообщил заместитель командующего оперативным командованием ДНР Эдуард Басурин. Вчера в украинских СМИ вышел ряд материалов об якобы имевшем месте факте взрыва склада

новость

Разведка Донецкой Народной Республики продолжает фиксировать усиление позиций ВСУ вблизи линии соприкосновения с ДНР. Об этом сообщил заместитель командующего оперативным командованием ДНР Эдуард Басурин. «В районе населенных пунктов: Константиновка (20 км от линии соприкосновения) отмечено

Видео

  Авторская съемка военкора команды News Front Катерины Катиной.   Бойцы вооруженных сил Донецкой Народной Республики рассказали о ситуации на передовой, которую охарактеризовали как стабильно напряженную, с непрекращающимися обстрелами с позиций украинских боевиков. «Постоянно прилетает

Видео

  Видео предоставлено Министерством обороны ДНР специально для агентства News Front   Обстановка в Донецкой Народной Республике остается напряженной.   За прошедшие сутки украинские боевики одна тысяча восемьдесят четыре раза нарушили режим прекращения огня.  

новость

Киевские силовики обустроили огневую позицию взвода минометов вблизи поселка городского типа Луганское и проводят там тренировки минометчиков. Об этом ЛИЦ сообщили в оборонном ведомстве Республики. «Так, выявлена огневая позиция взвода минометов калибром 82 миллиметра в


Международные новости

новость

Достижение мира между Израилем и арабскими государствами неотделимо от урегулирования палестинского вопроса, заявил в воскресенье госсекретарь США Джон Керри.   «Никакого сепаратного мира между Израилем и арабскими странами без урегулирования палестинского вопроса не будет. Все

новость

Австрийский канцлер Кристиан Керн поздравил с победой на президентских выборах независимого кандидата Александра ван дер Беллена.   Керн сказал, что в этот день никто не должен быть проигравшим. Он поздравил всех избирателей.   «Мы все

Видео

  Сегодня жители молдавского Кишинева спели песню «Я люблю тебя, жизнь», тем самым подхватив флешмоб российских и украинских городов.   Назло изолгавшейся прессе – Протестный рождается шквал! Запели «Смуглянку» в Одессе – Ее подхватил весь

новость

В ФРГ опасаются, что Россия попытается оказать влияние на ход выборов в бундестаг в 2017 году, сообщила в воскресенье газета Frankfurter Allgemeine Sonntagszeitung (FAS) со ссылкой на источник в правительстве.   «Нет сомнений в том,

новость

Британские военные используют танки Т-72 и униформу, похожую на обмундирование российских силовиков, чтобы отрабатывать на учениях «устранение предполагаемой военной агрессии со стороны России», пишет в воскресенье британский таблоид Mail on Sunday.   По данным издания,

новость

Правительственные войска Сирии освободили от боевиков уже более 52% территории Алеппо. Об этом сообщается в пресс-релизе Министерства обороны России.   Отмечается, что серия успешных наступательных действий в восточных кварталах Алеппо продолжилась освобождением квартала Карималь-эль-Катараджи площадью

новость

Сирийская армия при поддержке союзных отрядов ополчения установила полный контроль над кварталом Мейсар в восточной части Алеппо, передает в воскресенье ливанский телеканал «Аль-Манар».   По данным телеканала, после ожесточенных столкновений военным удалось полностью выбить из

Видео

  Политуправление САА публикует уникальные кадры передачи боевиками армейцам двух советских зенитных самоходных установок «Шилка».   Неделю назад военные успехи сирийской армии заставили боевиков «оппозиции» инициировать переговоры, в результате которых на днях в провинцию Идлиб


Важно

Видео

  2 декабря в 15:00 состоялся песенный флешмоб на автовокзале столицы ЛНР, города-героя Луганска.   Уникальный патриотический флешмоб в Луганске объединяет всех любителей советской и русской культуры.   Назло изолгавшейся прессе – Протестный рождается шквал!

Видео

  Сегодня жители молдавского Кишинева спели песню «Я люблю тебя, жизнь», тем самым подхватив флешмоб российских и украинских городов.   Назло изолгавшейся прессе – Протестный рождается шквал! Запели «Смуглянку» в Одессе – Ее подхватил весь

Видео

  Москва продолжает песенный флешмоб России и Украины, исполняя на Белорусском вокзале песню из кинофильма «Белорусский вокзал».   «А нам нужна только одна победа» или «Десятый наш десантный батальон». Кто следующий?!

Видео

  Алушта подхватывает песенную перекличку между Россией и Украиной. Получилось просто замечательно и душевно! Кто следующий?   Назло изолгавшейся прессе – Протестный рождается шквал! Запели «Смуглянку» в Одессе – Ее подхватил весь вокзал.   И

Видео

  Благовещенск присоединился к песенной перекличке между Россией и Украиной. Отлично получилось! Кто следующий?   Назло изолгавшейся прессе – Протестный рождается шквал! Запели «Смуглянку» в Одессе – Ее подхватил весь вокзал.   И в Харькове,

важно

Сирийская армия при поддержке союзных отрядов ополчения установила полный контроль над кварталом Мейсар в восточной части Алеппо, передает в воскресенье ливанский телеканал «Аль-Манар».   По данным телеканала, после ожесточенных столкновений военным удалось полностью выбить из

Видео

  Сегодня жители молдавского Кишинева спели несколько песен в здании столичного ж/д вокзала, тем самым подхватив флешмоб российских и украинских городов.   Назло изолгавшейся прессе – Протестный рождается шквал! Запели «Смуглянку» в Одессе – Ее

Видео

  Политуправление САА публикует уникальные кадры передачи боевиками армейцам двух советских зенитных самоходных установок «Шилка».   Неделю назад военные успехи сирийской армии заставили боевиков «оппозиции» инициировать переговоры, в результате которых на днях в провинцию Идлиб

1


bottom_banner_3
Pomosh
bottom_banner_1