Интересно На чём корпорации вертели вашу приватность. Часть 2

Takeshi · 18 Янв 2020

Культура работы с персональными данными находится на низком уровне
В общем, суть в том, что все сейчас очень сильно озабочены объединением данных одного с другим, и большинство компаний, которые делают это объединение, иногда даже не задумываются об этом. Например, банк пришёл, заключил соглашение о неразглашении с компанией, которая делает скоринг, свалил ей 100 тысяч своих клиентов…

И не всегда у этого банка в соглашении есть пункт о передаче данных третьим лицам. Эти клиенты что-то там отскорили, и непонятно, куда потом эта база пошла, не пошла – в большинстве компаний в России нет культуры удаления данных… – обязательно этот «эксель» где-нибудь у секретаря потом на компьютере и повиснет.

Наши данные могут продаваться с каждой покупкой в магазине
Есть очень много схем, которые вроде как околозаконны (то есть законны). Например, история следующая: из 15 крупнейших российских банков только два являются собственно смс-шлюзом – «Тинькофф» и «Альфа», то есть они сами шлют свои смс-ки. Остальные банки используют смс-шлюзы для отправки смс-ок конечным клиентам. Эти смс-шлюзы почти всегда имеют право анализировать контент (типа, на предмет безопасности и каких-то своих выводов) для того, чтобы потом продавать агрегированную статистику. Эти смс-шлюзы «дружат» с операторами фискальных данных, которые оперируют чеки.

И получается следующее: вы пришли на кассу, оператор фискальных данных (дали, не дали свой номер телефона – каким-то образом там привязан)… вам на номер телефона приходит смс-ка, шлюз этих смс-ок видит последние 4 цифры карты и номер телефона. Мы знаем, в какой момент вы совершили транзакцию от оператора фискальных данных, а в смс-ках мы знаем (теперь уже), на какой номер пришла информация о списании такой-то денежной суммы с такими-то четырьмя последними цифрами карты. Четыре последние цифры карты идентификаторами вас не являются, не нарушают закон, потому что по ним нельзя вас деанонимизировать, сумма транзакции – тоже нет.

Но если вы договорились с оператором фискальных данных – вы знаете, в какое временное окно (плюс-минус 5 минут) вам эта смс-ка должна прийти. Таким образом, вас быстренько в ОФД привязали к вашему номеру телефона, а ваш номер телефона привязан к рекламным идентификаторам, вообще ко всему-всему-всему. Поэтому вас можно потом догнать: пришли в магазин, а вам потом ещё какую-то чушь присылают без разрешения. Я думаю, в этом зале вряд ли есть хоть кто-то, кто хоть раз писал заявление в ФАС на спам. Вряд ли есть… Кроме меня, наверное.

Бумажки – архаичный, но эффективный способ борьбы за свои права
Это очень круто работает. Правда, придётся полтора года подождать, но ФАС реально проведёт проверку: кто, как, кому передал данные, почему куда и так далее.

Вопрос из зала (далее – З): – В Белоруссии нет ФАСа. Это другая страна.

АХ: – Да, я понимаю. Аналог же наверняка есть какой-то…

Из зала поступают возражения
АХ: – Хорошо, плохой пример, «сори». Не суть важно. Среди моих друзей я никого не знаю, кто вообще в принципе о существовании подобной истории знает – что можно пойти написать, и они потом год ещё будут работать.

Вторая история, которая в России тоже очень развивается, но я думаю, что вы аналог у себя найдёте. Я очень люблю так делать, когда госорган с тобой плохо общается, какой-то банк или ещё что-то – ты говоришь: «Дайте бумажку». И пишешь на бумажке: «Согласно пункту 14 152-го ФЗ прошу вести обработку персональных данных в бумажном виде». Я не знаю, как точно это в Белоруссии делается, но наверняка это делается. По российским законам вам не имеют права отказать на основании этого в услуге.

Я даже знаю много людей, которые в Mail.ru подобное отсылали и просили вести учёт их персональных данных в бумажном виде. Mail.ru очень долго отбивался от этого. Я даже знаю одного разработчика «Яндекса», над которым пошутили: они удалили его аккаунт в ВК и прислали ему пачку распечатанных скриншотов, и сказали, что они будут присылать ему скриншоты каждый раз, когда он захочет обновить свою страницу.

Смешно, но тем не менее это реальная альтернатива, если кто-то реально переживает за данные, с одной стороны… А с другой стороны, тот же РКН мне говорил, что это соглашение об обработке персональных данных – оно формальное, и закон предусматривает ещё несколько вариантов дать это согласие. И что, например, меня пригласили сюда на мероприятие, и если, например, Human Constanta может не заключать в рамках российских законов со мной соглашение об обработке персональных данных (потому что сам факт того, что я приехал и согласился выступить, и является согласием на обработку персональных данных), – все всё равно берут эти бумажные разрешения. Но вот РКН подобную штуку мне говорил, что как бы это вообще не факт, что скорее всего они когда-то отпадут.

Я надеюсь, что в России никогда не создадут единого оператора, прости Господи, персональных данных, потому что хуже того, чем сложить все персональные данные в одну корзину, может быть только сложить их в государственную корзину. Потому что фиг знает, что потом получится с этим всем.

Компании обмениваются персональными данными, и законы слабо регулируют это
Большинство компаний между собой обмениваются какими-то данными, идентификаторами. Это может быть магазин с банком, а потом – банк с соцсетью, соцсеть – ещё с чем-то… И в конце концов, у этих людей появляется некая критическая масса знаний, которые можно каким-то образом использовать, и все эти знания, правда, сейчас пытаются сохранить на своей стороне. Но тем не менее потом это всё равно попадает в какой-нибудь рекламный трафик или ещё куда-то.

Передача данных третьим лицам – это самое весёлое, что может быть, потому что в законах не описано, что это за третьи лица, кому они вообще «третьими» должны считаться. Это, кстати, очень распространённая фраза американских адвокатов – у них это там Third parties – кто, кого вы считаете третьими лицами: бабушку, прабабушку?.. Даже был в Америке такой прецедент, когда чьи-то данные раскрыты были, человек подал в суд, и они доказали, что этот человек через несколько друзей знаком с владельцем данных – какое-то количество рукопожатий, привели какие-то странные социологические исследования – таким образом доказали, что эти люди не могут считаться третьими лицами друг другу. Смешно. Но факт передачи таких данных очень распространён.

Даже если вы заходите на сайт, где стоит счётчик для идентификации – этот счётчик имеет право передавать данные этого трафика куда-нибудь («Кликстриму», владельцам рекламных платформ чего угодно, «Порнохабу», например). «Порнохаб», если кто-то из вас веб-разработчик, – вы зайдите посмотрите, какое количество пикселей отслеживания стоит на сайте «Порнохаба». Просто заходишь – там огромное количество java-скрипта загружается, типа для улучшения работы сайта. На самом деле там и кроссдоменные «куки» ставятся, чего там только нету, потому что эта информация всегда высоко ценится на рынке «кликстрима».

«Фейсбук» виляет и маску срывать не собирается
Естественно, никто из крупных игроков никогда никому не рассказывает, кому и как он продаёт данные. Из-за этого, например, Европа сейчас пытается судиться с «Фейсбуком». Как раз-таки после введения GDPR Европейский союз пытается с «Фейсбука» стрясти собственное раскрытие алгоритмов перепродажи данных третьим лицам.

«Фейсбук» этого не делает и заявляет во всеуслышание, что он этого не делает, потому что они – «корпорация мира» (это я цитирую из письма, которое они мне прислали), они «против зловредного применения технологий» (особенно, если вы распознавание лиц Кремлю продаёте). В общем, суть в том, что «Фейсбук» делает это не совсем честно: главная его цель и главное, что произойдёт, как только такой механизм раскроется – можно будет реально подсчитать маржинальность рекламы, можно будет понять реальную стоимость рекламных объявлений.

Условно, если вам «Фейсбук» сейчас говорит, что стоимость рекламного показа – 5 рублей, и мы вам продаём его за 3 (и, типа, два рубля нам остаётся), и они, условно, 5% прибыли получают с этих рекламных показов. На самом деле это не 5%, а 505, потому что, если этот алгоритм всплывёт наружу (кому и как «Фейсбук» сколько раз передал «кликстрим», данные о посещениях, данные пикселя всевозможным рекламным сетям), окажется, что они денег зарабатывают гораздо больше, чем говорят об этом. И дело здесь не в самих деньгах, а в том, что стоимость клика не рубль, а на самом деле – сотые копеек.

В общем, суть в том, что все пытаются сокрыть подобную передачу, неважно – рекламного, нерекламного трафика, но она есть. К сожалению, нельзя никак юридически узнать это, потому что компании – частные, и всё, что у них внутри – это их частное право и их коммерческая тайна. Но подобные истории там очень часто всплывали.

Наркобарыги предсказуемы и «палятся» на «Авито»
Последняя картинка из этой презентации. Она смешная, и суть её в том, что есть некие категории людей, которые очень сильно переживают за свои персональные данные. И это хорошо, на самом деле! Этот пример – про такую категорию людей как наркобарыги. Казалось бы, люди, которые должны очень сильно переживать за свои персональные данные…

Это – исследование, которые проводилось в начале того года под надзором компетентных органов. Да, это скрипт, которому дали денег, чтобы он купил в «Телеграме», в «Торе» наркотики, но только у тех людей, которых можно было идентифицировать.

На самом деле почти все наркобарыги московские горят на том, что их номер телефона, вообще ни в каких открытых источниках, но рано или поздно на «Авито» они что-нибудь продадут, по чему можно будет понять примерное местоположение этих людей. Суть в том, что красные точки – это где люди живут, а зелёные – это куда они ездят оставлять сами знаете что. Это была одна из частей алгоритма, который прогнозировал расстановку патрульно-постовых служб, но эти московские ребята всегда стараются как-то по диагонали поехать, подальше.

Они считают, что если они сверху слева живут, то они должны сверху справа поехать и там их точно никогда не найдут. Это я вам говорю к тому, что, если вы пытаетесь скрыться от вездесущих алгоритмов, реальный самый крутой вариант – это менять модель поведения: установить какой-то там «Гостери» для рандомизации посещений, владений и так далее. Да господи, есть даже алгоритмы, плагины, которые размеры браузера на пару пикселей меняют, чтобы нельзя было подпись, «фингерпринт» браузера посчитать и как-то вас идентифицировать.

У меня всё. Если у вас есть вопросы – давайте. Вот, есть ссылочка на презентацию.

Вопрос из зала (З): – Скажите, пожалуйста, а с точки зрения использования «Тора», с точки зрения отслеживания трафика… Рекомендуете ли вы?

Скрыться тяжело, но можно
АХ: – «Тор»? «Тор» нет, вообще ни в каком виде. Я, правда, не знаю, как в Белоруссии – в России вообще ни в коем случае туда не заходить, потому что практически большинство «грейснод» верифицированные внезапно добавляют некие пакеты к вашему трафику. Не знаю какие, но если вы посмотрите: есть «ноды», которые маркируют трафик, – непонятно, кто это делает, в каких целях, – но кто-то его маркирует в заголовке для того, чтобы потом можно было понять. В России сейчас же весь трафик хранится, пусть он и хранится в зашифрованном виде, и все троллят «Пакет Яровой» на тему того, что хранится зашифрованный трафик, но он остаётся промаркированный, то есть использовать, расшифровать его нельзя…

З: – В Европе он уже давно хранится, лет десять, наверное.

АХ: – Да, я понимаю. Все смеются над этим – типа, вы храните https, которые невозможно прочитать. Контент прочитать нельзя, но понять, откуда пакеты шли определёнными алгоритмами можно – по весу пакетов, по длине и так далее. А когда у тебя есть под колпаком все провайдеры, есть, соответственно, всё магистральное оборудование и все паспорта… В общем, вы поняли о чём я говорю?

З: – Каким браузером рекомендуете пользоваться?

АХ: – Для «Тора»?

З: – Нет, вообще.

АХ: – Ну, я не знаю. Я на самом деле «Хромом» пользуюсь, но исключительно потому, что там панель разработчика самая удобная. Если вдруг мне понадобится куда-то зайти, я пойду в какую-нибудь кафешку. Правда, там не стоит авторизовываться на настоящую сим-карту.

З: – Вы говорили о каких-то студентах. Вы где-то преподаёте либо какие-то курсы ведёте?

АХ: – Да, у нас есть магистратуры по журналистике данных. Мы обучаем журналистов собирать данные, анализировать – вот они подобные исследования периодически делают.

Безопасных приложений нет

З: – В «Фейсбуке, «Вконтакте» небезопасно с друзьями общаться, чтобы потом не получить контекстную рекламу. А как повысить безопасность?

АХ: – Вопрос в том, что вы считаете допустимым уровнем безопасности. В принципе слова «безопасный» нет. Вопрос в том, что вы считаете допустимым. Некоторые считают допустимым через «Фейсбук» интимными фотографиями обмениваться, а какие-нибудь сотрудники спецслужб считают, что всё, что было сказано через рот, даже самому близкому человеку – оно уже по факту небезопасно. Если вы не хотите, чтобы соцсеть что-то узнала об этом, то да – лучше не писать об этом. Безопасных приложений я не знаю. Я боюсь, их нет. И это нормально с точки зрения того, что любому владельцу любого приложения его нужно как-то монетизировать, даже если это приложение бесплатное или это СМИ какое-то. Оно вроде как бесплатное, но ему всё равно нужно жить на что-то. Поэтому безопасного нет ничего. Вы должны только для себя решить, так сказать, что вас устраивает.

З: – А чем вы пользуетесь?

АХ: – Соцсетями?

З: – Из мессенджеров.

АХ: – Из мессенджеров я пользуюсь главным государственным мессенджером Российской Федерации – «Телеграмом».

З: – «Вайбер». Он безопасен?

АХ: – Слушайте, я не очень разбираюсь в мессенджерах. Честно говоря, я ни в защищённость, ни во что не верю, потому что это было бы, наверное, очень странно. Хотя «Телеграм» – это вроде как и open source, и его алгоритмы шифрования раскрыты. Но это тоже такая хитрая штука, потому что «опен-сорсный» там клиент, а серверов никто не видел. Думаю, что нет: в «Вайбере» очень много спама, ботов и так далее. Фиг знает. Мне кажется, это всё не очень хорошо работает.

Кто опаснее – корпорации или государство?
Ведущий (В): – А у меня к тебе вот какой вопрос. Смотри, ты пару раз вскользь об этом говорил – о том, что государство… Слишком много данных – это не очень хорошо… У корпорации слишком много данных. Ну, это просто жизнь, да? Так кого бояться больше – корпораций или государства? Где подводные камни?

АХ: – Это очень сложный вопрос. Он граничит. Сложный этический барьер. Человеку, если ему нечего бояться, если он не нарушал закон, в принципе ему зачем нужна приватность? Хотя я так не считаю – это государство так считает. Может быть, в этом есть какое-то зерно правды. Слушай, я боюсь больше всего хакеров – какую-то вот такую жесть. На самом деле самая большая жесть, которую я видел в жизни своей (из всей этой темы): где-то полтора-два года назад в Подмосковье поймали педофила и во время следственных действий у него на компьютере нашли несколько самоучителей по «Питону», скрипты, Api VK. Он собирал аккаунты девочек, анализировал, кто из них находится поблизости, собирал, контент, который они… Короче, ты понял. Вот это самая большая жесть, которую я видел. И этого я на самом деле боюсь, что в один прекрасный момент кто-то что-то подобное учудит.

Ещё один маленький «офтопчик»: Европейская организация государственной безопасности в том году делала доклад, что процентов где-то на 20, на 25 что ли увеличилось количество краж с банковских счетов, когда взламывали секретный вопрос. Подумайте просто сейчас о своём секретном вопросе в банке, и подумайте, смогу ли я узнать на него ответ из открытых источников. Если у вас там девичья фамилия матери стоит или любимое блюдо… В общем, люди анализировали аккаунты, на основании этого понимали кличку любимого питомца – как-то так…

З: – Вы говорили, что компании, корпорации собирают с помощью алгоритмов нужную информацию? Вы наверняка знаете как?

АХ: – Была движуха людей, которые одно время через специальный фильтр прогоняли фотографии, чтобы этот фильтр ломал анализ изображений, чтобы нельзя было потом как-то этих людей потом идентифицировать. Вот я вам приводил пример, что «Фейсбук» боролся с криптографией сообщений. И если эта штука появится и приобретёт массовый характер, наверняка соцсети будут с этим бороться. Плюс, распознавание образов сейчас работает очень хорошо, и это граничит с тем, что тот достаточный уровень, чтобы «сломать» эту фотографию (для того, чтобы «сломать» алгоритм, который распознаёт эти образы) – скорее всего, на ней уже ничего понятно не будет.

Всевозможные глич-фильтры хорошо работают, если это сильное прям смещение по половине фотографии. Ваш аккаунт тогда приобретёт все цвета ЛСД. Чисто теоретически я не считаю очень страшным, если «Фейсбук», например, узнает, какая у меня машина – наверное, если я в машине не буду авторизовываться через «Фейсбук».

Закон о забвении работает, но не в интернете
З: – Сталкивались ли вы с пользователем, который заставлял бы вас уважать его, удалить, получить доступ. Вы большими массивами данных оперируете, наверняка уведомляете об этом. Люди могут к вам обратиться. Сколько процентов?

АХ: – Сейчас расскажу. Вот сейчас будет на самом деле интересно. Сейчас посчитаю, сколько людей зайдёт, потому что после мероприятия всегда 15-20 % заходит, заполняет форму на удаление данных — есть такое. Реально это где-то 7-8 % закрытых аккаунтов, которые мы не анализируем, и примерно 5 человек из тысячи, которые просят свои данные удалить. Это очень мало, даже на мой скромный взгляд.

Проблема здесь в следующем: есть такая штука, как закон о забвении. Но закон о забвении, по крайней мере в России, юридически применяется только к поисковым системам. Там прям написано: поисковые системы. И то — это удаление только ссылок на материалы, а не самих материалов. Реально чтобы что-то удалить из интернета, придётся все эти источники обходить, поэтому я в это в принципе не верю. Мы стараемся пользователей предупредить о том, что нужно сначала подумать, прежде чем публиковать.

Пока этот процент очень мал — 5-7 человек из тысяч. К слову, о законе о забвении: все знают такой крутой кейс «Сечин против РБК». Закон о забвении сработал, статью удалили, но она есть везде. Понимаете, что если что-то когда-то попало в интернет, то оно оттуда уже никогда не пропадёт.

Пользователи удаляются, но их идентифицируют по типовому поведению
З: – Не считаете ли вы, что люди, которые удаляют свои аккаунты и пытаются стать «чёрной дырой», будут находиться в более невыгодном положении относительно остальных экономических агентов?

АХ: – Скорее всего, да — это положение будет невыгодно для них самих. Есть же куча всяких скидок, предложений, которые от них зависят. Но, чисто теоретически, если человек удаляет аккаунт сейчас… Популярно у всяких экстремистов, когда они удаляют аккаунт и делают фейк, но продолжают с тем же контентом взаимодействовать — этого человека, опять же, можно идентифицировать (особенно, если это в рамках одной социальной сети, с одного компьютера — это вообще вопрос); элементарно по модели потребления контента можно будет этого человека найти, если стоит такая задача.

Я надеюсь, что в ближайшие 5 лет появится какая-то технология монетизации этих данных, когда человеку реально можно будет заплатить деньги — ты сам заплатишь и мы твои данные использовать не будем. А я думаю, что если в каком-нибудь «Инстаграме» введут платную подписку, ею никто не воспользуется, поэтому альтернатива в том, чтобы платить пользователям за их данные. Но это не очень скоро, потому что лобби страшных корпоративных ребят не даст такой закон провести, хотя было бы прикольно. Но тут дело в том, что невозможно оценить реальную стоимость данных одного человека в какой-то конкретный момент времени.

«Фейсбук» – дырявые ребята
З: – Добрый день. Совсем недавно появилась новость о том, что «Фейсбук» намерен все свои проекты интегрировать, включая «Инстаграм» и «Фейсбук», «Воцапп» и так далее. Как, на ваш взгляд, с точки зрения персональных данных, когда сейчас у меня на смартфоне эти программы висят как бы отдельно, но они всё равно принадлежат Фейсбуку?.. Что будет дальше?

АХ: – Я понял. Юридически они итак принадлежат «Фейсбуку», и он может их бесконтрольно внутри себя объединять, поэтому думаю, что ничего не изменится. Единственное, что теперь достаточно взломать одно приложение для того, чтобы сразу всё получить. А «Фейсбук»… Я надеюсь, они смотрят. Страшно дырявые ребята вообще во всех местах.

В последнее время появилось очень много информации об этом — об утечках данных из «Фейсбука». Это же появилось не потому, что «Фейсбук» начал внезапно эти данные терять, а потому, что GDPR теперь заставляет компанию заранее предупредить. И самый огромный штраф — в том случае, если утечка произошла, а компания это умолчала, и поэтому «Фейсбук» сейчас сам об этом рассказывает. Это не говорит о том, что до этого этих утечек данных не было.

З: – Здравствуйте. У меня вопрос по поводу хранения данных. Сейчас каждое государство вводит закон по поводу того, чтобы данные граждан хранились на территории этого государства. Какое условие достаточно соблюсти для того, чтобы этот закон выполнять, для какого-то интернационального приложения?.. Вот, например, «Фейсбук»: база данных одна…

Каким образом, чтобы соблюдать эти условия?
АХ: – Слушайте, юридически вам достаточно просто сервер арендовать в этой стране и на него что-то положить. Проблема в том, что нет компетентного контролирующего органа. Данные «Фейсбука» в России не лежат. Роскомнадзор с ними борется-борется, борется-борется… У «Фейсбука» есть часть серверов, где лежит интерфейс этого самого «Фейсбука», и проверить невозможно, где по факту данные лежат, как они синхронизируются.

З: – Трафик проверить?

АХ: – Трафик проверить? Да. Но трафик же потом может в какую-то магистральную точку уйти. Плюс, между серверами может быть что-то типа VPN или ещё что-то. Чисто теоретически, никак невозможно проконтролировать, что, скажем, системный администратор в один прекрасный момент на этот сервер не зайдёт и что-то оттуда не заберёт. То есть этот закон сделан не ради защиты данных, а чтобы компании открывали представительства, платили налоги и хранили железо на территории страны. Но на мой взгляд, это какая-то очень странная инициатива, честно говоря.

З: – То есть достаточно фактически интерфейс проверить?

АХ: К вам может кто-то прийти и проверить, что у вас там данные лежат. Но вы можете показать какой-то «эксель», и никто не сможет это проверить, вряд ли кто-то это будет проверять. Сейчас просто по IP-адресам смотрят: что IP-адрес, привязанный к домену, находится на территории страны — дальше не проверяют. Теперь, наверное, ко мне придут проверять.

Нет сервисов, которым можно довериться на 100%, но порядочным людям бояться нечего
З: – Такая новость, много где перепечатанная: из «Майкрософта» чувак выложил, сделал сервис для проверки своих…

АХ: – Что-то типа: не утекли ли ваши пароли? На самом деле после тех же утечек в «Фейсбуке» тот же «Фейсбук» всегда запускает какие-то резервные сайты, на которых можно проверить, что он не попал в эту базу — опять же, GDPR это требует. То есть, если ты такую штуку не сделаешь, то тебе будет не очень хорошо. Поэтому все сейчас представляют эти проекты, как «это наша инициатива»; на самом деле закон это требует. На самом деле это очень крутая штука, но я бы не очень доверял подобным сервисам по проверке, если туда нужно отправлять что-то сложнее твоего пароля, потому что много у кого пароли одинаковые.

З: – Там просто e-mail вводишь, и уже говорят, сколько раз он был скомпрометирован…

АХ: – Я на самом деле не доверяю таким штукам, потому что привязать потом вас к этому браузеру, к реальному аккаунту очень легко. Особенно, если вы пользуетесь сервисами тех же людей, которые этот сайт запустили. Это как было в том году, когда «Фейсбук» прислал: если ваши интимные фотографии утекли в «Фейсбук», вы их нам отправьте, и мы проверим, где они упоминались.

Я не знаю, что это за пиар-кошмар и кто в «Фейсбуке» это придумал, но реально такое было. Они хотели сравнить, никто ли не пересылал в личных сообщениях вашу обнажёнку. В принципе это преследует благие цели, но максимально странно. Я бы этому не доверял.

З: – И ещё один вопрос. Для обычного пользователя насколько высоки риски утечки? Риски ущерба от утечек.

АХ: – Я вас понял. Смотря что за данные хранить. Я думаю, что не очень высокие. Самое страшное – если утекут куда-то e-mail’ы и пароли, а у вас этот пароль стоит везде – тогда да. Я вообще считаю, что пользователям мало чего стоит бояться. Но если они, конечно, не какую-нибудь расчленёнку хранят в гугл-почте. Очень много примеров было.

Самая известная история – в «Гугле», когда в Юте девочку похитили, её не могли найти, и в один прекрасный момент похитители прислали её фотки во вложении архивированном. И «Гугл», сканируя это вложение, обнаружил признаки детской порнографии. Всех нашли. А они ещё ухитрились на «Гугл» в суд подать за то, что они тайну переписки нарушили. Это разбирательство достаточно долго проходило. Но тем не менее я считаю, что обычному пользователю бояться нечего, если он не выкладывает, скажем, паспорт свой в открытый доступ. Это двойная история – смотря что за данные и что за пользователь. Может, сейчас – ничего страшного, а через 15 лет, когда он станет каким-нибудь чиновником, то его какие-то материалы всплывут.

Как работается с государством?
З: – Спасибо. Вы говорили немножко о том, что делаете исследования для государства, государственных органов, служб, работаете с ними. Может, немножко подробнее расскажете о каких-то актуальных проектах. Даже больше, если можете, про… Два вопроса: первый – актуальные проекты, а второй – были ли какие-то такие предложения от государственных служб…

АХ: – Неприличные!

З: – Да. Когда вы думали: может быть, не стоит этого делать.

АХ: – Я вам расскажу. Я это всем рассказываю. Мы с этим человеком в «Твиттере» долго ругались. Из команды Милонова в «Твиттере» мне как-то пришёл вопрос на поиск учителей, которые гей-порно смотрят. Мы сразу сказали, что нет. Но есть такие, письма часто приходят, и очень часто это связано с какими-то оппозиционерами, митингами. Мы такой ерундой не занимаемся, нас и так все говном обливают. Я этого не стесняюсь.

У нас по поводу «госов» следующая политика: мы разрабатываем софт, софт по трёхмерной реконструкции, распознаванию лиц, анализу данных. Что конкретно они делают, очень сложно сказать, но из моделей – это прогнозирование преступлений, то, что связано с госбезопасностью внутри города, перемещения людей, геомаркетинг и так далее. От размещения объектов внутригородской среды до идентификации педофилов, насильников, маньяков и всяких нехороших ребят.

Честное слово, никакими оппозиционерами мы не занимались. Может, нам не говорят об этом в лицо. На самом деле это очень большая проблема – сотрудничество с «госами», потому что не всегда же объясняют, что за задача. Тебе говорят: сделайте софт для идентификации домохозяек, а они на самом деле что-нибудь другое с ним собираются делать – у них там всё ломается.

Плюс, государство – это очень интересный и странный клиент, который постоянно пытается какие-то три копейки вставить в твоё исследование, и зачастую их подходы и понимание машинного обучения очень поверхностные. Например, у меня есть отдельная лекция об ошибках машинного обучения. Я там всегда привожу в пример, когда мы делали систему прогнозирования преступности в Подмосковье, заказчик сказал: там, где продают арбузы, увеличьте, пожалуйста, коэффициент раза в четыре. А потом на самом деле оказалось, что места продажи арбузов нифига некриминальные. Это просто ошибки того, что человек вносит свои мысли.

Короче, государство – прикольный клиент, там очень много интересных задач. Большинство сводится к подобным моделям прогнозирования чего-нибудь. Чаще всего это какая-то городская инфраструктура.

З: – А есть ли источники, где можно проследить за вашими исследованиями? Много информации. Как я понимаю, много её ещё за бортом осталось. Ваши страницы, ещё что-то…

АХ: – У меня нет личных страниц.

З: – Наверное, в «Фейсбук» уже закрыли?

АХ: – Где-то четыре месяца назад была история: они нам всем прислали такие большие письма, что «вы – уроды, Кремлю продаёте всё, нарушаете все правила «Фейсбука». Даже собаке моей прислали письмо: «Hello, Марс блу-корги, ты данные собираешь!» и так далее. Слушайте, у нас ребрендинг сейчас. Недели через две-три у нас сайт и всё обновится. За этим можно будет смотреть. Но мы очень ленивые просто в этом плане.

Интересно На чём корпорации вертели вашу приватность. Часть 2

Дополнительные настройки

Takeshi

Перо Дьявола