Интересно Зачем за нами следят в соцсетях и кто продает наши данные? Часть 2

Takeshi

Перо Дьявола
Команда форума
PR-group
CPA & Трафик
Регистрация
23 Янв 2019
Сообщения
1,351
Баллы
0
Общие продажи
0$
Общие покупки
0$
Обратите внимание, пользователь заблокирован на форуме. Не рекомендуется проводить сделки.
И.: Или делаете из них какие-то определённые выводы. Если практически к этому подойти, можно ли, например, установить, условно говоря, сексуальную ориентацию человека, который её не афиширует, и узнать соотношение в обществе? В процентном соотношении.


А. Х.: – Можно, да. На самом деле это очень легко делается, потому что люди (я просто очень много проводил таких экспериментов по «Тиндеру» и по прочим социальным сетям для знакомств)… Люди, как правило, группируются в кластеры, и даже если они внешне скрываются, можно понять, кто с кем как коммуницирует внутри этих кластеров. Это одна из запретных метрик, которую мы не передаём клиентам.

И.: – Но какие алгоритмы для этого могут быть использованы? Какие данные для этого могут быть использованы?

Как по лайкам человека понять о нем все
А. Х.: – Самая основная, наверное, история – это контент, который человек потребляет. Это лайки. Все сейчас считают, что их никто не видит. А это действительно так, и нельзя никаким техническим методом получить лайки какого-то конкретного пользователя, не собрав весь контент, который находится в социальной сети. Для решения конкретно этой задачи достаточно какого-то узкоспециализированного контента – например, вы возьмёте и соберёте всё порно во «Вконтакте», крупнейшем порно-трекере и, соответственно, посмотрите, кто его лайкал (а для «Вк» это примерно каждый восьмой пользователь лайкает порно – до сих пор мы не понимаем почему). Соответственно, потом на основании этого можно всех людей условно сегментировать, скажем так, по интересам.



Мы два или три года назад с «Лайфом» проводили такое исследование, когда был «праймериз» «Единой России», и они обязали всех ребят, которые собираются пойти в «Единую Россию» (4400 кандидатов)… Где-то на 600 из них подали свои аккаунты в социальных сетях – мы посмотрели, какое порно они лайкают. Там было очень смешно: где-то 70–75 человек засветились в такой, нелицеприятной активности – кто-то Навального лайкал, кто-то – «Роспил», кто-то – детскую порнографию. В общем, это было смешно.



Всё это ведёт к тому, что мы пытаемся пользователям объяснить: что бы вы ни делали, всё это попадёт в открытый доступ. Потому что сейчас люди не понимают, что то, что говорится в открытом доступе – оно действительно в открытом доступе, и ты это никак не сотрёшь оттуда, никак не избавишься.



И.: – То есть люди думают, что они рассказывают о себе в профиле в своей социальной сети, а больше можно узнать по тому, как они лайкают? Если раньше гадалка гадала по руке, то теперь вы берёте, анализируете лайки и получаете анализ предпочтений.



А. Х.: – Да, по употреблённому контенту можно понять всё, что угодно. Кто этот человек: домохозяйка, мама с ребёнком, какие у неё интересы вообще? И самое главное, что с точки зрения бизнеса на основании этого можно сделать прогноз: какой продукт человек купит через неделю, месяц, полгода, год. Вот, у нас есть мужчина, у него только что родился ребёнок, мы знаем, что у него есть машина – мы ему сразу предлагаем детское кресло. Да, или это, например, молодая девушка, которая зашла, скажем, на сайт интернет-магазина, её идентифицировали, мы знаем все её фотографии за последние пять лет в «Инстаграме», какого цвета верхнюю и нижнюю одежду она одевала, в какую погоду, в каком эмоциональном окрасе и так далее – и. собственно, предлагаем ей идеальный вариант.



Как узнать телефон человека
И.: – Я понимаю, что вы не используете эту информацию в открытую, не передаёте, но можно ли узнать более, скажем так, интимные данные о человеке – узнать номер телефона, хотя он нигде его не выкладывает у себя в профиле, узнать, как он передвигается по городу, где он находится в данный момент.



А. Х.: – Можно. Первая история, связанная с номером телефона: все всегда попадаются на каких-то досках объявлений – это реально бич всех. Я вам такую историю приведу: мы когда-то давно делали исследование под надзором компетентных органов: значит, дали «скрипту» денег, чтобы он закупил наркотики у разных ребят – в «Торе» там, в «Телеграме» и так далее. Но только у тех, у кого из них был известен номер телефона, и этот номер телефона можно было как-то деанонимизировать.

И.: – «Скрипт» – это автоматический робот?

А. Х.: – Да, конечно. Соответственно, большинство вот этих вот начинающих наркобарыг погорели на следующем: у них номер телефона реально чистый, не привязанный ни к чему, ни к соцсетям. Но они на «Авито» что-то продавали! Поэтому можно понять, где они территориально находятся, потому что все рядом со своим местом жительства продают. Ну и, соответственно, кто они. Потому что по тем товарам, которые человек продаёт, тоже можно сделать некие предположения о том, кто этот человек. Ну и, соответственно, мы потом сопоставляли места, где они живут, и места, куда они ездят оставлять «подарочки».



Как помогать родителям контролировать детей в соцсетях


Мы однажды запускали проект по анализу действий несовершеннолетних (родительская опека). Тогда он ещё назывался «Родительский контроль. Мы себе выбрали тогда такой смешной слоган: «Лучше мы, чем ФСБ». На самом деле была абсолютно благая идея: мы собирались предупреждать родителей несовершеннолетних о том, что ребёнок какую-то непотребщину производит. У нас сейчас около семисот тысяч несовершеннолетних ежедневно пишут какую-то хрень, за которую к ним могут прийти и по головке их не погладить: хачей сжигать, стёкла бить и так далее. Мы подумали (как разработчики госалгоритмов зная, какой уровень некой «экстремистости» должен набрать человек до того, как государство проведёт с ним некое целевое действие), что правильнее предупреждать родителей. Ну, в общем, сторонники Навального, в частности Алексей Булков, не очень правильно восприняли эту новость – в «Фейсбуке» написали кучу всякого гнева. Было смешно, но когда ты получаешь 5-тысячный комментарий «Когда Навальный станет президентом – такие, как ты, будут сидеть в тюрьме», как-то не очень комфортно…



Но на самом деле мы к этому спокойно относимся, потому что люди просто не понимают, что происходит. То есть они – вот, сволочи, из Сколково будут собирать личную переписку, геоперемещения… Ну, там по каждому пункту… Мы к Сколково вообще никакого отношения не имеем. Какие геоперемещения, какие «чекины»? Ну, в общем, какие личные сообщения? В общем, как-то так.




И.: – Типа, взрослых кошмарят на митингах, и вот, за детей взялись… Какие-то были интересные результаты «Родительского контроля»?

А. Х.: – Да, на самом деле вся эта история «стартанула» сначала из исследования: мы решили взять 30 тысяч случайных несовершеннолетних, которые совершают какую-то непотребщину, найти их родителей и написать ботами их родителям: смотри, твой ребёнок написал, что завтра пойдёт сжигать хачей (и там какая-то цитата и так далее). Ну, в общем, где-то 99,8% родителей нас послали в жопу и сказали: вы вообще кто такие, что вы делаете? А мы абсолютно мирные, честные посылы написали: обратите внимание, данный материал в реестре запрещён и так далее, и тому подобное. В общем, нас все послали в жопу. Мы поняли, что у нас люди очень любят истерить по поводу паранойи – государство лезет в трусы, но на самом деле они настолько халатно относятся к своим данным, что очень сложно им что-то объяснить. Просветительская работа – она самая мерзкая, самая неблагодарная.



Как производители фитнес браслетов и смартфонов зарабатывают на данных о своих клиентах


И.: – А правильно ли я понимаю, что некоторые компании, как «Джабон», которая делает браслеты для активности…

А. Х.: – Финтес-трекеры.

И.: – «Хуавей», которая делает смартфоны… Помимо продажи гаджетов, они очень хорошо зарабатывают на том, что знают о своих клиентов очень много и продают их?

А. Х.: – Да, продают, как правило, знания об этих людях среднестатистические, начиная от американского Минздрава, заканчивая «мэтчингом» этих данных с «Фейсбуком» по привязанным аккаунтом и продаже этих историй рекламным площадкам. Это тоже вроде как не очень этичная история, но с другой стороны, как бы проблема здесь в людях, которые не читают соглашение. В соглашении написано, когда и кому будут передаваться данные, в каком объёме.



Как невинный гаджет раскрыл расположение американских военных баз


Но ещё был такой интересный кейс (не знаю, сталкивались ли вы). Есть такое приложение «Страва» – это фтинес-трекер. Они в начале этого года сделали очень крутой проект. Они сделали карту: весь мир — гигантская тепловая карта того, как люди бегают, катаются – в общем, треки, их фитнес-треки. И на самом деле компания даже не подумала о том, скольких людей они засветили. Все военные базы секретные США в Сирии, Ливии были подсвечены.



И.: – То есть по карте это официально просто пустыня, в которой…

А. Х.: – Да. В какой-нибудь сирийской или ливийской пустыне, где как бы ничего нет, там есть такие треки людей, которые каждый день там бегают очень и очень активно. Получается, что они «спалили» кучу военных баз в Америке и так далее. Это всё очень быстро подчистили, но тем не менее вот такой интересный прецедент был.



Приложения для знакомств – самый надежный источник приватных данных


И.: – Тот же самый «Тиндер» – один из самых любимых источников информации для вас.

А. Х.: – Мой, да. Потому что там есть реальные интересы людей – можно по фотке «смэтчить» «Фейсбук» собственно с «Тиндером», и там вообще есть информация, что этому человеку реально интересно, что он делает и так далее: люблю охоту, рыбалку и… как-то так. Есть очень много систем, которые прогнозируют явку на выборы, политические предпочтения, кто за какую партию проголосует. Здесь, единственное, есть момент о том, что у нас большое количество электората – оно не очень цифровое. Как-то так. Но даже о них можно некие знания понять. Там… Кто где в ЖКХ ругался, судился с кем.

И.: – По каким данным?

А. Х.: – Открытый Госреестр и Госправосудие, Суд РФ. У нас судебная практика почти полностью открыта. Там не очень качественные данные, но они открыты. Есть там… служба судебных приставов, жёлтые страницы, сайты ЖКХ региональных. Отовсюду можно собрать кусочки информации.



Как данные из соцсетей могут повлиять на российскую политику


И.: – Но самое простое – это сбор информации про людей с оппозиционными взглядами, насколько я понимаю? Они молоды и активны.

А. Х.: – Да, конечно, есть такое.

И.: – Как ты думаешь, как это в будущем может изменить общероссийскую политику – использование Big data?

А. Х.: – Думаю, что вряд ли особо сильно как-то. Поясню почему: потому что в данной ситуации всем понятно, кто у нас выборы выигрывает – не потому, что они нечестные, а просто потому, что вот так большинство голосует. Поэтому здесь единственное, для чего могут быть использованы Большие данные – думаю, для повышения явки и как-то правильной работе с лидерами мнений, сегментация, агитация. Сейчас очень много приходит запросов на предвыборные кампании мэра в Москве. Ну, всем понятно, кто мэром станет – не потому, что куплено, коррупция – все проголосуют за Сергея Семёныча, с этим ничего не сделать. И у остальных кандидатов задача набрать минимум какой-то или, как в Госдуму, они процент какой-то должны набрать. Вот, как-то так.



Значение сбора данных из соцсетей в победе Трампа


Но такого успеха, конечно, как у президента США, вряд ли здесь удастся добиться: во-первых, потому что у нас вот такая вот выборная система; а во-вторых, я не очень-то верю в успех президента США. Я думаю, 30-40% ему реально микротаргетинг принёс, но не космическую победу.



И.: – Расскажи, что там за алгоритмы могли быть использованы?

А. Х.: – Там всё было на самом деле очень просто. Все сейчас пинают «Кембридж-аналитику» за то, что они якобы что-то где-то нарушили, но по сути дела никто не сидит в тюрьме по очень простой причине: потому что законы нарушены не были. Была куча тестов в «Фейсбуке», какой-то «пирожок»… Ну знаете, их полно. Люди проходят эти тесты и никогда не читают лицензионные соглашения. А там всё чётко: данные их используются для продажи на рекламную платформу. Люди проходят абстрактные тесты, какой-то пирожок или какой-то хлебушек, красный или синий, – на основании этого они делают психометрические выводы, за кого человек будет голосовать. Но там важно, не за кого человек будет голосовать – важно понять, какая у него проблема: мексиканец, который боится не получить работу или американец, который боится её потерять из-за мексиканцев – эти люди группируются в маленькие группки, и потом условный президент в виде таргетированной рекламы этим людям говорит: мы вам поднимем зарплату, а вам отменим обамовское здравоохранение, вам запретим (мексиканцам) работать, вам – разрешим (мексиканцам) работать.



То есть это такой условный микротаргетинг, который показывает каждому человеку не двухчасовую прямую линию с президентом, а какие-то определённые моменты, то есть реальные проблемы, которые президент собирается решить.



Можно ли предсказывать преступления и искать преступников через соцсети


И.: – Скажи, пожалуйста, как вы ищите антисоциальные какие-нибудь элементы – педофилов, маньяков, убийц? Можно ли вообще предугадать, что это случится, что человек совершит преступление, или как его эффективно предотвратить?



А. Х.: – Тема предотвращения преступлений сейчас – одна из самых активных в мире. Мы очень активно вкладываемся в эту историю, пытаемся её трансформировать. Основной из кейсов, который у нас есть – это система для расстановки ППС. Это алгоритм, который с утра «генерит» информацию, куда нужно поставить патрульно-постовую службу в зависимости от задачи. Фанатов ли мы хотим оприходовать, либо мы хотим снизить уровень криминогенной активности (кражи, насилие), или хотим наркобарыг поймать. То есть мы собираем определённый набор данных, делаем из этого выводы, смотрим на нашу какую-то статистику историческую и говорим: сюда, сюда, сюда, в такое-то время, ехать они должны таким-то образом; и наш некий целевой показатель снижаем.



Наш максимум в Подмосковье… Сколько мы делали? Ну, где-то 7–8% — мы снижали криминогенную активность где-то – это кражи домашние, это уличные грабежи. Это максимальный показатель, которого нам пока удалось добиться.



Что касается маньяков и всех прочих ребят, когда мы встраиваемся в процесс добора каких-то дополнительных улик – здесь стандартный кейс такой: вот есть среднестатистический следователь, на него пришло какое-то убийство; всё, что он может потребовать с мобильного оператора, когда пройдёт суд и полтора года после суда – это он получит, не знаю… 300 тысяч номеров мобильных телефонов вокруг какой-то конкретной геоточки. Сделать с ними он ничего не может. Он загружает эти номера к нам, мы, соответственно, можем оставить из них 5–7 людей, которые были как-то связаны, находились рядом с ними, можно поговорить с ними и так далее. А все остальные, может, мимо просто на машинах проезжали.



Есть ещё история, связанная с фанатами, тоже очень популярная история. Вот сейчас, перед чемпионатом у нас стадионы покупают системы удалённой идентификации, для того чтобы: когда отбитый фанат заходит на сайт – и ему говорят – билетов нет, или он приходит потом на стадион, его там распознают – и его не пускают, потому что он написал у себя в «Инстаграме», что «завтра идём мочить русских», там, на «Локомотиве»… Вот как-то так.



Что касается педофилов, мы достаточно давно, к сожалению, в этой теме, и там есть одна очень большая проблема. Мы где-то четыре года назад начали этим заниматься: сделали ботов, которые путешествуют по интернету, общаются со взрослыми мужиками на форумах определённых и пытаются как-то с ними пообщаться и какие-то факторы выделить их поведения, запросы и так далее. Это работало слишком хорошо: слишком много людей было найдено – столько людей наша правоохранительная система через себя пропустить не может. А главное, что по текущему законодательству человека нельзя посадить за лайки в соцсетях, и это хорошо, подчёркиваю – хорошо. И как бы нельзя человека посадить за намерение совершить какой-то акт. То есть в данном случае мы можем только сгенерировать рекомендацию, и дальше участковый должен как бы пойти и кого-то за руку поймать. А это, сами понимаете, работает в 100 тысяч раз медленнее, чем работает алгоритм.



Можно ли навсегда удалить свои данные из интернета?


И.: – Могу ли я вообще удалить что-то из интернета или это абсолютно?..

А. Х.: – Это практически невозможно, потому что необходимо будет общаться с каждым владельцем каждого ресурса. Есть так называемый закон о забвении, который вроде обязывает всех это делать, но юридически он распространяется только на поисковые системы. У нас лично есть форма на сайте для удаления данных о себе, но нельзя нам в дальнейшем запретить эти данные о людях собирать, потому что законодательство текущее не очень хорошо работает.



Как соцсети могут помочь утечке моего пароля?


Такая есть ещё интересная статистика: в начале этого года Международная ассоциация банков делала очередной обзор о информационной безопасности – у них был такой интересный показатель: возросли в шесть раз кражи с денежных счетов, когда был взломан секретный пароль. То есть: вы сейчас подумайте о своём секретном пароле… Что у вас там стоит – кличка животного девичья фамилия матери и подумайте о том, могу ли я узнать эти данные из открытых источников? Могу ли я узнать кличку домашнего животного, любимое блюдо или девичью фамилию матери из открытых источников. Соответственно, я могу зайти в банк, восстановить пароль и взломать ваш банк. Вот, Европейская ассоциация – у них в 6 раз увеличились кражи именно по этой статье, потому что люди ставят ответ «кличка домашнего животного», а потом пишут в «Фейсбуке» кличку домашнего животного. Собственно, вот как-то так. Мне кажется, через пять лет кошмар совсем будет происходить, потому что текущее поколение – они не понимают, что соцсети – это навсегда, что это открыто, что если сейчас какая-то девушка станцует пьяная на столе, а через 20 лет она станет классным руководителем, то все дети смогут найти это видео из архивов и потом начать шантажировать.



И.: – Ты себя не чувствуешь таким… злым гением немножко, потому что ты обрабатываешь данные людей всё-таки не в интересах их самих, а такого условного «большого брата»?



А. Х.: – Есть такое на самом деле, да, но у меня есть такая отмазка, которой я собственную совесть успокаиваю: возьмём, например, кейс – человек уволен за то, что он набухался (это реальная абсолютно история), человека уволили (ну там, пьяный в сториз выложил и его спалили и уволили). Моя концепция следующая: если работодатель захочет за ним следить – он за ним будет следить, по открытым источникам или по закрытым источникам; если государство хочет следить за человеком, оно может это сделать любым образом – оно может прослушку ему поставить, а может посмотреть его публичные фотографии. Я в этом случае бренд «Калашников» – можно тысячу людей убить карандашом, а можно расстрелять их из автомата; плохо, печально, но я, как инженер, придерживаюсь концепции, что не оружие убивает людей, а люди. Вопрос в том, кто эти данные получит и как он ими будет распоряжаться.



Но, конечно, все с моей концепцией не согласны. Они считают (цитирую с комментариев в «Фейсбуке»): «Так же и Гитлер оправдывался»! или «Так же, типа, эссесовцы оправдывались!» Те данные, которыми мы оперируем – люди сами их отправили в открытый доступ; мы просто научились из этого извлекать факты.



Как приложения для знакомств станут более эффективны


И.: – Мне кажется, вы можете заработать ещё больше денег, если просто будете искать пару для людей идеальную на более крутом уровне, чем это делает «Тиндер» или кто угодно.

А. Х.: – Да, ждите конца года – мы сейчас работаем над приложением для знакомств.

И.: – То есть люди всё-таки будут счастливее, счастливы?..

А. Х.: – Моё идеальное приложение для знакомств – это не «Тиндер», не «магазин мяса», мой идеальное приложение – это когда ты зашёл, авторизовался соцсеточкой (мы получили минимум информации) и тебе сразу же предложили идеальных кандидатов. Наша главная в этом случае проблема – определить текущую эмоциональную, психическую стадию человека, чтобы понять, кого ему конкретно подбирать. Что ему сейчас нужно: секс на один раз, любовь всей жизни, ну и так далее. Мы уже достаточно долго работаем над этим вопросом.



Неожиданные результаты исследований проституток


И.: – Слушай, как можно опознать человека, которому нужен секс на один раз по его социальным сетям, по фотографиям?

А. Х.: – Фотки… Ну, сложно сказать. Есть такое среднестатистическое, может, у кого-то представление: фотки алкоголя – одинокий холостяк, просмотр порно… Давно мы делали исследование: мы брали 20–30 тысяч проституток со всяких разных сайтов, по фоткам их «мэтчили» в соцсетях и делали исследование, какие ВУЗы они заканчивали. Ну, соответственно, смотрели, как они с людьми коммуницируют.

И.: – То есть вы искали зависимость между образованием и их положением?

А. Х. – Да. Нет никакой зависимости на самом деле. Вообще. Как в МГИМО есть такие девушки и мальчики так и в каком-нибудь урюпинском ВУЗе. Нет никакой зависимости.

И.: – Это народная профессия?

А. Х.: – Да. Древнейшая народная профессия.