Среда, 18 сентября 2019   Подписка на обновления  RSS  Напишите нам
Популярно
Он может узнать о вас все: Артур Хачуян
20:30, 16 мая 2019

Он может узнать о вас все: Артур Хачуян


Артур Хачуян является создателем главного российского BigData-алгоритма. Он собирает различную информацию в Интернете из открытых источников и продает ее рекламодателям. На его серверах хранятся огромнейшие объёмы данных, среди которых лайки, места работы, семейное положение, статусы на странице «ВКонтакте» и многое другое. Об этом всем в подробностях Артур поделился в интервью с Ильёй Варламовым в шоу на ютьюб-канале «Лучшие в своём деле». Далее читайте основное из интервью.

– Привет, Артур!

– Привет!

– Почему ты здесь? Наше шоу называется «Лучшие в своём деле», и почему-то ты сидишь напротив меня. Надо, чтобы зрители поняли.

– У нас есть несколько компаний, и мы разрабатываем систему искусственного интеллекта для обработки больших данных. Мы умеем анализировать открытые источники, вычленять из них знания, собирать геоинформацию, обрабатывать чеки, банковские транзакции, знание о людях (как часто они путешествуют, какое порно они смотрят). Умеем по фотографиям из открытых источников делать трёхмерную геометрию лиц, сравнивать их. В общем, много чего, вплоть до автопилотов для дронов.

– Я понимаю что такое BigData и я как-то говорил с человеком, который в штатах работает в Убере. Он мне рассказал что компания Убер знает о пользователях. И я офигел, потому что Убер знает не только, где я работаю и живу, он знает, когда я выпил, и когда нет. И алгоритм понимает, что я заказываю, и может подсунуть мне цену побольше.

– Да, эти знания будут проданы на рекламные площадки и различным компаниям. Самое главное еще, что ты на это все согласился, когда подписал соглашение с Убером.

Артур Хачуян

– Ну, это отдельная тема, что никто никогда ничего не читает, а там все написано. Что сегодня соцсети знают о своих пользователях?

– Важно здесь понимать, что есть вещи, которые соцсети знают и которые могут использовать. На самом деле, они могут использовать не такое уж большое количество данных. Они, например, могут анализировать твои личные сообщения. Нужно понимать, что юридически они не имеют права этим пользоваться, но доказать это невозможно.

– Это байка или нет, о том, что можно прослушивать микрофон?

– Есть несколько вариантов развития событий. Первое, что люди забыли о том, что взаимодействовали с каким-то контентом. Второе, они попадают в какую то статистическую выборку. То есть анализ аудио есть, но нужно понимать, что это не потоковый анализ аудиозаписей. Идет просто анализ ключевых фраз, из-за которых потом, по сути, на тебя навешиваются ярлыки. Но потокового распознавания аудио в реальном времени нет, просто потому что это никак не выгодно экономически.

– На сегодняшний момент какие данные точно анализируются?

– Данные профиля, все данные того, что ты пишешь, и весь твой медиаконтент, который публикуешь. Он раскладывается на то, кто говорит, что говорит, про кого и так далее. Также геолокация, геоперемещение.

– С какими обычно заказами к тебе обращаются компании, чего они хотят?

– Это либо исследования, когда есть какая-то аудитория, и мы хотим понять, кто она. Из этого вытекает вторая задача – таргетинг, поиск потенциальной аудитории. Третье –  это геомаркетинговые исследования, когда мы хотим понять, где лучше открыть бизнес, точку продаж и т.д. Четвертое –  это веб-аналитика. Мы умеем привязывать людей, входящих на сайт, к всевозможным способам получения данных. Пятое – это системы, которые генерируют контент.

– А что делать, если человек параноик и боится, что за ним будут следить?

– Это зависит от человека, и того, чего он все-таки боится. Я, например, писал матом в Фейсбуке, на меня за это писали доносы, но мне все равно. Но идём дальше, и от владельца социальной сети переходим к страшному государству, которого почему-то все так боятся. Но на самом деле стоит бояться не государства, а компаний, которые владеют ресурсами. Потому что Фейсбук захочет завтра начать манипулировать поисковой выдачей, и можно хоть переворот в стране сделать, это не важно.

– Любой человек, который хочет вести полноценную жизнь тратит либо кучу ресурсов, чтоб скрываться, либо ведёт некомфортную жизнь (не пользуется заказами и т.д.)

– Почему? Ты можешь прийти, например, в Сбербанк и написать им на листочке, что «согласно федеральному закону 152, части 14, прошу вести обработку и учёт моих персональных данных в письменном виде на бумажном носителе». Тебя могут, конечно, послать к какому-нибудь менеджеру, но чисто теоретически – тебе не могут отказать.

– Опиши портрет нормального клиента банка на сегодня.

– 3 раза в год путешествует, останавливается в дорогих отелях. Суть в том, что мы видим, когда человек прилетел и улетел, в какой город, в каком отеле зачекинился в отеле, заходим на букинг и смотрим, сколько в это время стоил отель. Соответственно из этого рассчитываем, сколько денег он потратил на отдых.

– Относительно блогеров, чем нужно заниматься блогеру, чтобы у него стояла очередь из рекламодателей?

– Косметикой какой-то. Самая популярная отрасль – это бьюти индустрия. Там приходят какие-то сумасшедшие и странные заказы. Недавно нас просили написать алгоритм по распознаванию девушек, у которых нюдовая помада.

– Я правильно понимаю, что Цукерберг – это в мире человек номер один, который обладает таким огромным массивом данных?

– Нет, Цукерберг это вообще странная и мерзкая персона, которую большое количество людей очень не любят, потому что алгоритмы Фейсбука не очень точные, интерфейс там тормозной, данных у них есть много, но они постоянно их теряют. Вот сейчас постоянно происходит волна каких-то утечек данных с Фейсбука. Раз в месяц есть новость, что оттуда что-то украли.

– Чего ожидать в будущем?

– Вообще сейчас грядет эпоха дипфейкс, в которой цифровые подделки будут неотличимы от правды. Мы увидим и военный конфликт несуществующий, и теракты, и все что угодно, потому что можно делать какие-угодно фотографии и генерировать их так, как надо.

Еще появится единый центр здравоохранения. В России опять делаются какие-то безумные проекты, они вряд ли сработают, но данные здоровья в ближайшие пять лет выпадут в открытый доступ. Также есть проблема того, что объем данных растёт колоссально, и у простых граждан атрофировался метод фильтрации этих данных. Люди не могут понять, где достоверная информация, а где нет.

В ближайшие пять лет, если не произойдёт какой-то перелом, то мы все утонем в информации – правдивой или нет. Нам и государство будет что-то подмешивать, и частные компании, и узкие американские хакеры, и вообще кто угодно. Что касается слежки и идентификации, то у нас в Москве 170 000 камер наблюдения с технологией распознавания лиц работают офигенно круто.

Поделиться:

Добавить комментарий

© 2017 - 2019 Новости Запорожья и области. Лента свежих Запорожских новостей – AngolenkoNews