Алгоритм бога. Скоро о нас будут знать всё
Link fluence это программа созданная специалистами для социальных медиа и исследования данных. Его целью является разработка технологии, которая позволит прогнозировать различные виды поведения людей. Поведение, в основном, социальные. Источником знаний является Big Data.
Что такое? Это анализ огромных наборов различных данных, основанный на исследовании информации, поступающей от сотен тысяч и миллионов единиц. Ее задача - предсказать, как поведет себя выбранная лицо, либо определяется выбранный параметр группа людей.
Для Link fluence дает возможность сбора и анализа того, что пользователи добровольно выражают, комментируя в интернете (данные декларативные). Это также означает возможность наблюдения за тем, что они делают. Big Data - это новый продукт, который позволяет наблюдать за обществом. Его большим преимуществом является то, что он практически не обнаруживается.
Эта же техника позволила проанализировать кошмары Википедии, то есть вандализм страниц. Этот тип вандализма чаще всего это касается статей, посвященным спорным вопросам.
О том, что Big Data может быть полезным для прогнозирования поведения общества нас убедил Нейт Сильвер, ученый, который предсказал исход последних президентских выборов в США. Ключом к его успеху было именно использование Big Data.
Тогда почему ученые не хотят повторить методологии Сильвера и предвидеть будущее? Исследователь опирался в значительной мере на традиционных опросах. Реальной целью ученых является создание такой методики, которая позволит использовать анализ "Больших данных" с помощью цифровых следов, которые мы оставляем за собой в сети Facebook, в поиске, в Twitter, во время совершения покупок онлайн. А следов этих с каждым годом все больше и больше.
Этот метод можно назвать основным или Божественным Алгоритмом. Это напоминает поиски святого Грааля. Заключается в поиске абсурдных, но точных попаданий между казалось бы несвязанной друг с другом информацией.
В 2014 году Французский Ржд заказал анализ данных о количестве пассажиров. С помощью общедоступных данных, кто-то нашел корреляцию между количеством пассажиров, пользующихся любой станцией с количеством парикмахерских, работающих вблизи станции. Хотя это и правильный метод, математически его не следует использовать для прогнозирования числа людей, которые используют станции. Абсурдно корреляции могут появляться случайно, однако, может стоять за ними скрытые переменные. Скорее всего, однако, чем популярнее станция, тем больше магазинов и салонов находится в непосредственной близости. Или настанет день, когда машины будут в состоянии понять важность найденной корреляции? Похоже на то, что Божественный Алгоритм все еще является Святой Граалем.
В Link fluance знают, что на данный момент информации, которую делает среднестатистический пользователь все еще недостаточно. Одновременно понимают, что количество следов, которые мы оставляем за собой, пересекая цифровое пространство, растет. И все это в гигантском темпе. Все больше и больше соединяется наша цифровая и реальная деятельность. Смартфоны находятся с нами везде, и хотя бы из данных определения местоположения, можно сделать много выводов.
Отдельным вопросом остается вопрос доверия в социальных опросах, проводимых алгоритмами. Анализ Big data может быть чреват риском манипуляций. Мы живем в мире, в котором правят числа. Вспомним, однако, о том, что искусство манипулирования данными применяется уже давно, как в бизнесе, так и политике.