|
Понравилась статья? Поделитесь с друзьями:
|
|
|
|
|
|
|
Автор обзора Галина Манькова
(студентка 3 курса факультета мировой экономики НИУ ВШЭ)
Рубрику ведет
Илья КАШНИЦКИЙ
|
Leveraging Facebook's Advertising Platform to Monitor
Stocks of Migrants
Zagheni, E., Weber, I., & Gummadi, K. (2017). Leveraging
Facebook's Advertising Platform to Monitor Stocks of Migrants.
Population and Development Review, 43(4), 721-734. https://doi.org/10.1111/padr.12102
|
Для выявления, объяснения и предложения эффективных
решений проблем современного общества требуется доступ к большим
массивам данных, максимально подробно описывающим как население
отдельных регионов, так и всё человечество в целом в текущий момент
времени. К сожалению, традиционные источники данных чаще всего не
соответствуют этим критериям. Эмилио Зажжени, Ингмар Вебер и Кришна
Гуммади видят решение этой проблемы в использовании принципиально
новых информационных источников - баз данных различных Интернет-ресурсов:
социальных сетей, поисковых систем и т. д. В своей статье они рассматривают
целесообразность использования данных, предоставляемых рекламной
платформой Фейсбука, Adverts Manager, для наблюдения за количеством
иммигрантов в разных регионах и странах.
Adverts Manager позволяет бесплатно оценить размер
выборки, состоящей из активных пользователей Фейсбука за текущий
месяц, которые соответствуют предварительно заданным на платформе
критериям (возраст, пол, место жительства, интересы и т. д). Главные
преимущества этой платформы как источника информации - большая (примерно
1,9 млрд человек) и неоднородная база данных, а также использование
не только данных, указанных непосредственно пользователем в своём
профиле, но и активности пользователя на Фейсбуке и партнёрских
сайтах. Однако у Adverts Manager есть и существенный минус - отсутствуют
чёткие определения критериев, по которым осуществляется выбор пользователей;
такие определения можно найти только в статьях исследователей, работающих
в Фейсбуке.
Чтобы убедиться в релевантности информации, предоставляемой
Adverts Manager, авторы статьи строят модель, выявляющую схожесть
оценок количества иммигрантов, полученных с помощью этой платформы,
с оценками, предоставленными проверенными традиционными источниками.
С помощью этой модели авторы проверяют значимость данных, необходимых
для решения двух исследовательских задач: оценок количества совершеннолетних
мигрантов разной национальности в штатах США и в 96 странах, имеющих
более 1 млн активных пользователей Фейсбука за месяц. Традиционный
источник для первой задачи - "Исследование Американского Общества"
(2014) (American Community Survey (2014)), для второй задачи - оценки
Всемирного Банка (2015).
Данные о количестве иммигрантов были получены из Adverts
Manager с помощью категории "Иммигранты (название региона)"
(Expats (*)). Алгоритм платформы определял пользователя Фейсбука
как иммигранта, если он указал разные города в категориях "Текущее
место проживания" и "Родной город" в своём профиле
и/или как минимум двое из его друзей проживали в стране, заданной
исследователем как родная, а двое - в стране, указанной как принимающая.
Результаты модели, полученные для каждой из исследовательских
задач, представлены на Рисунках 1 и 2. Как видно из этих графиков,
существует сильная корреляция между оценками количества иммигрантов,
полученными Adverts Manager и традиционными источниками. Тем не
менее, имеются незначительные смещения показателей Adverts Manager
по сравнению с традиционными источниками: в первом случае наблюдается
преимущественно занижение показателей, во втором случае - как занижение,
так и завышение. В обоих случаях результаты модели отличаются высокой
надёжностью (коэффициент детерминации для первого случая равен 0,94,
а для второго - 0,6).
График 1. Согласованность оценок доли иммигрантов в
штатах США, полученных Фейсбуком (2016) и "Исследованием Американского
Общества" (2014)
График 2. Согласованность оценок доли иммигрантов по
данным Фейсбука (2016) и Всемирного Банка (2015) в странах, имевших
более 1 млн активных пользователей Фейсбука за месяц
Далее исследователи устраняют систематические ошибки
модели, добавляя дамми переменные для каждой возрастной группы и
национальности иммигрантов. Также авторы статьи предлагают оценивать
не всю совокупность иммигрантов определённой национальности, а отдельные
половозрастные группы. Усовершенствованная модель действительно
оказалась надёжнее своего первоначального варианта: её средняя абсолютная
ошибка составила всего 37%, тогда как для первоначальной модели
этот показатель был равен 56%. Кроме того, усовершенствованная модель
позволила выявить некоторые закономерности в ошибках Adverts Manager:
по сравнению с традиционными источниками, платформа обычно переоценивает
доли молодых (от 20 до 34 лет) иммигрантов в регионе и недооценивает
доли иммигрантов в возрасте 35 - 59 лет.
Таким образом, исследователям удалось продемонстрировать
адекватность демографических данных, предоставляемых Фейсбуком.
Следовательно, его рекламная платформа Adverts Manager может быть
использована демографами для решения самых разных задач: изучения
многочисленных социально-демографических показателей, вовлечения
в прохождение опросов малочисленных и/или географически удалённых
от исследователя групп населения и т. д. Однако авторы статьи отмечают
и недостатки использования данного источника информации: его данные
могут быть недостоверными, поскольку не всё население мира имеет
профиль на Фейсбуке, а имеющие его люди могут указывать не все данные
о себе или указывать их неверно; отсутствуют чёткие и не меняющиеся
со временем определения категорий на Adverts Manager. Кроме того,
данная платформа может, к сожалению, служить не только для исследований,
но и для выявления и дальнейшей дискриминации наиболее уязвимых
групп населения. Решения этих проблем авторы видят в сочетании данных,
предоставляемых Фейсбуком, с надёжными традиционными источниками
и в создании базовых правил исследовательской этики и защиты данных
пользователей Фейсбука.
|