Использование статистики поисковых запросов в изучении
интереса к теме гриппа
Коршунова Ю., Пупкова Е., Лисов А., Шавырин Д., Ломанова
А., Марычев Г., Блохина С., Кобилов Б., Мигунов Н., Худайбердин
Д.,
Балабан М., Строгонов А. (студенты 2 курса магистерской программы
«Демография» НИУ ВШЭ),
Юмагузин В. (к.соц.н., доцент кафедры демографии НИУ ВШЭ)
(Институт демографии им. А.Г. Вишневского НИУ ВШЭ)
Мировой опыт показывает, что использование статистики
поисковых запросов позволяет отслеживать распространение инфекционных
заболеваний практически в реальном времени. При этом если в зарубежных
странах опираются на статистику запросов, сделанных в браузере Google,
то на российском пространстве предпочтение может быть отдано инструментам
на базе Яндекса. С помощью статистики онлайн запросов отечественные
исследователи анализировали интерес к теме COVID-19 и прогнозировали
миграционные намерения, в то же время тема гриппа не получила должного
внимания что и служит актуальностью данной работы. Инструменты от
двух ИТ-лидеров имеют свои сходства и различия. В работе мы покажем,
как Яндекс Вордстат позволяет расширить наше представление о региональной
и временной информированности о гриппе в России и в конкретном регионе
– Самарской области. В работе высказана гипотеза о влиянии географического
положения на частоту запросов о гриппе в российских регионах и выполнена
ее проверка с помощью картографических методов.
Обзор литературы по использованию Google Trends и Яндекс
Вордстат при прогнозировании заболеваемости гриппом
Google Trends[2]
и Яндекс Вордстат[3]
– это инструменты, которые могут помочь мониторить динамику различных
инфекционных заболеваний и предсказывать вспышки гриппа. Google
Trends – это сервис Google, анализирующий данные о поисковых запросах
пользователей. С его помощью пользователи могут узнать, какие темы
и ключевые слова были популярны в определенный период времени и
в определенном географическом регионе. При прогнозировании вспышки
гриппа в качестве альтернативного источника данных можно использовать
уровень интереса пользователей к соответствующим симптомам и лекарствам.
Например, повышенный интерес к поисковым запросам «симптомы гриппа»
или «лекарства от гриппа» может свидетельствовать о росте числа
заболевших. Яндекс Вордстат – это инструмент от компании Яндекс,
который также предоставляет информацию о популярности поисковых
запросов. С его помощью можно получить данные о количестве поисковых
запросов по конкретным ключевым словам и фразам, связанным с гриппом.
Общий подход к использованию этих инструментов заключается в анализе
изменений частоты поисковых запросов, связанных с гриппом, с течением
времени и сравнении их с регистрируемой заболеваемостью. Google
Trends и Яндекс Вордстат являются подспорьем в прогнозировании вспышек
гриппа и в качестве самостоятельного инструмента, поскольку позволяют
отслеживать сезонность, сравнивать частоту отдельных запросов между
собой, а также проводить межрегиональные сравнения вплоть до муниципального
уровня с точностью до дня в реальном времени. Однако следует отметить,
что это не единственные и неокончательные источники информации.
Для более точного и надежного прогнозирования необходимо привлекать
данные медицинской статистики, в т.ч. учитывать базовый показатель
репродукции, показатель вторичной пораженности, летальность и др.,
учитывать погодные условия (температурный режим, уровень осадков,
скорость ветра), законодательные меры (введение карантина, закрытие
школ и пр.), объемы продаж мультисимптомных препаратов и др.
В научном поле есть множество работ, посвященных анализу
точности данных инструментов для прогнозирования различных заболеваний,
в частности гриппа. Исследователи сопоставляют официальные данные
и данные Google Trends и Яндекс Вордстат для выявления возможностей
и пределов использования данных сервисов.
Так, в одном американском исследовании[4]
обсуждается эффективность системы мониторинга Google Flu Trends
(GFT) в отслеживании случаев гриппа, основываясь на данных о посещениях
отделений неотложной помощи в 19 городах США с 2005 по 2011 год.
Исследование показало значительную корреляцию между объемом поисковых
запросов GFT и обращениями в отделения неотложной помощи, с медианной
корреляцией 0,84. Однако, несмотря на положительные результаты,
исследование также выявило географические и временные различия,
которые ограничивают использование GFT как единственного источника
мониторинга. Авторы работы заключили, что GFT может служить полезным
ранним сигналом для определения всплесков заболеваемости, особенно
в сочетании с другими методами мониторинга.
Еще одной работой, исследующей возможности Google Flu
Trends в США является статья, опубликованная спустя всего 4 года
после запуска сервиса[5]. Статья
исследует возможность использования данных Google Flu Trends для
создания автоматической системы раннего предупреждения об эпидемиях
гриппа, названной FluBreaks. Авторы провели детальный алгоритмический
анализ, сравнив три типа алгоритмов на точность и практичность каждого
из них по нескольким метрикам, включая процент истинно положительных,
ложноположительных, перекрытия и ранних сигналов. В результате алгоритмы
на основе распределения Пуассона и отрицательного биномиального
распределения показали лучшие результаты по большинству метрик,
в то время как нормальное распределение было менее эффективным.
Большие населенные регионы демонстрировали более высокие значения
ранних сигналов. Таким образом, исследователи пришли к выводу, что
для эффективного раннего обнаружения эпидемий требуется переход
на алгоритмы отрицательного биномиального и Пуассона, что позволит
лучше обрабатывать изменчивые данные поисковых запросов.
В еще одной работе, анализирующей возможности прогнозирования
вспышек гриппа при использовании GFT[6],
проведена оценка заболеваемости гриппоподобными заболеваниями с
использованием данных GFT и предложены методы улучшения точности
этих оценок. Авторы пересмотрели ошибки GFT, используя недавние
данные о заболеваемости, которые лучше отражают реальное состояние.
В исследовании анализировались данные за пять сезонов гриппа из
трех источников: архивные оценки гриппоподобных заболеваний из GFT,
данные из Американской сети амбулаторного эпиднадзора за гриппо
вирусными заболеваниями (ILINet) и частично доступные данные из
оперативной отчетности (ILIp). Для коррекции ошибок GFT была построена
регрессионная модель случайного леса с использованием данных GFT
за предыдущие три недели. Также были созданы прогнозы на 1-4 недели
вперед с использованием моделей ARIMA. Коррекция ошибок GFT привела
к снижению ошибок на 44%, и исправленные оценки GFT оказались точнее,
чем ILIp. Особенно значительное снижение ошибок произошло в сезоне
2012-2013, когда GFT показывал большие расхождения. Включение исправленных
данных GFT в прогнозы значительно улучшило точность предсказаний.
Статья демонстрирует, что ошибки GFT значительно можно сократить
и что использование данных о поисковых запросах может улучшить системы
прогнозирования заболевания населения гриппом. Авторы призывают
пересмотреть полезность этого источника данных в различных областях.
Среди интересных отечественных наработок по использования
статистики онлайн запросов можно выделить работу Броницкого и Вакуленко[7],
посвященную прогнозированию миграции из России в Германию с использованием
Google-трендов. При этом в отличие от всемирно известного Google,
поисковым сервисом «Яндекс» пользуются в основном в пределах Российской
Федерации. По данным SimilarWeb сайт yandex.ru наиболее популярен
среди российских граждан – по состоянию на сентябрь 2024 года 90,7%
пользователей были из России[8].
Поэтому исследования, в которых используется Яндекс Вордстат имеют
географическую ограниченность. Исследований, связанных с прогнозированием
заболеваемости гриппом при помощи Яндекс Вордстат, почти нет. Например,
можно выделить небольшую работу Соколова[9],
в которой он оценивает точность прогнозирования заболеваемости гриппом
с привлечением медицинской статистики заболеваемости и статистики
запросов в Яндекс.
Гораздо больше публикаций с использованием Яндекс Вордстат
в качестве альтернативных данных о динамике заболеваемости COVID-19.
В исследовании поисковых запросов, связанных с тремя периодами подъема
заболеваемости COVID-19 в России[10],
показано, что поиск в «Яндексе» выполнялся по симптомам, осложнениям,
лекарствам, методам тестирования, медицинской помощи и профилактическому
поведению. 34 исследуемых запроса из 61 достигли пика еще за несколько
недель до первого пика заболеваемости COVID-19. Корреляция поисковых
запросов, связанных с поиском симптомов коронавируса, с подтвержденными
случаями заболевания оказалась очень высока (r > 0,9), что говорит
о возможности прогнозирования заболеваемости при помощи Яндекс Вордстат.
Поисковые запросы «карантин», «маска», «больница», «врач» были широко
распространены и показывали высокую корреляцию в разные периоды
с официальной регистрацией случаев заболеваний, но не на протяжении
всего периода, что является результатом ряда ограничений, с которыми
сталкиваются исследования данного рода. Например, увеличение количества
поисковых запросов может, по крайней мере частично, быть связано
с увеличением присутствия связанных тем в СМИ, а не с отдельными
ситуациями; кроме того, со временем может меняться сам список поисковых
запросов: если в начале пандемии были популярны запросы «пропало
обоняние», то впоследствии интерес сместился к конкретным препаратам
и вакцинам.
В другом исследовании этих же авторов были проанализированы
онлайн-запросы российских пользователей «Яндекса» по поводу нарушения
обоняния как одного из ярких симптомов коронавируса[11]
в регионах и крупных городах России с 16.03.2020 по 21.02.2021[12].
Всего в исследование были включены 81 регион России и несколько
городов, таких как Москва, Санкт-Петербург и Нижний Новгород. Была
выявлена сильная положительная прямая корреляция (r > 0,7) между
количеством связанных с запахом запросов в «Яндексе» и новых случаев
COVID-19 в 59 из 85 регионов России и крупных городов (70 %). Во
время первого пика заболеваемости COVID-19 в России (апрель-май
2020 года) рост числа запросов, связанных с запахом, опережал рост
числа новых случаев на 1–2 недели в 23 из 59 регионов России. Во
время второго пика заболеваемости COVID-19 в России (октябрь – декабрь
2020 года) рост числа запросов, связанных с запахом, опережал рост
числа новых случаев на 1–2 недели в 36 регионах России, включая
Москву. Полученные результаты согласуются с предыдущими исследованиями
авторов, которые выявили сильную корреляцию между запросами, связанными
с запахами, и новыми случаями заражения (r = 0,81) в России с помощью
Google Trends[13].
Похожее исследование проводилось в Омской области[14].
Пять ключевых слов (кт, ковид-19, тест ковид, потеря вкуса, потеря
обоняния) отслеживали в еженедельном режиме вместе с динамикой официальной
регистрации COVID-19. Установлено, что отслеживаемые ключевые слова
имели высокие показатели точности (чувствительности, специфичности)
в прогнозировании эпидемиологической ситуации по коронавирусной
инфекции на горизонте до двух недель. Вместе с тем, апробированные
ключевые слова не продемонстрировали «идеальных» характеристик (точности
более 95 %), что не позволяет основывать прогнозирование ситуации
только лишь на этом инструменте и требует комплексной оценки ситуации.
Итак, использование данных Google Trends и Яндекс Вордстат
для прогнозирования заболеваемости гриппом и COVID-19 имеет потенциал,
но требует дальнейших исследований и совершенствования методов анализа.
Эти инструменты могут дополнить традиционные методы мониторинга,
но не являются единственным и окончательным источником информации.
Важно учитывать ограничения, географическую специфику и использовать
данные в комплексе с другими источниками информации.
Сходства и различия Google Trends и Яндекс Вордстат
В данном параграфе мы рассмотрим основные сходства и
различия двух инструментов.
Сходства в анализе поисковых запросов с помощью Google
Trends и Яндекс Вордстат
Основные сходства:
- Оба инструмента предоставляют бесплатный доступ
к своим данным, что делает их доступными для широкого круга пользователей.
- Оба инструмента предоставляют данные о популярности
поисковых запросов. Они позволяют определить, как часто определенные
слова или фразы вводят пользователи, и помогают выявить тенденции
интересов аудитории сейчас или в каком-то промежутке времени.
- Оба инструмента достаточно оперативно обновляют
данные, имеют высокую временную детализацию и глубину хранения
данных.
- Оба инструмента дают возможность анализировать популярность
запросов в региональном разрезе.
- Оба инструмента показывают популярность всех синонимов,
связанных с поисковым запросом, поэтому выбор точности формулировки
запроса остается за пользователем.
Несмотря на схожесть функций, Google Trends и Яндекс
Вордстат различаются по охвату аудитории, способу представления
данных и возможностям анализа. Рассмотрим эти особенности более
подробно далее.
Различия в анализе поисковых запросов
Google Trends предоставляет данные на основе глобальной
аудитории Google. Это делает его более универсальным для анализа
трендов в международном масштабе, так как Google одна из самых популярных
поисковых систем в мире. Например, можно сравнить интерес к запросам,
связанным с гриппом, между странами, чтобы оценить, где эпидемия
наиболее активна. В отличии от Google Trends, Яндекс Вордстат охватывает
только пользователей поисковой системы Яндекс, которая популярна
в России и странах СНГ. Для анализа русскоязычной аудитории Вордстат
чаще оказывается более точным инструментом благодаря высокой популярности
Яндекса, а также детализации данных по территориальным единицам
внутри этих стран (например, по областям, городам и некоторым муниципальным
образованиям в России) что может быть полезным для локальных исследований.
Формат представления данных
В Google Trends данные представлены в виде относительных
показателей, выраженных в шкале от 0 до 100. Они показывают уровень
интереса к запросу относительно максимального значения для определенного
региона и выбранного периода времени. 100 баллов означают наивысший
уровень популярности запроса, 50 – уровень популярности запроса,
вдвое меньший по сравнению с первым случаем. 0 баллов означает местоположение,
по которому недостаточно данных о рассматриваемом запросе. Допустим,
при анализе запроса "грипп" в Google Trends за последние 12 месяцев,
можно увидеть, что в декабре уровень популярности запроса достигает
индекса 100, что соответствует пику интереса за этот период. В феврале
индекс составляет 70, а в июне — всего 10. Конкретное количество
запросов узнать невозможно.
Яндекс Вордстат рассчитывает долю конкретного запроса
от всех запросов (%) за выбранный период и индекс интереса, который
находится как отношение доли отобранных запросов в регионе к их
доле среди всех запросов к Яндексу. Индекс, равный 100[15]
показывает средний уровень, 150 – интерес в 1,5 раза выше, 50 –
интерес вдвое ниже, чем в целом. Помимо относительных показателей
Вордстат предоставляет также абсолютные значения: точное количество
запросов за определенный период, что упрощает работу с данными.
Сопоставление относительных показателей Google Trends и Яндекс Вордстат
не вполне однозначно, поскольку баллы Google Trends ограничены 100
баллами сверху, тогда как в Яндекс Вордстат верхняя граница индекса
интереса не определена. Нижняя граница обоих индексов может быть
равна 0: Google Trends интерпретирует это как недостаток данных
для расчета индекса, тогда как Яндекс – отсутствие данных, при этом
нулевые данные в отличие от первого инструмента, в статистике не
показываются. Для условного сопоставления трендов потребуется как
минимум установить одинаковый временной период и принять верхнюю
границу индекса интереса за 100 баллов по шкале Google Trends, однако
средний уровень индекса интереса в 100 баллов в Вордстат не обязательно
будет соответствовать среднему уровню интереса по шкале Google Trends
– такого понятия как «средний уровень» в Google Trends просто нет.
Гибкость поиска
В отличие от Google Trends в Яндекс Вордстат доступен
более гибкий механизм работы с ключевыми словами. Он предлагает
такие функции, как работа с минус-словами, поиск по нужным формам
и пр., например, можно исключить некоторые слова из поиска, использовать
кавычки для поиска точного соответствия или квадратные скобки для
указания слова в конкретной форме.
Вот несколько примеров, как задавать ключевые фразы
в Яндекс Вордстат с использованием специальных знаков, применительно
к теме вакцинации от гриппа:
- Кавычки (" ") — точное соответствие фразы. Используются
для поиска запросов с точным порядком и количеством слов, без
учета перестановок или добавления других слов. Пример: "вакцинация
от гриппа" — покажет только запросы, содержащие именно эту фразу
в указанном порядке слов; «грипп» - покажет популярность именно
этого слова.
- Квадратные скобки — [ ] — фиксирует порядок слов.
При этом учитываются все словоформы и стоп-слова. Используются
для точного указания формы слова. Пример: «[симптомы грипп]» —
покажет только запросы, где запрос начинается с этой фразы, не
покажет запросы «свиной грипп симптомы», «грипп симптомы у детей».
- Восклицательный знак (!) — фиксирует форму слова
(число, падеж, время). Помогает исключить другие значения слова,
опечатки или изменения форм слова. Пример: «!грипп» — покажет
запросы, где слово "грипп" указано именно в этой форме. Не покажет:
"гриппа", "гриппом".
- Минус (-) – исключает слова из поиска. Например,
«грипп -свиной -птичий» не включит в статистику показов похожих
запросов «свиной грипп» и «птичий грипп», но они все равно попадут
в статистику слова «грипп». Аналогично «вакцинация -собак -кошек
-животных» может более точно ограничить результаты похожих запросов
по теме вакцинации.
- Плюс (+) — учет стоп-слов. Заставляет учитывать
предлоги и союзы, которые обычно игнорируются. Пример: «вакцинация
+от гриппа» — запрос обязательно содержит предлог "от", не будут
показаны результаты «вакцинация против гриппа».
- Вертикальная черта (|) — оператор "ИЛИ"
- Круглые скобки — () — группировка выражений. Пример:
«вакцинация (детей|взрослых)» покажет популярные запросы, содержащие
в себе фразы «вакцинация детей» или «вакцинация взрослых» [16].
Временной анализ
Оба сервиса предоставляет данные за длительный период
(Google Trends с 2004 года, Яндекс Вордстат – с 2018 года), что
позволяет изучить многолетнюю сезонность заболеваемости гриппом.
Например, можно увидеть, как всплески интереса к гриппу повторяются
в холодное время года или в периоды эпидемий.
Однако необходимо учитывать изменения в методике сбора
данных Google Trends:
- 2011 год — была введена новая система нормализации данных, чтобы
учитывать рост популярности Google как поисковой системы. Это
позволило сделать данные более сопоставимыми между разными периодами.
- 2015 год — обновления затронули визуализацию и детализацию данных,
что позволило анализировать более мелкие временные промежутки.
- 2020 год — улучшена интерпретация поисковых запросов с учетом
новых алгоритмов, что повысило точность анализа связанных тем.
Что касается детализации, то Google Trends позволяет
анализировать запросы с точностью до минуты, тогда как Яндекс Вордстат
– до конкретного дня. Яндекс Вордстат публикует данные с задержкой
в один день, тогда как Google Trends – здесь и сейчас, это означает,
что статистика запросов, связанных с гриппом, в Google Trends может
служить индикатором роста заболеваемости и его прогнозирования в
реальном времени, т.н. наукастинга. Единственное, Google может не
показать детальные данные по времени и территории, если данных по
этому запросу слишком мало, т.е. выбрано редкое выражение, в т.ч.
это может быть «грипп» вне сезона заболеваемости.
Функции Google Trends
Google Trends обладает рядом дополнительных функций,
которые делают его универсальным инструментом для анализа поисковых
данных. Вот основные возможности, которые можно учесть при анализе:
1. Сравнение ключевых слов
Google Trends позволяет одновременно сравнивать до 5
поисковых запросов. Например, можно сравнить популярность запросов
основных вакцин от гриппа «ультрикс», «совигрипп», «гриппол» и «Флю-М»,
а также лексикон «прививка от гриппа» vs. «вакцина от гриппа» (Приложение
1).
2. Поиск по категориям
Пользователь может выбирать тематические категории для
более точного анализа. В контексте «гриппа» может быть полезным
ограничение выдачи статистики запросов категорией «Здравоохранение».
3. Тип поиска
Google Trends предоставляет возможность анализировать
данные из разных источников:
- Веб-поиск — классические запросы в поисковой строке браузера.
- YouTube — популярность видео по заданной теме.
- Картинки — запросы, связанные с визуальным контентом.
- Новости — тренды в новостном контексте.
Например, можно сравнить интерес к запросу "вакцинация"
в вебе и на YouTube, чтобы понять, где больше обсуждают эту тему.
4. Тренды
В Google Trends ввод запросов может быть более широким
и ориентированным на тенденции. Например, анализируются общие запросы
вроде «flu symptoms» или «грипп», и инструмент показывает тренды
по всему миру или в выбранном регионе, в т.ч. не содержащие поисковое
слово, но относящиеся к этой теме по смыслу. Согласно справке «надписью
«сверхпопулярность» отмечаются темы, количество запросов по которым
возросло чрезвычайно сильно. Такое возможно в случае, если темы
новые и поиск по ним ранее просто не выполнялся»[17].
В таблице 1 сведены основные сходства и различия двух
инструментов.
Таблица 1. Сравнение функционала Google Trends и Яндекс
Вордстат
Критерий
|
Google Trends
|
Яндекс Вордстат
|
Мера
|
Относительные значения: 1. индекс 0–100
|
Относительные значения: 1. доля от всех запросов, %,
2. индекс интереса 0-N, где N любое число.Абсолютные значения:1.
количество запросов.
|
Временной охват
|
с 2004 года.
|
с 2018 года
|
Географический охват
|
Глобальный (данные доступны по всем странам и регионам).
|
Ориентирован на Россию и страны СНГ. В зависимости от региона
возможна детализация до муниципального уровня
|
Визуализация
|
Графики динамики популярности по временным периодам и регионам.Рейтинги
популярности по регионам и городам.Есть карты в зависимости
от выбранного региона.
|
Графики динамики популярности по временным периодам и регионам.Рейтинги
популярности по регионам и городам. Таблицы с количеством
запросов с возможностью сортировки данных в столбцах. Карты
не приводятся.
|
Детализация временных трендов
|
Ежедневная или ежеминутная, если за день, неделю или месяц.
|
Ежедневная, еженедельная и ежемесячная
|
Анализ связанных запросов
|
Показывает ограниченный список популярных связанных запросов
и тем.
|
Показывает большой список популярных связанных запросов
|
Учет платформ и устройств
|
Можно анализировать запросы по словам в вебе, в YouTube,
по новостям, товарам и картинкам, но без разделения по устройствам
пользования
|
Только веб-поиск по словам в Яндексе, но учитывает запросы
отдельно на персональных компьютерах (десктопах), смартфонах
и планшете
|
Изменение методологии учета
|
Учет менялся в 2011, 2015, 2020 гг.
|
Нет/ не сообщается
|
Форматы данных для скачивания
|
Файл csv, карта, график
|
Файл csv и excel, график
|
В Приложении 1 представлены примеры результатов по запросу
«грипп» в Google Trend, а в Приложении 2 – примеры из Вордстат (в
отличии от Google Trends оперативные данные за 20 ноября отсутствуют.
Дата обращения: 20 ноября).
Итак, оба инструмента имеют свои сильные стороны и подходят
для решения различных задач. Выбор между Google Trends и Яндекс
Вордстат зависит от целей исследования, географии аудитории и потребностей
пользователя.
Интерес к вакцинации от гриппа по данным Вордстат
На основе данных, выгруженных из Вордстата Яндекса,
мы проанализировали интерес пользователей в целом к теме вакцинации
от гриппа. Так, общее число запросов по ключевой для нас фразе «вакцинация
от гриппа» составило 48 509 запросов за исследуемый месяц (03.10.2024
- 03.11.2024)[18].
Помимо основной вышеуказанной формулировки, наибольшую
популярность набрали еще три варианта запросов: «вакцинация
от гриппа 2024» - 13 196 запросов, «пункты вакцинации от
гриппа» - 8 959 запросов и «вакцинация от гриппа в Москве»
- 5 965 запросов. Отметим, что эти запросы иллюстрируют некоторую
потребность среди населения не просто в общей информации о вакцинации,
но и в практической информации о том, где конкретно можно пройти
вакцинацию от гриппа (в частности, в столичном регионе).
Также интересно кратко рассмотреть и схожие запросы
- так, Вордстат в основном выдает еще и запросы по названию вакцин:
«ультрикс» - 71 638 запросов, «совигрипп» - 33
966, «гриппол» - 20 092 запроса. Можно сделать предположение
о том, что у населения есть некоторое представление об отдельных
вакцинах от гриппа, что вероятно указывает на сформированный интерес
к конкретным препаратам вакцинации от гриппа либо люди хотят больше
получить информации о вакцинах, которые предлагаются во взрослой
и детской поликлинике.
С целью выявления каких-либо региональных особенностей
интереса к теме вакцинации от гриппа, нами дополнительно был проведен
краткий анализ запросов по регионам России. В рассматриваемый нами
период можно выделить топ-5 регионов и городов с наибольшим индексом
интереса к запросу, а также антитоп-5 регионов и городов с наименьшим
индексом интереса к запросу (рис. 1).
Среди лидирующих регионов выделяются такие, как Мурманская
область, Ямало-Ненецкий автономный округ, г. Москва и Московская
область, г. Санкт-Петербург и Ленинградская область. Наличие среди
этого топа некоторых северных регионов может быть связано с климатическими
условиями расположения данных регионов и, соответственно, повышенной
заболеваемостью в холодное время года, которое наступает там раньше.
Данная гипотеза будет проверена далее в соответствующем параграфе.
Наименьший интерес к вакцинации наблюдается в таких
субъектах, как Карачаево-Черкесская Республика, Республика Дагестан,
Республика Северная Осетия - Алания, Республика Алтай и Тамбовская
область. Список регионов выглядит довольно необычно, и может стать,
возможно, тематикой для отдельного рассмотрения причин такого выделения
регионов. Ниже представлены карты, на которых изображены города
и регионы России, соответствующие представленным топам и антитопам
по рассматриваемым запросам. Так, цветами (красным и зеленым) представлены
антитоп и топ, а формой (пунсоны и площадь) города и регионы, соответственно.
Далее был проведен аналогичный анализ интереса к вакцинации,
но уже по городам России, с выделением топа и антитопа. С наибольшим
уровнем интереса к рассматриваемому запросу среди городов выделились:
Вятские поляны (Кировская область), Белоярский (Ханты-Мансийский
автономный округ - Югра), Горки (Московская область), Приозерск
(Ленинградская область) и Светлогорск (Калининградская область).
В антитоп по городам России вошли такие, как Черкесск (Карачаево-Черкесская
Республика), Мичуринск (Тамбовская область), Новоалтайск (Алтайский
край), Павлово (Нижегородская область) и Троицк (Москва).
В подавляющем большинстве, топ и антитоп городов повторяет
аналогичный список для регионов России за исключением пары городов
(например, Павлово и Вятские поляны). Это также может подтверждать
гипотезу выше о том, что может прослеживаться связь с климатическими
условиями, поэтому рейтинг среди городов несколько повторяет похожий
топ по регионам России.

Рисунок 1. Топ-5 и Антитоп-5 регионов и городов России
поз запросу «вакцинация от гриппа», 03.11.2024 – 03.11.2024 гг.
Прививка от гриппа
Помимо рассмотрения запросов по теме «вакцинация
от гриппа», мы также рассмотрели данные по запросу «прививка
от гриппа», который за аналогичный период набрал 301 857 запросов,
что значительно превышает число запросов от «вакцинации от гриппа».
Данный факт отражает то, что само слово «прививка» является более
распространенным среди пользователей, не причастным к медицинской
сфере, более «обывательским». Термин «вакцинация» является более
строгим, формальным словом, которым в большей степени пользуются
медицинские работники, т.е. на профессиональном уровне. Самые популярные
запросы включают в себя следующие: «прививку от гриппа можно»
- 61 732 запросов, «после прививки от гриппа» - 54 236
запросов и «сделать прививку от гриппа» - 36 846 запросов.
В данном случае мы можем наблюдать тот факт, что население также
интересуется в целом темой вакцинации, показаниями, условиями и
возможными последствиями вакцинации.
По данному запросу аналогичным образом были выделены
топ-5 и антитоп-5 по регионам и городам России (рис. 2).
Так, в топ среди регионов выделяются такие, как: Мурманская область,
Архангельская область, Республика Коми, Забайкальский край и Свердловская
область.
В антитоп среди регионов по данному запросу попали:
Республика Дагестан, Чеченская Республика, Республика Ингушетия,
Республика Северная Осетия - Алания и Карачаево-Черкесская Республика.
Заметим, что по сравнению с предыдущим выделением топов и антитопов,
наличествуют в некотором смысле схожие закономерности по регионам,
что может указывать на какие-то потенциально общие факторы, которые
формируют интерес.
Среди городов по наибольшему числу запросов выделяются:
Аша (Челябинская область), Ухта (Республика Коми), Надым (Ямало-Ненецкий
автономный округ), Колпашево (Томская область) и Мурманск (Мурманская
область). Наименьшим количеством запросов обладают такие города
России, как Кизляр (Республика Дагестан), Буйнакск (Республика Дагестан),
Назрань (Республика Ингушетия), Махачкала (Республика Дагестан)
и Избербаш (Республика Дагестан). Как можно заметить, внизу рейтинга
находятся в подавляющем большинстве города одного региона - Республики
Дагестан, что вызывает отдельный исследовательский вопрос.

Рисунок 2. Топ-5 и Антитоп-5 регионов и городов России
поз запросу «прививка от гриппа», 03.11.2024 – 03.11.2024 гг.
Сравнительный анализ
Обратимся к более подробному рассмотрению исследуемых
нами запросов. Помимо основной динамики, нами был построен такой
показатель, как темпы прироста, который показывает то, насколько
резко изменяется интерес к запросу. Расчет производился по следующей
формуле:

Рисунок 3 иллюстрирует нам динамику запросов по ключевым
запросам «вакцинация от гриппа» и «прививка от гриппа» за период
с января 2018 года по октябрь 2024 года (рис. 3). Так,
мы можем наблюдать, что для обоих запросов наблюдается выраженная
сезонная динамика. Пики интереса приходятся именно на осенние месяцы
(с сентября по ноябрь), что вполне совпадает с открытиями кампаний
по вакцинации населения от гриппа и ОРВИ. Они также могут быть обусловлены
и повышением уровня информированности о гриппе и вакцинации в общей
повестке в принципе в сезон распространения простуд и вирусных заболеваний.
Особенно выделяется пик осенью 2020 года, что предположительно
может быть связано с пандемией COVID-19[19]
- как с новой ее волной, так и возросшей в моменте информационной
повесткой о необходимости вакцинации от гриппа, чтобы не допустить
двойной нагрузки на организм в случае болезни гриппом и ковидом
одновременно. Отдельно также отметим, что вне сезона в весенне-летний
период, закономерно, интерес к вакцинации снижается.
Рост темпов прироста приходится на осенние месяцы каждого
года, что показывает действительно рост интереса к теме вакцинации
и прививки от гриппа (рис. 4). Что интересно – в начале каждого
года интерес снижается и достигает отрицательных значений, что также
может указывать и на снижение интереса к вакцинации после пика,
массовости ее прохождения населением как таковой. И снова заметен
2020 год, в котором виден значительный прирост, хотя в последующие
годы интерес возвращается на «исходные уровни» и в некотором смысле
стабилизируется.
Рассмотрим также график, иллюстрирующий динамику по
запросам за последний год в период с ноября 2023 года по октябрь
2024 года помесячно (рис. 5), понедельно (рис. 6) и подневно
(рис. 7). Образовавшийся тренд снова указывает явно на сезонный
интерес к теме вакцинации, который особенно резко возрастает в зимний
период (особенно в декабре 2023 и январе 2024), затем постепенно
снижается к лету и осени. Этот всплеск также кажется разумным ввиду
возрастания заболеваемости в холодное время года, как это было отмечено
нами ранее. Заметим, как возрастает интерес к вакцинации в самом
начале сентября 2024 года (рис. 7) — именно в это время ведущие
СМИ писали о старте массовой вакцинации, что подогревало интерес
к теме.
Темпы прироста в некотором смысле подтверждают наличие
сезонности, показывая точнее периоды ускорения и замедления роста
(рис. 8-10). Так, в зимние месяцы отмечен активный прирост запросов,
что показывает растущий интерес к вакцинации в холодный период времени
года. В весенне-летний период, наоборот, темп прироста резко снижается
и даже становится отрицательным, что подтверждает спад интереса
к вакцинации от гриппа в теплое время года. Помимо этого, явно наблюдается
внутринедельная сезонность (рис. 10) – пик приходится на понедельник,
а к выходным дням темп снижается. Этот аспект был характерен для
обоих исследуемых запросов.

Рисунок 3. Динамика запросов по «Вакцинация от гриппа»
и «Прививка от гриппа», январь 2018 – октябрь 2024 года, по месяцам

Рисунок 4. Темпы прироста по запросам «Вакцинация от
гриппа» и «Прививка от гриппа», январь 2018– октябрь 2024 года,
по месяцам

Рисунок 5. Динамика запросов по «вакцинация от гриппа»
и «прививка от гриппа», ноябрь 2023 – октябрь 2024 года, по месяцам

Рисунок 6. Динамика запросов по «вакцинация от гриппа»
и «прививка от гриппа», октябрь 2023 – октябрь 2024 года, по неделям

Рисунок 7. Динамика запросов по «вакцинация от гриппа»
и «прививка от гриппа», сентябрь 2024 – ноябрь 2024 года, по дням

Рисунок 8. Темпы прироста по запросам «вакцинация от
гриппа» и «прививка от гриппа», ноябрь 2023 – октябрь 2024 года,
по месяцам

Рисунок 9. Темпы прироста по запросам «вакцинация от
гриппа» и «прививка от гриппа», октябрь 2023 – октябрь 2024 года,
по неделям

Рисунок 10. Темпы прироста по запросам «вакцинация от
гриппа» и «прививка от гриппа», сентябрь 2024 – ноябрь 2024 года,
по дням
Итак, в данной части работы был проведен анализ интереса
к вакцинации от гриппа по данным статистики запросов в Яндекс Вордстат.
Нами были выделены самые интересующиеся регионы и города России,
а также проанализирована динамика данных запросов – в абсолютных
значениях, долях и темпах прироста.
Общие тенденции иллюстрируют рост интереса к вакцинации
и прививкам от гриппа преимущественно в осенние месяцы. Этот аспект
связан с началом сезона простудных и вирусных заболеваний, стартом
массовой вакцинации, в связи с чем повышается интерес населения
к этой теме. Отдельно стоит отметить и то, что некоторые пользователи
имеют более конкретные запросы, среди которых выделяются запросы
точных наименований вакцин от гриппа и поиска пунктов вакцинации,
особенно, в столичном регионе.
Среди «выбивающихся» результатов были замечены следующие
всплески: самый большой рост интереса к вакцинации осенью 2020 года,
когда была очередная волна эпидемии COVID-19, а также полное отсутствие
интереса к прививкам от гриппа среди представителей южных республик
России – Дагестана и Ингушетии.
Помимо прочего, можем отметить, что получаемые данные
запросов пользователей позволяют довольно детально оценивать сезонность
тех или иных исследуемых явлений. Полученные результаты также показывают
не только общие тенденции или какие-либо закономерности, но и позволяют
выделить из этих результатов потенциальные исследовательские вопросы
и темы для работ по определению причин таких закономерностей.
Таким образом, анализ результатов запросов является
довольно мощным инструментом для оценки сезонности запросов пользователей,
выявления потенциальных закономерностей и исследовательских вопросов
и задач - как некий одновременно и разведывательный, и самостоятельный
анализ ситуации по интересующей тематике.
Интерес к медотводам при вакцинации от гриппа
Введение в проблематику медотводов
Вакцинация уже давно стала неотъемлемой частью системы
здравоохранения даже в развивающихся странах. Эффективность таких
мероприятий находит отражение в росте ожидаемой продолжительности
жизни, снижении избыточной смертности и улучшении общих показателей
здоровья населения. Однако возникшие споры относительно безопасности
прививок вызвали общественное беспокойство — “от обвинений в
их связи с аутизмом до предположений о заражении вакцины от полиомиелита
различными вирусами”. Вследствие этих опасений в развитых странах
снизился уровень вакцинации, что привело к вспышкам заболеваний,
которых можно было избежать (например, кори), в Европе и Северной
Америке, вызвав некоторые несчастные случаи среди населения[20].
Среди основных причин отказа от вакцинации выделяются
обеспокоенность качеством вакцин и возможными побочными эффектами.
Мнение о вредоносности прививок на здоровье человека широко распространены
в самых развитых европейских странах[21].
Этому способствуют популяризация альтернативной медицины, распространение
антивакцинаторских идей и движений, а также недоверие к государственным
институтам политической власти и органам здравоохранения[22].
В России, как и во многих других странах, растет обеспокоенность
по поводу вакцинации, что сопровождается увеличением интереса к
оформлению медицинских отводов от прививок. В этом контексте важно
чётко разграничивать две категории: во-первых, людей, которые действительно
нуждаются в медицинском отводе по объективным медицинским показаниям,
таким как аллергия на компоненты вакцины или иные противопоказания.
И, во-вторых, тех, кто пытается получить медицинский отвод необоснованно,
без наличия реальных медицинских причин, с целью избежать вакцинации.
Данное исследование в большей степени концентрируется на второй
группе, исследуя ее мотивацию и другие особенности, выявляемые через
анализ динамики популярных запросов в определенные временные периоды.
Для анализа интереса к медотводам от прививок против гриппа в России
будет рассмотрена динамика статистики запросов, связанных с поиском
информации о способах, позволяющих избежать вакцинации, агрегируемая
Яндекс Вордстатом.
Анализ литературы
Существует несколько наиболее распространенных причин
отказа от вакцинации против гриппа, подробно изученных в российской
и зарубежной исследовательской литературе. Остановимся детальнее
на некоторых из них.
Опасение побочных эффектов
Фибах и Висколи (1991) провели исследование 965 пациентов
одного из центров медицинской помощи Нью-Хейвена, которым была рекомендована
вакцинация против гриппа. С помощью когортного анализа и серии количественных
телефонных опросов авторы выяснили, что ключевыми причинами отказа
от вакцинации для пациентов стали страх негативной реакции организма
(46%) и плохой предыдущий опыт (23%)[23].
При этом авторы не выявили зависимостей от демографических
характеристик пациентов или наличия у них специфических диагнозов,
требующих повышенного внимания к необходимости вакцинации от гриппа.
Исследование польских ученых подтверждает, что даже среди студентов-медиков
велика доля отказывающихся от вакцинации. В результате перекрестного
обследования 1313 студентов в Медицинском университете Лодца было
выявлено, что ключевой причиной отказа для студентов стали неприятные
последствия прививки, с которыми они столкнулись при предыдущей
вакцинации[24].
Неприятные побочные эффекты стали причиной отказа для более чем
половины студентов.
Недостаток рекомендаций от врача или медицинской организации
В своем недавнем исследовании Муньос-Мираллес с коллегами
(2021) также выяснили, что одной из наиболее частых причин отказа
от вакцинации был страх перед побочными эффектами (33%), однако
47% изучаемых пациентов признались, что были бы готовы поставить
прививку, если бы им более подробно объяснили ее необходимость[25].
По результатам исследования также выяснилось, что наиболее
восприимчивы к советам компетентных специалистов и, соответственно,
готовы прививаться после личных бесед с врачом пациенты в возрасте
старше 60 лет. В этом контексте также интересны выводы, полученные
группой исследователей из Франции, которые провели серию глубинных
интервью с пациентами, страдающими муковисцидозом и попадающими
в группу высокого риска по тяжелой форме гриппа. Из 42 опрашиваемых
пациентов 24 отказались от вакцины, сославшись на то, что не считают
заболевание опасным и не видят для себя особых рисков при его протекании
(пациенты не обращались за разъяснениями к компетентному специалисту).
При этом 18 вакцинированных пациентов признались, что основывали
свое решение исключительно на четких и недвусмысленных рекомендациях
своего лечащего врача и медицинской организации[26].
Слабое восприятие рисков
Чен и Стивенс (2016) в своем объяснении отказа людей
от вакцинации опираются на поведенческую экономику и ложные эвристики,
которыми оперируют пациенты[27].
Помимо распространенного когнитивного предубеждения о том, что вакцина
от гриппа создана для того, чтобы провоцировать грипп, люди также
склонны верить в то, что они не заболеют гриппом. Особенно часто
такое ложное представление формируется у тех, кто никогда не болел
гриппом, переносил его легко и без осложнений и никогда не ставил
прививку. Как объясняют авторы, люди склонны страдать от нереалистичного
оптимизма по отношению к себе, и соответственно занижают риски заражения
гриппом.
Множество исследователей приходят к выводу, что одной
из распространенных причин отказа от вакцинации против гриппа также
является неверие в эффективность вакцины и мнение о том, что негативных
последствий от вакцинации будет больше, чем позитивных. К такому
заключению пришли авторы исследования вакцинируемых в Израиле, где
в ходе телефонного репрезентативного опроса населения Израиля вскоре
после вспышки гриппа выяснилось, что 30% населения не готовы к вакцинации
из-за опасения, что вакцинация не приведет к защите.
Помимо перечисленных направлений, исследователи уделяют
особое внимание изучению институтов политической власти, систем
здравоохранения и уровня доверия населения к ним[28].
В этой области существует обширное разнообразие исследований и методологических
подходов, позволяющих анализировать данный вопрос с разных точек
зрения. Привлечение статистики запросов о медотводах могло бы выявить
временные периоды, когда нежелание вакцинироваться проявляется наиболее
ярко, а также регионы с повышенным и пониженным интересом к медотводам.
Рассмотрение динамики запросов в Яндекс Вордстат
По мнению экспертов ФБУЗ «Центр гигиенического образования
населения» Роспотребнадзора лучше всего проходить вакцинацию от
гриппа в период с сентября по ноябрь[29].
В 2024 году старт ежегодной Всероссийской кампании по вакцинации
против гриппа был объявлен 4 сентября. При этом, в соответствии
с постановлением Роспотребнадзора от 17 июня 2024 года №7 «О мероприятиях
по профилактике гриппа, острых респираторных вирусных инфекций и
новой коронавирусной инфекции (COVID-19) в эпидемическом сезоне
2024-2025 годов», необходимо, чтобы вакцинацию прошло не менее 60%
населения России. В связи с этим можно предположить, что в период
с сентября по ноябрь будет наблюдаться всплеск интереса со стороны
населения к информации о прививании от гриппа, а также о способах
получения медотвода от прививки.
Рассмотрим динамику интереса к медотводам без привязки
к вакцинации гриппом (рис. 11).

Рисунок 11. Динамика частотности запроса «медотвод»
по месяцам, 01.07.2022 — 31.10.2024, все регионы, все устройства
Как можно заметить, несмотря на то, что в запросе не
фигурирует грипп и прививание от него, пик интереса внутри года
всегда приходится на начало кампании по вакцинации (сентябрь). Теперь
рассмотрим статистику популярных запросов, связанных с вакцинацией
от гриппа, за последний месяц, чтобы оценить, какие темы наиболее
интересны населению (рис. 12).

Рисунок 12. Количество похожих с гриппом запросов в
месяц в Яндекс Вордстат, ноябрь 2024
В топ запросов по прогнозу количества показов в месяц
входят запросы о том, можно ли делать прививку и в чем состоит ее
суть. Это говорит о том, что в период проведения кампании по вакцинации
от гриппа люди действительно интересуются детальной информацией
о прививании. На 27-м месте в рейтинге с более чем 4 тысячами прогнозных
показов в месяц находится запрос «отказ от прививки от гриппа».
Рассмотрим детальнее динамику запросов о медотводах от прививки
от гриппа за последние два года: с сентября 2022 по октябрь 2024
(рис. 13).

Рисунок 13. Динамика частотности запросов в Яндекс Вордстат,
по месяцам, 01.07.2022 — 31.10.2024, все регионы, все устройства
Примечание. По основной оси на графике отложено число
запросов “отказ прививка грипп”, остальные показатели отложены
по вспомогательной оси.
По графику видно, что количество запросов о медотводах
сильно возрастает с началом всероссийской кампании по вакцинации.
Так, например, число запросов “медотвод грипп” в августе 2024 составило
687 запросов, а в сентябре 2024 уже 4 809 запросов (рост в 7 раз).
Такая динамика при этом наблюдается в каждом из рассмотренных периодов.
Интересно отметить, что пиковое количество запросов, связанных с
медотводом, с годами возросло, в то время как пиковое число запросов,
связанных с отказом от прививки, снизилось. Тем не менее, суммарное
пиковое количество запросов сохраняется примерно на одном уровне
– 37 441 запрос в сентябре 2022, 40 640 запросов в сентябре 2023,
38 219 запросов в сентябре 2024. В связи с этим можно предположить,
что со временем в речевой аппарат населения стал больше проникать
медицинские термины «медотвод» и «вакцинация», что отразилось в
формулировках запросов в Интернете.
Поскольку отдельный интерес представляет изучение причин
получения медотводов, было принято решение рассмотреть запросы,
связанные с беременностью как объективным показанием для отказа
от вакцинации и с покупкой медотвода (рис. 14).

Рисунок 14. Динамика частотности запросов, связанных
с причинами для получения медотвода, в Яндекс Вордстат,
по месяцам, 01.07.2022 — 31.10.2024, все регионы, все устройства
Как видно по графику, пиковые значения также приходятся
на осенние месяцы. При этом количество запросов, связанных с беременностью,
как правило превышает количество запросов, связанных с покупкой.
Тем не менее, в связи с этим невозможно предположить, что большинство
медицинских отводов обоснованы объективными причинами, так как люди
могут искать пути для покупки другими путями, не напрямую.
Наконец, рассмотрим регионы, в которых наблюдается повышенный
и пониженный интерес к получению медотводов (рис. 15).

Рисунок 15. Интерес к медотводам в регионах России,
19.10.2024 — 19.11.2024, все устройства
Наибольший интерес наблюдается в Ямало-Ненецком автономном
округе (в 7 раз выше, чем в целом), Республике Коми (в 6,4 раза
выше), Архангельской области (в 5,8 раз выше), Камчатском крае (в
4,2 раза выше) и Кировской области (в 3,6 выше). Наименьший интерес
– в Воронежской области и Калужской областях (в 20 раз ниже), Республике
Адыгея и Тамбовской области (в 5 раз ниже), Тульской области (в
3,4 раза ниже). Таким образом можно наблюдать северный градиент,
что вероятно обусловлено прежде всего климатическими факторами.
Итак, рассмотрение популярности запросов, связанных
с вакцинацией от гриппа, на платформе Яндекс Вордстат показало,
что люди проявляют интерес к причинам проведения вакцинации, ее
сути и противопоказаниям. Кроме этого, людей интересует возможность
отказа от вакцинации, а также получения медотвода. Анализ числа
показов показал, что в динамике количества запросов о медотводов
существуют ярко выраженные всплески. Они приходятся на период Всероссийской
кампании по вакцинации от гриппа – период с сентября по ноябрь.
Пик популярности запросов в последние три года наблюдается в сентябре
и октябре.
Анализ имеющихся данных подтверждает предположение о
том, что у населения существуют как объективные причины для отказа
от прививки от гриппа, в частности, беременность, так и необоснованные,
выраженные в покупке медотвода. Тем не менее, они не позволяют сделать
вывод о соотношении причин, поскольку пользователи могут не упоминать
причину при поиске.
При этом в последние три года пиковое количество запросов
об отказе от вакцинации падает, в отличие от пикового количества
запросов, связанных с медотводом от вакцинации, а суммарное количество
запросов в осенние месяцы остается примерно на одном уровне. Как
говорилось ранее, это может быть связано с использованием более
точных формулировок при поиске в Интернете как следствия повышения
осведомленности населения о медотводах.
Что касается региональной дифференциации, наименьший
интерес к медотводам наблюдается в Центральном федеральном округе,
а наибольший – на севере России. Имеющиеся данные не позволяют дать
однозначного объяснения выявленной специфике распределения интереса
к медотводам. Вероятно, это связано с климатическими условиями и
ранним наступлением сезона холодов, а значит можно ожидать лаговый
эффект в интересе к медотводам, что требует отдельного изучения.
Другими возможными причинами могут быть различные уровни осведомленности
населения о сути и последствиях вакцинации, существование целевых
показателей по вакцинации в регионах, различия в поведенческих и
культурных практиках и др.
Проверка гипотезы о влиянии географического положения
на частоту запросов о гриппе картографическими методами
Для картирования интереса к теме гриппа была использована
статистика Яндекс Вордстат по запросам «грипп», «грипп симптомы»,
«грипп прививка» и «грипп лекарства». Данные взяты с 16.09.2024
по 16.10.2024 и с 20.10.2024 по 20.11.2024. Два разных по времени
интервала были взяты для проверки гипотезы о том, что популярность
интернет запросов может сдвигаться с севера на юг по мере прихода
холодов. Кроме картирования мы опирались на коэффициент Морана для
изучения пространственной взаимосвязи.
Коэффициент Морана показывает степень выраженности пространственной
автокорреляции ряда данных через корреляцию самого ряда со значениями
его пространственных лагов (для региона России X лаги представляют
собой средние значения исследуемого показателя в регионах, граничащих
с регионом X). Таким образом, положительные значения коэффициента
Морана свидетельствуют о наличии положительной пространственной
автокорреляции ряда данных, то есть близкие географически регионы
в таком случае имеют близкие значения исследуемого показателя. Напротив,
отрицательные значения коэффициента Морана свидетельствуют об отрицательной
пространственной автокорреляции ряда данных, то есть близкие географически
регионы в таком случае имеют различные значения исследуемого показателя.
По запросу «грипп» корреляции с географическим положением
региона не наблюдается за 16.09.2024 по 16.10.2024 (рис. 16 и 17).
Можно лишь выделить «очаги» запросов в Мурманской и Магаданской
области, Забайкальском крае, в Республиках Калмыкия и Тыва.

Рисунок 16. Доля от всех запросов по запросу «грипп»
с 16.09.2024 по 16.10.2024

Рисунок 17. Пространственный паттерн по запросу «грипп»
с 16.09.2024 по 16.10.2024
Теперь посмотрим долю запросов «грипп» за 20.10.2024
по 20.11.2024 (рис. 18). Территориального паттерна так же не наблюдается.
Смотря на легенду карты можно увидеть на сколько сильно снизилась
популярность запроса «грипп» в этот период. Если бы мы не изменяли
критерии легенды, то большинство регионов попали бы во вторую группу
снизу. Ярким пятном в этот раз можно выделить только Камчатский
край.

Рисунок 18. Доля от всех запросов по запросу «грипп»
с 20.10.2024 по 20.11.2024
По запросу «грипп симптомы» за 16.09.2024 по 16.10.2024
территориальных паттернов также не прослеживается (рис. 19 и 20).
Всплеск запросов, как и при общем запросе «грипп», приходится на
Магаданскую область.

Рисунок 19. Доля от всех запросов по запросу «грипп
симптомы» с 16.09.2024 по 16.10.2024

Рисунок 20. Пространственный паттерн по запросу «грипп
симптомы» с 16.09.2024 по 16.10.2024.
С 20.10.2024 по 20.11.2024 по данному запросу пространственных
паттернов не наблюдается (рис. 21). Популярность запроса по всем
регионам сильно не изменилась. Всплеск запросов в этот раз приходится
на Камчатский край.

Рисунок 21. Доля от всех запросов по запросу «грипп
симптомы» с 20.10.2024 по 20.11.2024
По запросу «грипп прививка» за 16.09.2024 по 16.10.2024
взаимосвязь уже прослеживается намного лучше (рис. 22 и 23). Высокую
долю в запросах показывают регионы Северо-Запада и их соседи. При
этом всё равно остаются аномальные всплески, пример Забайкальский
край.

Рисунок 22. Доля от всех запросов по запросу «грипп
прививка»

Рисунок 23. Пространственный паттерн по запросу «грипп
прививка» за 16.09.2024 по 16.10.2024
Анализируя на запросы с 20.10.2024 по 20.11.2024 видим,
что популярность запроса в регионах Северо-Запада только выросла
(рис. 24). Т.е. предполагаемое смещение тренда запросов по гриппу
с севера на юг не подтверждается.

Рисунок 24. Доля от всех запросов по запросу «грипп
прививка» с 20.10.2024 по 20.11.2024
По запросу «грипп лекарства» за 16.09.2024 по 16.10.2024
территориальный паттерн выражен ещё сильнее (рис. 25-26). Запрос
популярен в регионах Северо-Кавказского, Южного и в южной части
Приволжского федерального округа. Аномальных очагов как в предыдущих
картах не наблюдается.

Рисунок 25. Доля от всех запросов по запросу «грипп
лекарства» с 16.09.2024 по 16.10.2024

Рисунок 26. Пространственный паттерн по запросу «грипп
лекарства» с 16.09.2024 по 16.10.2024.
При этом за 20.10.2024 по 20.11.2024 популярность запроса
снизилась (рис. 27). Можно отметить, что запрос остаётся популярен
в регионах Северного Кавказа и Южного федерального округа, но при
этом спадает популярность в регионах Приволжья. Отчасти спад популярности
запроса в регионах Поволжья можно связать со смещением популярности
на юг, но при этом мы видим, что в регионах Северного-Кавказа идёт
аналогичный спад в заинтересованности по этому запросу.

Рисунок 27. Доля от всех запросов по запросу «грипп
лекарства» с 20.10.2024 по 20.11.2024
Итак, были выявлены пространственные паттерны по запросам
«грипп прививка» и «грипп лекарства» с 16.09.2024 по 16.10.2024
и с 20.10.2024 по 20.11.2024. При этом стоит отметить, что запрос
«грипп прививка» популярен в регионах Северо-Запада России, а «грипп
лекарства» наоборот более популярен на Северном-Кавказе.
Высказанная ранее гипотеза картографическим способом
подтвердилась частично: популярность запросов «грипп прививка» и
«грипп лекарства» спустя месяц остаются в тех же макрорегионах,
а значит диффузии заболевания на этом временном промежутке не прослеживается.
Для дальнейшего анализа можно попробовать перейти к подневным данным
и расширить временной горизонт, а также включить дополнительные
поисковые запросы, например, «грипп лечение», конкретные вакцины
и мультисимптомные препараты. В тоже время выявлены пространственные
паттерны по запросам «грипп прививка» и «грипп лекарства».
Интерес к теме гриппа: кейс Самарской области
Введение
Этот параграф посвящен попытке обнаружить различия между
городами Самарской области по интенсивности и тематике запросов,
связанных с гриппом, в поисковике Яндекс в течение последнего года.
При этом мы сочли необходимым удлинить исследуемый период: конец
календарного года традиционно связан с максимальным интересом пользователей
к теме гриппа, поэтому рассматривать ряд с середины ноября неудобно:
период повышенного интереса хочется исследовать с начала, которое
наступает примерно в августе-сентябре. Таким образом, в работе рассматривается
период с 1 августа 2023 г. по 31 октября 2024 г. (в месячных данных)
или с 31 июля 2023 г. по 17 ноября 2024 г. (в недельных данных).
Сервис Яндекс Вордстат позволяет изучить по отдельности
пять городов Самарской области: Самару, Тольятти, Сызрань, Новокуйбышевск
и Жигулёвск. Выбор Самарской области обусловлен тем,
что её города, доступные для исследования, относятся к пяти разным
категориям по численности населения: Самара — город-миллионер (1,16
млн чел. на 01.01.2024), Тольятти входит в категорию крупнейших
городов (668 тыс. чел.), Сызрань — большой город (162 тыс. чел.),
Новокуйбышевск — средний (96 тыс. чел.), а Жигулёвск — малый (49
тыс.). Из данных Яндекс Вордстат нельзя понять, с какой территории
собирались запросы: именно города или же городского округа, в состав
которого он входит. Мы склоняемся ко второму варианту и поэтому
в расчётах подушевых показателей используем численность населения
городских округов (табл. 2). Сравнивая их между собой, можно попробовать
оценить связь размера города с интересами его жителей.
Таблица 2. Численность населения рассмотренных территорий*
Территория
|
Численность населения на 1 января 2024 г., чел.
|
Самарская область
|
3127842
|
Городской округ Самара
|
1159044
|
Городской округ Тольятти
|
667956
|
Городской округ Сызрань
|
162372
|
Городской округ Новокуйбышевск
|
98550
|
Городской округ Жигулёвск
|
52171
|
* Использована численность населения на 01.01.2024, предположительно,
наиболее близкая к среднему значению численности населения в августе
2023 — ноябре 2024 гг.
Источник: Росстат. Численность населения по муниципальным
образованиям на 1 января 2024 г.
Мы сравнили города Самарской области по популярности
шести запросов: «грипп», «симптомы гриппа», «прививка от гриппа»,
«жаропонижающие», «при какой температуре вызывать скорую» и «чем
сбить температуру» в порядке убывания общего количества запросов.
Первые четыре запроса рассмотрены понедельно, последние два — помесячно,
так как даже в зимние месяцы пользователи обращаются к ним довольно
редко (табл. 3).
Таблица 3. Частота выбранных запросов
Запрос
|
Количество запросов за 31.07.2023 — 17.11.2024
|
грипп
|
273695
|
прививка от гриппа
|
43907
|
жаропонижающие
|
40003
|
симптомы гриппа
|
19868
|
чем сбить температуру
|
14182
|
при какой температуре вызывать скорую
|
1768
|
Относительная популярность отдельных запросов
В данном разделе рассматривается популярность отдельных
запросов относительно муниципальных единиц Самарской области. Здесь
мы стараемся проанализировать, насколько в целом популярен той или
иной запрос относительно общей картины в регионе. Для этого мы использовали
количество запросов по теме за год на душу населения по муниципальным
единицам, а затем нормировали его на максимальное значение среди
всех муниципальных единиц. Вышло, что г. Самара являлся лидером
по среднему количеству запросов на душу населения, и на каждом блоке
графика он является лидером (рис. 28).

Рисунок 28. Относительная популярность запросов (в %
от максимального значения) в Самарской области и её городах за весь
период наблюдений. Сортировка по численности населения.
Все остальные города значительно отстают от г. Самары
по части популярности запросов. Средняя популярность запросов в
других городах относительно г. Самары составляет около 70%. Наиболее
значительное отставание фиксируется в запросах на тему «вызова скорой»
и «прививки от гриппа», что скорее всего связано с разной доступностью
данных услуг в разных городах. Более простые запросы, например,
«чем сбить температуру», примерно одинаково распределены по всей
Самарской области, и там отставание от столицы минимально.
Различия в динамике
За обозреваемый период в Самарской области отмечено
три скачка интереса к гриппу: сентябрь и декабрь 2023 г., а затем
сентябрь 2024 г. (рис. 29). При этом на обоих осенних пиках выделяются
Самара и её пригород Новокуйбышевск, а в остальных городах количество
запросов на душу населения заметно ниже; во время максимального
интереса к гриппу (декабрь 2023 г.) Новокуйбышевск, напротив, остаётся
примерно на среднеобластном уровне, уступая не только Самаре, но
и Сызрани с Жигулёвском. «Фоновая» частота обращений к тематике
гриппа выше всего у Самары: даже в летние месяцы средний самарец
вводит такие запросы чаще, чем жители остальных городов области.
Напротив, в Жигулёвске и Сызрани люди в среднем вводили запрос «грипп»
реже, чем в остальных городах, но в период максимального интереса
(декабрь 2023 г.) интенсивность запросов в этих городах выросла
даже сильнее, чем в остальных, что позволило им сравняться по этому
показателю с Самарой.

Рисунок 29. Динамика запросов со словом «грипп» в расчёте
на 100 000 чел. населения. Рассчитано по данным Яндекс Вордстат
Из рис. 30–35 видно, что декабрьский пик интереса к
гриппу проявляется для большинства запросов и, вероятно, вызван
реальным скачком заболеваемости, а два сентябрьских отмечены только
для запросов, связанных с вакцинацией («прививка от гриппа»), которая
традиционно проводится именно осенью. По всей видимости, именно
интерес к вакцинации выступает одним из главных факторов дифференциации
городов Самарской области: на пике жители Самары ищут «прививку
от гриппа» на 40% чаще, чем в среднем по области, жители Новокуйбышевска
— примерно на среднеобластном уровне, а жители Сызрани и Жигулёвска
— на 25–45% реже. С другой стороны, в этих двух городах, как и в
Самаре, в декабре 2023 г. чаще среднего интересовались «симптомами
гриппа», в т. ч. в Жигулёвске — почти в два раза. Самара и Жигулёвск
оказались лидерами по «дополнительным» запросам: в декабре 2023
г. их жители чаще всего искали в Яндексе «жаропонижающие», а также
пытались узнать, «чем сбить температуру» и «при какой температуре
вызывать скорую».
Если для Самары повышенная частота запросов может объясняться
повышенной численностью молодёжи, более активно пользующейся поисковиками
(например, студентов), то в случае Жигулёвска высокую интенсивность
объяснить сложнее. Возможно, из-за ошибок геопозиционирования Жигулёвск
«перехватывает» часть запросов, в действительности отправленных
из расположенного неподалёку Тольятти. Правда, аналогичной ситуации
для пары Самара — Новокуйбышевск мы не наблюдаем.

Рисунок 30. Динамика запросов со словами «симптомы гриппа»
в расчёте на 100 000 чел. населения. Рассчитано по данным Яндекс
Вордстат

Рисунок 31. Динамика запросов со словами «прививка от
гриппа» в расчёте на 100000 чел. населения. Рассчитано по данным
Яндекс Вордстат

Рисунок 32. Динамика запросов со словом «жаропонижающие»
в расчёте на 100000 чел. населения. Рассчитано по данным Яндекс
Вордстат

Рисунок 33. Динамика запросов со словами «при какой
температуре вызывать скорую» в расчёте на 100000 чел. населения.
Рассчитано по данным Яндекс Вордстат

Рисунок 34. Динамика запросов со словами «чем сбить
температуру» в расчёте на 100000 чел. населения. Рассчитано по данным
Яндекс Вордстат
Итак, среди рассмотренных городов Самарской области
существенно отличается от остальных по интенсивности запросов, пожалуй,
только Самара, тогда как по тематике отличий практически нет. Часть
найденных особенностей может объясняться размером города и связанными
с ним возможностями здравоохранения (жители Самары и Тольятти чаще
интересуются прививками и вызовом скорой), но самое важное отличие,
видимо, связано с особенностями поведения самарцев: у них заметно
выше фоновый уровень популярности рассмотренных запросов
даже в периоды максимального интереса к теме гриппа (рис. 28). При
этом их доля среди всех запросов почти равна значению по Самарской
области (0,079‰ в среднем за рассмотренный период по Самаре и 0,080‰
по области), т. е. дело, по всей видимости, в том, что жители Самары
просто чаще пользуются интернет-поиском по любым вопросам, чем жители
других городов региона.
Заключение
Интерес к теме гриппа в Интернете носит сезонный характер:
максимальное внимание к вакцинации и медотводам наблюдается в сентябре
и связано с массовой кампанией по вакцинации; симптомы гриппа и
способы его лечения люди чаще всего ищут в декабре. Анализ динамики
запросов показал, что в отношении гриппа в лексиконе происходит
сдвиг в сторону употребления медицинского термина «медотвод» вместо
«отказ», что касается частоты употребления фразы «вакцина от гриппа»
вместо «прививка от гриппа», то вторая пока употребляется в 7 раз
чаще.
В ходе работы мы выявили несколько направлений для будущих
исследований. Во-первых, это рассмотрение причин, по которым некоторые
регионы и города оказываются в начале или хвосте рейтинга среди
запросов о гриппе. Во-вторых, было бы полезно более детально рассмотреть
изменение уровня интереса к теме гриппа как диффузию заболевания
с лаговым эффектом, которое может распространяться от одних очагов
болезни в другие, тем более что мы не нашли однозначного подтверждения
этому предположению на двухмесячном периоде. В-третьих, требуется
анализ изменения структуры запросов, которые относятся к профилактике,
получению медотводов и лечению гриппа, во времени и пространстве.
Наконец, наиболее важный вопрос, который остался вне рамок данного
исследования, это насколько динамика запросов о гриппе соответствует
реальной заболеваемости гриппом и какова прогнозная сила онлайн
запросов в России.
Приложение 1

Рисунок.1. Динамика популярности запроса «грипп» за
прошедший. Скриншот авторов с сайта Google Trends

Рисунок 2. Динамика популярности запроса «грипп» за
последние 3 месяца. Скриншот авторов с сайта Google Trends

Рисунок 3. Популярность запроса «Грипп» по регионам
РФ. Скриншот авторов с сайта Google Trends

Рисунок 4. Популярность запроса «грипп» по городам РФ.
Скриншот авторов с сайта Google Trends
Примечание: можно выбрать или не выбрать города с малым
количеством запросов

Рисунок 5. Рекомендации сайта похожих запросов и их
популярность. Скриншот авторов с сайта Google Trends
Примечание: можно выбрать «в тренде» или «лидеры»

Рисунок 6. Рекомендации сайта похожих запросов и их
популярность. Скриншот авторов с сайта Google Trends
Примечание: можно выбрать «в тренде» или «лидеры»

Рисунок 7. Сравнение динамики популярности нескольких
запросов между собой на примере популярности запросов «ультрикс»,
«совигрипп», «гриппол» и «Флю-М». Скриншот авторов с сайта Google
Trends

Рисунок 8. Сравнение динамики популярности нескольких
запросов между собой на примере популярности запросов «вакцина от
гриппа» и «прививка от гриппа». Скриншот авторов с сайта Google
Trends
Приложение 2

Рисунок 1. Главная страница Вордстата, раздел «Топ запросов»
с примером запроса «Грипп» с 19.10.24-19.11.24 гг. Скриншот авторов
с сайта Яндекс Вордстат

Рисунок 2. Раздел «Динамика» с примером динамики популярности
запроса «грипп» с 08.24-10.24 гг. Скриншот авторов с сайта Яндекс
Вордстат

Рисунок 3. Раздел «Регионы» с примером результата числа
топ-запросов, доли от всех запросов в % и индекса интереса запроса
«Грипп» за 19.10.2024 – 19.11.2024 по регионам РФ. Скриншот авторов
с сайта «Яндекс Вордстат»
[1] Работа выполнена в рамках
курса «Здоровье и смертность: современные тенденции и их исследования»
в 2024 г. Научный вклад участников: Коршунова Ю., Пупкова Е. - обзор
литературы по использованию Google Trends и Яндекс Вордстат при
прогнозировании заболеваемости гриппом. Лисов А., Шавырин Д. - сходства
и различия Google Trends и Яндекс Вордстат, Ломанова А., Марычев
Г. - интерес к вакцинации от гриппа по данным Вордстат, Блохина
С., Кобилов Б. - интерес к медотводам при вакцинации от гриппа,
Мигунов Н., Худайбердин Д. - проверка гипотезы о влиянии географического
положения на частоту запросов о гриппе картографическими методами,
Балабан М., Строгонов А. - интерес к теме гриппа: кейс Самарской
области, Юмагузин В. – идея, научное руководство, параграф о сходствах
и различиях Google Trends и Яндекс Вордстат.
[2] Google Trends
[Электронный ресурс] URL: https://trends.google.ru/trends/explore?geo=RU&hl=ru
[3] Яндекс Вордстат
[Электронный ресурс] URL: https://wordstat.yandex.ru/
[4] Klembczyk JJ, Jalalpour
M, Levin S, Washington RE, Pines JM, Rothman RE, Dugas AF Google
Flu Trends Spatial Variability Validated Against Emergency Department
Influenza-Related Visits. J Med Internet Res 2016; 18(6):e175. doi:
10.2196/jmir.5585
[5] Pervaiz F, Pervaiz M, Abdur
Rehman N, Saif U FluBreaks: Early Epidemic Detection from Google
Flu Trends. J Med Internet Res 2012 ;14(5): e125 doi: 10.2196/jmir.2102
[6] Kandula S, Shaman J. Reappraising
the utility of Google Flu Trends. PLoS Comput Biol 2019,
15(8): e1007258. https://doi.org/10.1371/journal.pcbi.1007258
[7] Броницкий Г. Т., Вакуленко
Е. С. (2022). Прогнозирование миграции из России в Германию с использованием
Google-трендов. Демографическое обозрение, 9(3), 75-92.
https://doi.org/10.17323/demreview.v9i3.16471
[8] Similarweb. URL: https://pro.similarweb.com/#/digitalsuite/websiteanalysis/overview/website-performance/*/999/1m?webSource=Total&key=yandex.ru
[9] Соколов А.Д. (2016). Прогнозирование
эпидемиологических показателей гриппа на основании запросов Yandex.
International scientific review, (8 (18)), 28-29.
[10] Хорошун, Д.К., Момыналиев,
К.Т., Воронин, Е.М., Акимкин, В.Г. Анализ поисковых запросов в «Яндексе»,
связанных с COVID 19 в Российской Федерации. Медицинский алфавит.
2022;(14):14 22. https://doi.org/10.33667/2078-5631-2022-18-14-22
[11] Menni C, Valdes AM,
Freidin MB, et al. Real-time tracking of self-reported symptoms
to predict potential COVID-19. Nat Med 2020;26:1037–40.doi:10.1038/s41591-020-0916-2
[12] Momynaliev K.T., Khoroshun
D. K., Akimkin V. G. Online queries as a criterion for evaluation
of the epidemiological status and effectiveness of COVID 19 epidemic
control measures. BMJ Open 2022. Volume 12, Issue 7. DOI: https://bmjopen.bmj.com/content/12/7/e056716
[13] Момыналиев К.Т., Акимкин
В.Г. Анализ запросов динамики Google Trends в России в период пандемии
коронавирусной инфекции как инструмент эпидемиологического надзора.
Эпидемиол. инфекц. болезни. Актуал. вопр. 2020; 10(4)
[14] Блох, А.И., Красовская,
М.А., Абдрашитова, Л.В., Пеньевская, Н.А., Рудаков, Н.В. Поисковая
активность в сети интернет как маркер эпидемиологической ситуации
по COVID-19 / Национальные приоритеты России. – 2021. – № 3 (42).
– 75-78 с.
[15] Яндекс указывает размерность
индекса в %, хотя индексы не имеют размерности.
[16] Дополнительные примеры
по работе с символами и операторами описаны в справке https://yandex.ru/support/direct/ru/keywords/symbols-and-operators
[17] Более подробно о работе
с Google Trends, в т.ч. посмотреть обучающие материалы можно на
главной странице сервиса https://trends.google.ru/trends/?geo=RU&hl=ru
[18] Формулировка
запроса осознанно не уточнялась, в выдачу включены запросы со словами
«медотвод», «отказ», «обязательно», «заставляют», «справка», «противопоказания»
и т. п., так как предметом работы является интерес к вакцинации
от гриппа в целом. Запросы, подразумевающие обязательность вакцинации
или её обход, не противоречат предмету работы, а наоборот, увеличивают
полноту анализа. Исключение из формулировок упомянутых слов, по
нашему мнению, является целесообразным при углубленном изучении
дифференциации запросов, что не являлось целью данной работы.
[19] Пик не объясняется запросом
«прививка от гриппа и коронавируса»: число таких запросов в сентябре
2020 года составляло 4 тыс. – меньше 0,3% от числа всех запросов
«прививка от гриппа».
[20] Pandolfi
F., Franza L., Todi L., Carusi V., Centrone M., Buonomo. A. (2018).
The Importance of Complying with Vaccination Protocols in Developed
Countries: “Anti-Vax” Hysteria and the Spread of Severe Preventable
Diseases. Vol. 25, 42. -pp 6070-6082.
[21] Kathryn M.
Edwards, MD; Jesse M. Hackell, MD. Countering Vaccine Hesitancy.
Pediatrics. [Электронный ресурс] URL: https://publications.aap.org/pediatrics/article/138/3/e20162146/52702/Countering-Vaccine-Hesitancy?autologincheck=redirected
[22] Калюжная
Т. А. и др. Преодоление"антипрививочного скепсиса": поиски решения
выхода из сложившейся ситуации //Педиатрическая фармакология. –
2018. – Т. 15. – №. 2. – С. 141-148.
[23] Fiebach,
N., & Viscoli, C. (1991). Patient acceptance of influenza vaccination..
The American journal of medicine, 91 4, 393-400
[24] Kalucka,
S., & Grzegorczyk-Karolak, I. (2021). Barriers Associated with
the Uptake Ratio of Seasonal Flu Vaccine and Ways to Improve Influenza
Vaccination Coverage among Young Health Care Workers in Poland.
Vaccines, 9.
[25] Munoz-Miralles,
R., Nadeu, S., Masoliver, C., Gallego, A., Canto, J., Pena, J.,
& Esteve, A. (2021). Effectiveness of a brief intervention for
acceptance of influenza vaccine in reluctant primary care patients..
Gaceta sanitaria.
[26] d'Alessandro,
E., Hubert, D., Launay, O., Bassinet, L., Lortholary, O., Jaffre,
Y., & Sermet-Gaudelus, I. (2012). Determinants of Refusal of
A/H1N1 Pandemic Vaccination in a High Risk Population: A Qualitative
Approach. PLoS ONE, 7.
[27] Chen, F.,
& Stevens, R. (2016). Applying lessons from behavioral economics
to increase flu vaccination rates. Health Promotion International,
32, 1067–1073.
[28] Можно посмотреть
такие работы как: Vaccination ethics Alberto Giubilini British Medical
Bulletin, Volume 137, Issue 1, March 2021, Pages 4–12, The case
for mandatory vaccination Liam Drew 27 November 2019 NATURE [Электронный
ресурс] URL: https://www.nature.com/articles/d41586-019-03642-w">https://www.nature.com/articles/d41586-019-03642-w
или Determinants of the Hesitancy toward COVID-19 Vaccination in
Eastern European Countries and the Relationship with Health and
Vaccine Literacy.
[29] ФБУЗ “Центр
гигиенического образования населения”. Старт Всероссийской прививочной
кампании против гриппа. [Электронный ресурс] URL: https://cgon.rospotrebnadzor.ru/naseleniyu/vaktsinatsiya/dopolnitelnaya-informatsiya-o-vaktsinatsii/start-vserossiyskoy-privivochnoy-kampanii-protiv-grippa/
|