|
Возможности использования данных, основанных на записях
актов гражданского состояния, для оценки влияния миграции на воспроизводство
населения
С.С. Бирюкова1,
О.С. Чудиновских2
(Опубликовано в журнале "Вопросы статистики, 2011, №8, с.
49-58)
В последние годы миграция является предметом повышенного
интереса исследователей и политиков в связи с очевидными и разнонаправленными
последствиями этого процесса для населения мест прибытия и мест
исхода. Это касается и внутренних, и международных миграционных
перемещений, которые могут различаться расстояниями, длительностью
пребывания мигрантов на новом месте, целями поездок. Прямое влияние
миграции на динамику численности населения мы наблюдаем в случае
переезда на постоянное жительство, когда мигранты формируют миграционный
прирост или убыль населения. Но есть и еще одна форма вклада мигрантов
в динамику численности населения: многие из них участвуют в процессах
естественного движения по месту своего нахождения в момент наступления
демографических событий.
В отличие от России, где эта тема практически не изучена,
исследования влияния миграции на естественное движение населения
за рубежом выполняются уже на протяжении достаточно длительного
времени. Их популярность и разнообразие растут. Результаты таких
работ показывают, насколько сильным может быть влияние международной
и внутренней миграции на динамику численности населения регионов
страны и государства в целом. В основе большей части европейских
исследований лежат данные, извлеченные из общенациональных и муниципальных
регистров населения3.
В них, как правило, содержится информация о времени миграции, стране
исхода, а также о гражданстве мигранта. Исключение составляют работы
британских ученых: они во многом основываются на данных переписи
населения, соотнесенных с информацией, получаемой в ходе текущего
учета демографических событий и данными лонгитюдных выборочных обследований4.
Наряду с регистрами населения, европейские исследователи
привлекают и другие источники. Так, в Германии при изучении вклада
мигрантов в смертность нередко используются сведения из системы
пенсионного обеспечения; в Швеции преимущественно используется информация
из регистров населения5;
в Великобритании ряд исследователей используют данные Ежегодного
обследования населения6.
В Соединенных Штатах основным источником данных являются крупные
выборочные обследования7,
которые проводятся на регулярной основе по репрезентативной в масштабах
страны выборке, а также данные цензов и текущего учета.
Например, исследования американских ученых показали,
что в середине 1990-х годов значительный естественный прирост населения
Калифорнии был связан с интенсивной международной и внутренней миграцией;
более половины всех родившихся в штате были детьми международных
мигрантов (лиц, которые родились за рубежом)8.
В то же время в Соединенных Штатах были обнаружены различия в уровнях
младенческой смертности среди коренного белого населения и мигрантов
мексиканского происхождения, причем уровень смертности последних
оказался ниже9. Европейские
исследования показывают, что во многих странах доля рождений от
женщин-мигранток оказывается относительно высокой в общем числе
рождений. Так, по экспертным оценкам, этот показатель составляет
более 0,25 (25%) в Швейцарии, более 0,2 (20%) в Англии и Уэльсе;
около 0,18 (18%) в Бельгии, Германии, Испании, Нидерландах и Швеции
и более 0,1 (10%) в Италии, Франции, Австрии и Дании10.
Россия также относится к странам, в которых миграционные
процессы оказывают влияние на структуру населения и на процессы
его воспроизводства. Международной миграции в РФ свойственно преобладание
временных форм и низкая интенсивность чистой миграции на постоянное
жительство, хотя на протяжении длительного времени она сохраняет
положительные значения. С 1992 по 2010 г. на постоянное место жительства
в Россию переехали более 8 млн. человек, в последние годы ежегодный
поток иммиграции составляет около 270-280 тыс. человек (в 2010 г.
- 192 тыс.). На протяжении последних лет ФМС России ежегодно ставила
на миграционный учет около 8-9 млн. иностранных граждан, приехавших
на срок от нескольких дней до года. Эти мигранты не включаются в
состав постоянного населения, но они вносят вклад в естественное
движение. Значение внутренних перемещений тоже нельзя недооценивать,
несмотря на то, что в последние годы в фокусе интересов политиков
и исследователей чаще всего оказывается международная миграция.
Ежегодно в пределах России меняют место постоянного жительства около
2 млн. человек. Существенно большее число лиц совершают краткосрочные
и временные переезды в пределах России. По данным ФМС России, в
2007-2009 гг. по месту пребывания регистрировались свыше 4 млн.
человек в год (только в Москве, около 1,2 млн.). В 2010 г. этот
показатель вырос до десяти с лишним миллионов за счет включения
в учет лиц, зарегистрированных в гостиницах, что раньше во многих
регионах не делалось11.
Сроки регистрации по месту пребывания и количество повторов практически
не ограничены. Многие из «временных» мигрантов на самом деле могут
считаться частью постоянного населения регионов прибытия, хотя официальная
статистика учитывает лишь небольшую часть этих мигрантов.
По данным Всероссийской переписи населения 2002 г.,
в среднем по России около пятой части постоянного населения составляли
лица, родившиеся в других регионах или странах. Из них родились
за пределами России 8%, а остальные 12% были «внутренними иммигрантами»,
то есть лицами, родившимися в других регионах РФ. В Дальневосточном,
Уральском и Северо-Западном федеральных округах этот показатель
был еще выше, достигая почти 20%12.
К сожалению, информация о российских исследованиях влияния
миграции на естественное движение крайне скудна. Вклад мигрантов
в смертность, судя по всему, не изучается вообще, а в области изучения
связи миграции и рождаемости можно привести только единичные примеры13.
Своеобразный вакуум таких исследований в нашей стране специалисты
объясняют отсутствием необходимых для их проведения данных. У нас
пока отсутствует регистр населения, а регулярных репрезентативных
выборочных обследований, в полной мере удовлетворяющих целям подобных
исследований, не проводится. В основу недавнего исследования С.
Захарова и С. Суркова, упомянутого выше, легли материалы двух выборочных
обследований: «Родители и дети, мужчины и женщины в семье и обществе»14
(волны 2004 г.) и «Образование и занятость» (проведено в 2005
г. на основе той же выборки респондентов). К сожалению, в нашей
стране указанное выборочное обследование является уникальным с точки
зрения состава собираемых данных и объема выборки, что связано,
в первую очередь, с высокой стоимостью его организации и проведения.
Информация, полученная в ходе Всероссийской переписи,
также не применяется для подобных исследований, поскольку круг вопросов
недостаточно широк, а полученные данные не разрабатываются в полном
объеме из-за финансовых трудностей. К недостаткам переписи относится
также значительный межпереписной интервал, что не дает возможности
проводить анализ на регулярной основе и отслеживать динамику ситуации.
В таком положении для реализации подобных исследований
представляется оправданным использование административных данных15.
Массивы записей актов гражданского состояния о событиях рождения
и смерти уже на протяжении многих лет формируются в электронном
виде16 и содержат
основные «миграционные» переменные: место рождения, место постоянного
жительства (регистрации) и гражданство (все переменные заполняются
для умерших и для каждого из родителей новорожденного).
Нужно отметить, что некоторые территориальные органы
статистики в России делают оценку вклада лиц, не являющихся частью
постоянного населения данной территории, в рождаемость и смертность.
Так, при формировании отчетности по г. Москве отдельной строкой
выделяется группа «иногородние», на долю которых в первой половине
2000-х годов приходилось более 13% зарегистрированных рождений и
около 11% смертей. По данным Территориального органа Росстата по
г. Москве, в 2010 г. число рождений среди этой категории населения
превысило число умерших. Иными словами, в отличие от убывающего
постоянного населения города (естественная убыль в 2010 г. составила
13,3 тыс. человек), в данной группе имел место естественный прирост
(10,2 тыс. человек)17.
Однако выделение агрегированной группы «иногородних» не может дать
развернутого представления о характере участия мигрантов в указанных
демографических процессах. В ней отсутствуют сведения о гражданстве
и месте жительства этих лиц. Помимо «иногородних», среди тех лиц,
которые не были зарегистрированы на данной территории на момент
составления актовой записи, с исследовательской точки зрения интерес
представляют пожизненные мигранты, то есть постоянные жители данного
региона, родившиеся в других местах.
В России события естественного движения регистрируются
органами ЗАГС18
и включаются в статистику населения тех субъектов РФ, на территории
которых они произошли. Органы государственной статистики на основе
этих первичных данных впоследствии разрабатывают соответствующую
отчетность. Однако до настоящего времени сведения о месте рождения,
месте постоянного жительства или гражданстве лиц, в отношении которых
были сделаны эти записи, не разрабатывалась. Иными словами, данные
органов ЗАГС можно рассматривать как пока еще неиспользованный,
но очень богатый ресурс, который поможет лучше понять масштабы последствий
миграции. При анализе миграции важен вопрос определений. В данной
работе и только в контексте разработки базы данных органов ЗАГС
под «мигрантами» мы будем понимать всех лиц, у которых в актовых
записях место рождения19
или место регистрации по месту жительства отличались от места регистрации
события. В качестве еще одного критерия выделения «мигрантов» мы
использовали гражданство, хотя эта переменная не всегда связана
с миграцией.
Понятно, что оценивать «вклад» мигрантов в процессы
естественного движения населения только на основе актовых записей,
сделанных в отношении «не местных» уроженцев, жителей или не граждан
РФ - это несколько упрощенный подход. Большое значение имеет время
переезда и статус мигранта: проживает ли он постоянно, временно
или лишь оказался на данной территории в момент наступления события.
Государственная статистика миграции по ряду причин (связанных как
с методологией учета, так и нежеланием или отсутствием возможности
у части мигрантов регистрироваться), не может отразить всех мигрантов
и учесть длительность их пребывания на территории, где произошло
и (или) было зарегистрировано демографическое событие. При этом,
разумеется, рождение детей и смерть, а также возможность зарегистрировать
эти события там, где они произошли, не зависят от наличия у человека
российского гражданства, регистрации или, если речь идет о временно
пребывающих иностранцах, постановки его (ее) на миграционный учет20.
Нужно отметить, что из-за невозможности выделить категории
мигрантов с различным сроком пребывания на данной территории, имеет
место проблема расчета относительных показателей рождаемости и смертности.
В знаменателе используется оценочная численность постоянного населения
(включающая весь естественный прирост, сформированный постоянным
населением и мигрантами, и сальдо миграции только на постоянное
жительство), а в числителе - все демографические события, зарегистрированные
на данной территории.
Несмотря на то, что изучение состава мигрантов по длительности
пребывания на территории пока что не представляется возможным, это
отнюдь не умаляет необходимости исследовать, хотя бы в первом приближении,
масштаб участия мигрантов в показателях рождаемости и смертности.
Такой анализ даст расширенное представление о влиянии мигрантов
на динамику населения и показатели естественного движения, которые
в ряде регионов напрямую зависят от присутствия мигрантов на их
территории. Кроме того, мы не сможем двигаться дальше, если не оценим
аналитический потенциал данных, основанных на актовых записях, и
не увидим пределы их использования.
Описание информационной базы исследования. В
основе нашего исследования лежат данные текущего учета естественного
населения г. Москвы, который ведется в многоуровневой автоматизированной
интегрированной системе «ЗАГС» (МАИС «ЗАГС»), разработанной ЗАО
«Инженерно-внедренческий Центр Инсофт»21.
Указанная система предназначена для работы «отделов и архивов ЗАГС,
Дворцов бракосочетания, Дворцов малютки, пунктов регистрации смерти,
городских и сельских филиалов отделов ЗАГС, руководящих органов
ЗАГС субъектов РФ, консульских отделов ЗАГС за границей»22.
В настоящее время заказчиками МАИС «ЗАГС» (версия Microsoft) являются
органы исполнительной власти 43 регионов Российской Федерации23.
Мы можем предположить, что выявленные нами проблемы могут встречаться
в базах данных органов ЗАГС и в других регионах России, вне зависимости
от используемого программного продукта. Набор переменных и форма
вводимых сведений в таких программах предопределены формой стандартных
документов с первичной информацией.
Информация, введенная в систему «ЗАГС», затем хранится
в электронных файлах, с которыми можно в дальнейшем работать с помощью
основных статистических пакетов. Иначе говоря, формируется база
данных, теоретически пригодная и удобная для последующей обработки.
В нашем случае мы имели дело с 10 файлами формата Microsoft Excel
с помесячными записями о регистрации смертей с февраля 2009 г. по
ноябрь того же года24,
в которых в общей сложности содержалось 98286 записей, сделанных
в 19 московских органах ЗАГС; и с 10 файлами с помесячными записями
о регистрации рождений за тот же период, где содержалось 96598 записей
из 26 московских органов ЗАГС. В этом отношении полученные в тестовом
порядке распределения характеризуют только этот массив данных, однако
их было более чем достаточно для определения основных проблем, присущих
указанному источнику с точки зрения последующей статистической разработки.
Номенклатура полей в файлах определяется содержанием
документов, необходимых для регистрации того или иного акта гражданского
состояния. Так, файлы регистрации смертей содержат 40 полей, перечень
которых практически полностью совпадает с пунктами бланка Заявления
о смерти (форма №16) и медицинского документа о смерти - за исключением
трех переменных: код последнего места жительства, статус умершего25,
а также его возрастная группа, которые кодируются сотрудниками органов
ЗАГС. Файлы регистрации рождений включают в себя 30 полей, три из
которых также кодируются сотрудниками органов ЗАГС (коды места регистрации
отца и матери ребенка и тип документа, на основании которого вносятся
сведения об отце), а остальные - согласуются с полями, содержащимися
в бланках Заявлений о рождении (формы № 1, 2, 4-6).
С точки зрения нашего исследования, интерес представляют
прежде всего поля, содержащие информацию о гражданстве, месте рождения,
месте регистрации (последней) и месте смерти умершего, а также поля,
содержащие данные о гражданстве, месте рождения26
и месте регистрации (по месту жительства) родителей новорожденного.
Наличие этих переменных позволяет выделять совокупности мигрантов
сразу по нескольким признакам. Кроме того, эти признаки можно дополнять
(сочетать с) информацией из других граф, содержащих традиционные
демографические характеристики, такие, как пол и возраст.
В техническом описании МАИС «ЗАГС» разработчики программного
обеспечения подчеркивают, что «при регистрации актов гражданского
состояния ввод реквизитов записи актов осуществляется с соблюдением
правил контроля корректности их заполнения и правил целостности
формируемой базы» и при этом «ввод информации производится с использованием
общероссийских, региональных и внутрисистемных справочников и классификаторов»;
«предоставляется возможность автоматического проставления значений
по умолчанию»27.
Это замечание очень важно: подобная форма ввода информации должна
являться надежной защитой от ошибок и опечаток в текстовых полях,
содержащих географические наименования. Автоматическое заполнение
ряда полей также предоставляет возможность избежать неумышленных
ошибок при заполнении форм регистрации и позволяет сократить время
ввода. В описании также отмечается, что среди функций подсистемы
«Государственной регистрации актов гражданского состояния» МАИС
«ЗАГС» отдельно выделяется контроль целостности данных о месте рождения,
месте жительства и месте смерти28.
Такой пункт также представляется нам крайне важным, поскольку именно
это, вероятно, должно обеспечить возможность сопоставления информации
по указанным трем переменным.
Отдельное внимание разработчики уделяют процессу регистрации
рождения, поскольку именно он - в силу большого разнообразия вариантов
регистрации - представляет наибольшую трудность с точки зрения автоматизации.
Регистрация рождения может, во-первых, производиться как по письменному,
так и по устному заявлению. Во-вторых, заявителем могут выступать
оба родителя или один из них, а также родственники ребенка, должностное
лицо медицинской (или другой) организации, в которой во время родов
находилась мать, или на момент регистрации рождения находится ребенок.
В дополнение к вышеперечисленному, «в случае изменения на основании
решения суда об установлении усыновления ребенка места рождения
ребенка по желанию усыновителей (усыновителя) может быть составлена
новая запись акта о рождении ребенка органом записи актов гражданского
состояния по месту рождения ребенка, указанному в решении суда»29.
В каждом случае, в зависимости от формы заявления и
типа заявителя, при вводе данных в автоматизированную систему доступным
для заполнения оказывается необходимый набор реквизитов. Кроме того,
записи подразделяются на типы в соответствии с основаниями внесения
сведений об отце. Для каждого из типов, выделенных на основе этого
критерия, контролируется корректность заполнения реквизитов. Так,
как подчеркивается в описании механизма регистрации рождений, в
соответствии со статьей 17 ФЗ «Об актах гражданского состояния»,
в тех случаях, когда сведения об отце вносятся на основании свидетельства
о браке родителей, дата заключения брака не может превышать даты
рождения ребенка.
Таков механизм работы МАИС «ЗАГС», что называется, «в
теории». Практическая же его реализация, как показал анализ реальных
массивов данных, значительно отличается от представлений разработчиков
программного продукта. Файлы содержат значительное число ошибок
ввода, несмотря на существование системы «защиты» от них.
Основные проблемы разработки данных и рекомендации
по их решению. Все встретившиеся нам в ходе работы с данными
ошибки были систематизированы. В отдельную группу выделены ошибки,
относящиеся к полям с текстовой информацией. Необходимость этого
обусловлена тем, что именно в текстовых полях было обнаружено наибольшее
число погрешностей как по количеству, так и по разнообразию. Вероятно,
такая ситуация возникает вследствие того, что они содержат наиболее
сложную и объемную с точки зрения ввода информацию.
Нужно пояснить, что к текстовым полям мы относим следующие:
«место рождения», «последнее место жительства» и «место
смерти» в файлах регистрации смертей, а также «место рождения»,
«место регистрации отца» и «место регистрации матери» в
файлах регистрации рождений.
Все обнаруженные в указанных полях ошибки, как мы считаем,
нужно относить к ошибкам ввода. Среди них можно выделить четыре
вида, характерных для всех текстовых полей:
- Опечатки;
- Ошибки в написании географических наименований;
- Употребление неверных сокращений и аббревиатур;
- Пропуск части наименования географического образования.
Кроме того, нужно выделить еще один вид ошибок ввода, относящийся
только к так называемым расширенным текстовым полям - тем, которые
содержат в себе полный адрес:
- Пропуск одной или нескольких частей полного адреса.
Прокомментируем теперь каждый из указанных видов ошибок.
К первому виду нами были отнесены те случаи неверного написания
географических названий, где присутствовали явные случайные ошибки
ввода. Такими считались пропуски букв (к примеру, «Влад-мирская
область»), употребление неверных букв в тех случаях, когда это не
может считаться очевидной орфографической ошибкой (например, «Ряханская
область») и некоторые другие виды опечаток30.
Процент записей, содержащих опечатки, по каждому из указанных полей
достаточно низок. Однако именно этот вид ошибок в наибольшей степени
затрудняет анализ данных, поскольку опечатки не поддаются никакой
систематизации, а набор различных вариантов может быть бесконечным.
Отдельно, с нашей точки зрения, необходимо выделять
ошибки, допущенные в написании географических названий, которые
не являются случайными опечатками. К сожалению, мы не можем предложить
строгий критерий, по которому можно было бы отличать опечатки от
ошибок. Однако в качестве примера случаев, которые, на наш взгляд,
нужно относить к ошибкам, можно привести следующие варианты написания,
встретившиеся в файлах: «Великалукская», «Башкар-тостан». Наличие
таких вариантов говорит о том, что работники органов ЗАГС при вводе
информации невнимательно переносят ее из предоставленных документов,
либо допускают орфографические ошибки. Процент подобных ошибок по
отношению к совокупному объему выборки невелик, тем не менее это
значительно усложняет процесс обработки и анализа данных.
Следующий вид встретившихся нам ошибок - это неверное
употребление сокращений и аббревиатур при указании географического
названия. Так, по отношению к названиям типов субъектов, во-первых,
встречались различные варианты сокращений, к примеру: «область»
и «обл.», «Республика» и «Респ.». В ряде случаев мы столкнулись
с сокращениями, употребление которых не является общепринятым. К
таковым были отнесены, например «Кр.» (сокращение от «край»), «Гор.»
(сокращение от «город») и некоторые другие. Скорее всего, частично
описанная ситуация может быть объяснена наличием разных видов сокращений
в документах, из которых переносились данные, однако мы не можем
с уверенностью говорить об этом, поэтому относим вышеуказанные различия
к ошибкам ввода.
Что же касается аббревиатур, то были обнаружены не поддающиеся
расшифровке сокращения (к примеру, «Лзсср»), а также общепринятые
сокращения, указанные в неверном регистре, строчными буквами (например,
«Басср»). По отношению к последним нужно отметить, что не во всех
случаях такие названия были введены в сокращенном виде. Встречались
и более полные варианты написания («Башкирская АССР»). Кроме того,
в части записей содержались названия, сокращенные до аббревиатур
и поддающиеся расшифровке, по отношению к которым, однако, подобные
формы нельзя считать общепринятыми. К таким случаям относится, к
примеру, сокращение наименования «Дальневосточный край» до «Двк».
Все описанные различия в отношении аббревиатур также могут частично
объясняться различным написанием географических наименований в предоставленных
работникам органа ЗАГС документах.
Наконец, последний из выделенных нами видов ошибок,
характерных для всех текстовых полей, - это пропуск части наименования
географического названия. Под этим мы понимаем внесение названий
субъектов Российской Федерации или менее крупных образований без
указания типа образования, к примеру: «Московская» вместо «Московская
область», «Ставропольский» вместо «Ставропольский край» и т.п. Такие
формы написания названий встречались достаточно часто.
По расширенным текстовым полям, к которым относятся
«последнее место жительства» (в массиве данных регистрации смертей)
и «место регистрации отца» и «место регистрации матери» (в массиве
данных регистрации рождений), мы выделили еще один вид ошибок -
пропуск одной или нескольких частей указанного адреса. Так,
в части записей не была указана страна, к которой относится адрес.
Причем такие случаи были обнаружены как среди адресов, относящихся
к регионам России, так и среди адресов, относящихся к зарубежным
территориям. Кроме того, нередко при введении адреса не вносилось
наименование субъекта РФ (или области - в случае, если адрес находится
за пределами России), а сразу указывался город. Чаще всего такая
ситуация возникала, если адрес проживания или регистрации относился
к титульному городу субъекта Российской Федерации. К сожалению,
для того чтобы проводить анализ сводного массива данных в территориальном
разрезе, все такие записи необходимо перераспределять по субъектам
РФ или странам, то есть вручную дополнять соответствующие графы,
что требует значительных временных затрат.
Таков состав основной массы содержащихся в текстовых
полях ошибок. К нему необходимо добавить перечень недочетов, которые,
с нашей точки зрения, нельзя отнести к ошибкам ввода. Тем не менее
их наличие также нарушает целостность базы данных и затрудняет работу
с ней. Таких недочетов можно выделить три:
- присутствие различных вариантов названий одних и тех же географических
наименований;
- неоднородность данных с точки зрения их детализации в поле «место
смерти»;
- отсутствие единого стандарта пунктуации в некоторых полях.
Различные варианты названий встретились нам как по отношению
к субъектам Российской Федерации, так и по отношению к другим странам
мира. Отчасти присутствие расхождений такого рода объясняется многочисленными
переименованиями, проведенными на протяжении последних десятилетий.
Особенно это касается географических образований, принадлежащих
бывшей территории Советского Союза. Однако и современные наименования
встречались в нескольких вариантах. В качестве примера можно привести
так называемые сложные наименования субъектов Российской Федерации,
которые могут принимать разные виды в зависимости от порядка слов:
«Чеченская Республика» и «Республика Чечня», а также просто «Чечня»,
«Чувашская Республика», «Республика Чувашия» и «Чувашия».
Для названий большей части государств также существует
несколько форм - краткое и полное наименования31.
По отношению к значительному числу стран мира в имеющейся у нас
базе данных были обнаружены оба варианта написания. Здесь, к примеру,
можно указать следующие страны и соответствующие формы наименований:
Грузия - «Грузия», «Республика Грузия»; Киргизия - «Киргизия», «Киргизская
Республика», а также «Кыргызстан» и «Кыргызская Республика», не
содержащиеся в Общероссийском классификаторе стран мира, и проч.
Под неоднородностью данных с точки зрения их детализации
мы понимаем наличие в одной и той же графе («место смерти») ячеек,
в которых указано только одно географическое наименование, и ячеек,
в которых указано несколько наименований. Так, нам встретились записи,
где было указано:
- только наименование населенного пункта, где наступила смерть;
- наименование субъекта РФ или территориального образования иного
государства и населенного пункта;
- наименование субъекта РФ, района и населенного пункта;
- наименование страны (отличной от России) и населенного пункта
в ней;
- только наименование страны, на территории которой наступила
смерть.
Последним недочетом сводной базы данных является отсутствие
единого стандарта пунктуации в полях, содержащих текстовые данные.
При использовании сокращений в названиях могут использоваться или
не использоваться пробелы («Респ. Грузия» и «Респ.Грузия), кроме
этого, существуют различия в использовании пробелов при внесении
данных через запятую. При автоматическом анализе массивов такие
расхождения затрудняют подсчет одинаковых вариантов.
Нужно также отметить, что в нашем исследовании мы ограничились
распределением записей по странам и субъектам Российской Федерации
в тех случаях, когда указанные географические наименования относились
к территории нашей страны. Можно предположить, что аналогичные по
составу ошибки могут быть обнаружены в части информации, относящейся
к адресам проживания и регистрации при указании названий небольших
населенных пунктов, улиц, номеров домов и т.д. Эта гипотеза подтверждается
наблюдениями, сделанными нами в процессе создания дополнительных
граф при работе с текстовыми переменными.
С учетом перечисленных выше обстоятельств можно сказать,
что при сборе данных регистрации смертей и рождений не обеспечивается
целостность данных по текстовым переменным. Перечень обнаруженных
ошибок и недочетов показывает, что не существует единства в структуре
и формате вводимых данных.
Нужно отметить, что ошибки были обнаружены и в отношении
других, нетекстовых, переменных. Их (ошибки) также можно разделить
на две группы. Первая из них - это опечатки, встречающиеся во всех
полях, где ввод данных осуществляется сотрудниками органов ЗАГС.
К сожалению, дать точную оценку числа опечаток мы не сможем, поскольку
у нас не было возможности сопоставлять все имеющиеся данные с первоисточниками
- документами, на основании которых производилось заполнение. Однако
об их присутствии свидетельствуют, к примеру, указанные в файлах
данных регистрации смертей следующие годы рождения умерших: 1023,
1867. Несоответствие двух указанных здесь дат действительным данным
не вызывает сомнения, и их наличие говорит о том, что опечатки могут
содержаться и в других записях.
Ко второй группе относятся ошибки, допущенные в тех
переменных, которые кодируются сотрудниками органов ЗАГС. К таким
переменным относятся пол умершего/родившегося, статус умершего,
его возрастная группа, а также код последнего места жительства умершего
и коды мест регистрации отца и матери родившегося. В ходе исследования
в файле по смертности в графе «пол» мы обнаружили пять записей,
содержащих код «0», не предусмотренный структурой данных, а в файле
по рождениям - девять таких записей. Возможно, этот код вносился
в случаях, когда сотрудники органов ЗАГС не располагали необходимой
информацией. Кроме того, среди кодов, указанных в графе «статус»
умершего, было обнаружено 15 случаев, когда значение было присвоено
неверно. В рамках данной работы мы не занимались разработкой кодов,
поставленных в соответствие московским адресам регистрации, однако
с учетом обнаруженных ошибок можно предположить, что неточности
могут содержаться и в этих полях.
Обобщая проведенный анализ, можно сказать, что в предоставленных
нам файлах содержится достаточно большое количество ошибок разного
типа. Вследствие этого работа с массивами без тщательной предварительной
подготовки становится невозможной, что значительно увеличивает затраты,
в том числе временные, необходимые для разработки данных текущего
учета. При этом основную часть ошибок составляют ошибки ввода, появление
которых можно предотвратить.
Для этого следует внести некоторые изменения в сам процесс
внесения данных, и среди них можно выделить три основных направления:
1. В первую очередь необходимо обратить внимание на
процесс внесения текстовых данных, поскольку именно они содержат
в себе наибольшее число ошибок. Наличие случайных опечаток, орфографических
ошибок и расхождений в написании географических наименований говорит
о том, что их ввод не всегда осуществляется с использованием встроенных
справочников, в то время как в описании автоматизированной системы
«ЗАГС» утверждается обратное.
Как отмечается в Федеральном законе «Об актах гражданского
состояния», «государственная регистрация актов гражданского состояния
устанавливается в целях охраны имущественных и личных неимущественных
прав граждан, а также в интересах государства»32.
Именно поэтому вносимые данные должны в точности совпадать с теми,
что указанны в документах, предоставляемых при регистрации. Вероятно,
в документах встречаются различные формы написания одних и тех же
наименований, и именно это определяет большое число вариантов, вносимых
в электронную базу. Возможно также, что по этой причине сотрудникам
органов ЗАГС в некоторых случаях приходится отказываться от использования
встроенных справочников. С нашей точки зрения, такая ситуация недопустима.
В данном случае нет необходимости переходить к ручному вводу информации,
так как достаточно составить полный справочник географических наименований
с учетом специфики нужд органов регистрации актов гражданского состояния.
Внесение данных при этом должно производиться с обязательным
и повсеместным использованием наиболее полных и современных справочников,
встроенных в систему ввода.
Иными словами, сотрудники органов ЗАГС должны работать
со стандартными выпадающими списками (словарями), из которых будет
производиться выбор33.
Бесспорно, работа по составлению и постоянной актуализации подобных
справочников является масштабной и трудоемкой. Однако ее объем несравним
с затратами, которые необходимы для осуществления регулярной проверки
собирающихся данных и внесению исправлений в них. Обязательное использование
стандартных выпадающих списков необходимо внедрять и для ввода нетекстовых
переменных, поскольку в них также встречаются ошибки.
2. Вторая рекомендация касается формата хранения текстовых данных.
Как показано в описании программного обеспечения для органов ЗАГС
на сайте разработчика, при вводе адреса для каждой его составляющей
предусмотрена отдельная ячейка. Однако в полученных нами файлах
информация по всем адресным ячейкам была объединена. Такая форма
хранения значительно усложняет процесс анализа и скрывает действительное
число пропусков: ячейка будет считаться заполненной, даже если в
ней отсутствуют некоторые составляющие адреса. С нашей точки зрения,
для хранения каждой составляющей адреса необходимо отвести отдельную
ячейку. Кроме того, существующая система ввода позволяет избавиться
от пропусков, о которых говорилось выше: следует ограничить возможности
ввода подробных реквизитов без указания более крупных, к примеру
названия области без указания страны, названия города без указания
субъекта Российской Федерации и т.д.
Хотелось бы добавить, что описанную форму ввода и хранения
информации стоит также распространить на данные о месте смерти умершего,
поскольку они, хотя и не детализированы до конкретных адресов, но
все же являются так называемыми расширенными текстовыми полями.
Иначе говоря, в графе «место смерти», как правило, указывается
несколько географических наименований, перечисленных через запятую.
3. Третье предложение связано с наличием в массивах
данных текущего учета большого количества устаревших географических
названий. В первую очередь это относится к графе «место рождения»
в совокупности записей регистрации смертей. Для того чтобы иметь
возможность распределять записи по каждой переменной по регионам
Российской Федерации или странам мира, нужно создавать дополнительные
ячейки и вносить в них актуальные на сегодняшний день названия.
Для проведения разработки данных в укрупненных группах
этого достаточно, однако теоретически подобные сопоставления можно
проводить и по районам и населенным пунктам. Возможно, такую графу
на обобщенном уровне следует предусмотреть уже при вводе данных.
Ее заполнение необходимо производить автоматически, на основе встроенного
справочника.
Важно отметить, что реализация двух последних рекомендаций
должна облегчить статистическую обработку данных текущего учета,
то есть призвана сделать их более пригодными для исследовательских
целей. Реализация же первой из предложенных рекомендаций актуальна
и в настоящее время - устранение ошибок ввода необходимо в любом
случае.
Следует также добавить, что как отмечалось выше, в рамках
указанной работы мы анализировали массивы данных, сформированные
в одном субъекте РФ (г. Москве) при помощи программного обеспечения
МАИС ЗАГС, которое в настоящее время применяется во многих, но не
во всех регионах страны. Тем не менее можно предположить, что обнаруженные
в ходе анализа ошибки являются типичными и будут встречаться и при
работе в других информационных системах.
Некоторые результаты пробного анализа. На
основе описанного выше массива статистических данных нами были сделаны
первые, наиболее общие оценки вклада мигрантов в воспроизводство
населения в Москве. Как отмечалось выше, в данной работе к «мигрантам»
мы будем относить группы населения, сформированные по критериям
места рождения (только для умерших, так как в отношении родителей
новорожденных эта переменная, к сожалению, в базе данных отсутствовала),
места регистрации и гражданства. В ходе нашего анализа мы последовательно
проанализировали соответствующие поля массивов файлов регистрации.
По ряду причин мы не производили отбора записей с сочетанием «миграционных»
признаков, но технически это можно сделать в перспективе.
Для выделения групп внутренних мигрантов в рамках этой
работы использовались данные о месте рождения (для умерших) и последнем
месте жительства (регистрации); эти сведения сравнивались с местом
наступления зарегистрированного события. Напомним, что данные об
умерших были единственным видом информации, в которой можно было
использовать сведения о месте рождения и оценить участие пожизненных
мигрантов в процессе смертности.
В соответствии с полученными результатами, более 5%
смертей34, зарегистрированных
в московских органах ЗАГС в феврале-ноябре 2009 г., произошло за
пределами столицы (см. таблицу 1). При этом среди всех умерших 5,6%
на момент смерти были зарегистрированы на территории России, но
за пределами Москвы; на долю же тех, кто проживал за рубежом, пришлось
менее 1%. Основная часть внутренних мигрантов (с точки зрения места
регистрации), чья смерть была зафиксирована в Москве, относится
к Центральному федеральному округу, а именно к Московской области.
Доля людей с иностранным гражданством среди умерших составила немногим
менее 1,4%, и подавляющее большинство из них являлись гражданами
стран бывшего СССР. Только 34,9% умерших были уроженцами Москвы,
еще 34,7% - родились за пределами Москвы, но на территории Центрального
федерального округа. У 6,7% умерших место рождения находится за
пределами России35.
Таблица 1. Распределение записей регистрации смерти
по месту смерти, месту рождения и месту последней регистрации умершего
(в % от объема массива)
|
г. Москва
|
вне г. Москвы
|
Не указано
|
Место смерти
|
94,3
|
5,2
|
0,5
|
Место рождения
|
34,9
|
53,8
|
11,3
|
в том числе за пределами России
|
|
6,7
|
|
Место регистрации
|
89,8
|
6,5
|
3,7
|
в том числе за пределами России
|
|
0,83
|
|
Интересные результаты были получены при сопоставлении
места рождения и последнего места жительства умерших: оказывается,
что менее половины умерших на момент своей смерти были зарегистрированы
в том же месте, где родились (см. таблицу 2). Эта цифра косвенно
характеризует интенсивность внутренней миграции в России: она позволяет
с уверенностью утверждать, что более половины населения страны совершает
хотя бы один переезд на протяжении своей жизни.
Таблица 2. Распределение умерших, проживавших в месте
своего рождения на момент смерти (в % от общего числа родившихся
в данном регионе и от общего числа зарегистрированных в данном регионе
на момент смерти)
Регион
|
На момент смерти проживают в месте рождения, человек
|
В % от числа рожденных в этом регионе
|
В % от числа проживавших в этом регионе
|
Центральный ФО, без г. Москвы
|
1482
|
4,3
|
38,9
|
г. Москва
|
33542
|
97,8
|
38,0
|
Северо-Западный ФО
|
64
|
4,7
|
29,6
|
Южный ФО
|
99
|
7,3
|
33,1
|
Приволжский ФО
|
326
|
5,5
|
52,3
|
Уральский ФО
|
28
|
4,0
|
25,2
|
Сибирский ФО
|
32
|
2,3
|
28,8
|
Дальневосточный ФО
|
15
|
2,0
|
26,3
|
Северо-Кавказский ФО
|
156
|
22,7
|
50,5
|
Другие страны мира*
|
348
|
5,3
|
42,7
|
* К этой категории отнесены записи, где место рождения и
последнее место жительства относятся к территории одного государства.
В отношении рождений были получены следующие результаты:
на долю родителей, проживающих постоянно за рубежом, приходится
немногим более 2,5% рождений, а на долю зарегистрированных на территории
России, но за пределами Москвы (внутренние мигранты) - 22% от общего
числа записей регистрации рождений. На долю отцов-иностранцев по
гражданству приходится более 5%, среди матерей-иностранок - чуть
менее 6% (см. таблицу 3).
Таблица 3. Распределение записей регистрации рождений
по гражданству и месту регистрации родителей новорожденных (в %
от объема массива)
|
Отца
|
Матери
|
Гражданство
|
Российское
|
84,8
|
93,8
|
Иностранное
|
5,3
|
5,8
|
Не указано
|
10,0
|
0,5
|
Место регистрации
|
г. Москва
|
60,6
|
71,3
|
Россия, вне г. Москвы
|
22,1
|
21,3
|
Вне России
|
2,6
|
2,8
|
Не указано
|
14,8
|
4,6
|
Мы попытались оценить вклад постоянно проживающих в
РФ иностранцев в процессы естественного движения на основании двойного
фильтра по переменным «место регистрации» и «гражданство». Среди
умерших оказалось только 47 иностранцев, имевших московскую регистрацию.
Еще восемь человек были постоянно зарегистрированы в других регионах
России. Остальные иностранцы, смерть которых была зарегистрирована
в г. Москве, не имели регистрации по месту жительства в РФ.
Среди отцов новорожденных детей 114 человек были иностранными
гражданами, зарегистрированными в Москве по месту жительства, еще
80 человек имели регистрацию в других регионах (всего 194 человека).
В располагаемых нами массивах данных в отношении матерей, имевших
гражданство других государств, была сделана 2051 запись о рождении.
1975 женщин были постоянно зарегистрированы в Москве и еще 76 -
в других регионах России.
Заключение. Первый опыт работы с массивами
первичной информации, сформированными на основе записей актов гражданского
состояния (о рождениях и смертях), показал, что они обладают аналитическим
потенциалом для пояснения влияния миграции на естественное движение
населения в регионе проживания и пребывания мигрантов. При существующих
ограничениях, связанных с идентификацией долгосрочных и краткосрочных
мигрантов, а также лиц, которые лишь непродолжительное время находились
на данной территории к моменту наступления события смерти или рождения
ребенка, эту информацию необходимо вводить в научный оборот и разрабатывать.
Однако ее потенциал может быть реализован лишь в том случае, если
будут решены проблемы качества ввода и кодировки данных, которые
пока что сопровождаются большим количеством ошибок и погрешностей.
По нашему мнению, качество информации можно существенно улучшить,
выполнив несколько отнюдь не сложных условий и избежав больших затрат,
которые сопровождают создание новых форм учета и статистического
наблюдения. Иными словами, разработка информации о месте рождения,
месте проживания и гражданстве лиц, в отношении которых сделаны
записи актов гражданского состояния, оправдана и необходима. Эти
уникальные данные в перспективе могут стать источником ценнейшей
статистической информации, которая позволит расширить наше представление
о международной и внутренней миграции в России и ее демографических
последствиях.
1 Независимый институт
социальной политики
2 канд. экон. наук,
МГУ им. М.В. Ломоносова
3 см., например, Deboosere
P., Gadeyne S. La sous-mortalitе des immigrеs adultes en Belgique:
une realit? attest? par les recensements et les registres, Population,
Vol. 60, 2005. P. 765-811; Stribu, I. et al., Cancer mortality rates
among first and second generation migrants in the Netherlands: Convergence
toward the rates of the native Dutch population, International journal
of cancer, Volume 119, #11, 2006. Р. 2665-2672.
4 Jefferies J., Natamba
E., Tromans N. Have women born outside the UK driven the rise in
UK births since 2001, Population Trends, 136, Summer 2009. Р. 28-42.
5 Кроме того, на основе
выборки из регистра существует база данных по иммигрантам из 16
стран, прибывших в Швецию в определенные годы, которую курирует
Центр экономический демографии университета г. Лунд. На основе этой
выборки микроданных группой шведских исследователей был выполнен
целый ряд работ, посвященных самым разным аспектам изучения миграции.
http://www.ed.lu.se/EN/databases/sli.asp
6 Annual population
survey: http://www.statistics.gov.uk/Statbase/Product.asp?vlnk=10855
7 К таковым, к примеру,
относятся, Текущее обследование населения (CPS, Current Population
Survey); Американское обследование общин (ACS, American Community
Survey); Американское обследование жилищных условий (AHS, American
Housing Survey) и др.
8 Hill L.E., Johnson
H.P. Understanding the Future of Californians' Fertility: The Role
of Immigrants, Public Policy Institute of California, San Francisco,
2002.
9 см., например, Hummer
R.A. et al., Paradox Found (Again): Infant Mortality among the Mexican-Origin
Population in the United States, Demography, Vol. 44, #3, Aug 2007.
Р. 441-457.
10 Sobotka T. The
rising importance of migration for births and fertility trends in
Europe, International Conference «Effects of migration on population
structure in Europe», VID-IIASA, 2 December 2008.
11 В Москве показатель
почти не изменился, так как данные по гостиницам передавались в
органы ФМС и прежде.
12 Рассчитано по
данным Всероссийской переписи населения 2002 г.
13 Так, среди исследований,
опубликованных на эту тему в последние годы, можно указать работу
[Захаров С., Сурков С. Миграция и рождаемость в России, статья
первая, Демоскоп-weekly, № 399-400, 23 ноября - 6 декабря 2009;
статья вторая, Демоскоп-weekly, № 401-402, 7-20 декабря 2009.].
14 Это обследование
известно под аббревиатурой РиДМиЖ
15 Преимуществом
которых, как известно, является низкая стоимость производства статистики,
поскольку она является побочным продуктом сведений, собранных для
иных целей.
16 В ряде регионов
актовые записи сразу вносятся в соответствующие компьютерные программы.
Но даже при передаче из органов ЗАГС в органы статистики сведений
на бумажных носителях Росстат уже с конца 1990-х годов формирует
собственную электронную базу первичных данных.
17 Очень значительным
был вклад «иногородних» (лиц, не имевших постоянной регистрации
в Москве) в число событий, имеющих негативную природу: смертность
детей первой недели и первого года жизни (60 и 50% соответственно),
мертворождениях (около трети событий). Рассчитано по данным Мосгорстата.
18 Вероятно, часть
иностранных граждан регистрирует акты гражданского состояния в посольствах
своих государств, однако масштабы этого явления трудно измерить.
В настоящей работе мы исходим из предположения, что все демографические
события, происшедшие в России, зарегистрированы в органах ЗАГС.
19 Эта переменная
была доступна только в базе данных умерших. В массиве данных по
родившимся она отсутствовала, поскольку органы статистики не запрашивали
этих данных в органах ЗАГС. Этот пробел можно восполнить в будущем,
оговорив новый перечень переменных, по которым органы ЗАГС будут
передавать в органы статистики первичную информацию.
20 Этот термин применяется
только в отношении иностранных граждан.
21 См. http://www.insoft.ru/insoft/
Авторы выражают признательность Генеральному директору ЗАО ИВЦ ИНСОФТ
Е.В. Бойченко за консультацию по вопросам формирования массивов
информации в программном обеспечении «МАИС ЗАГС».
22 Полное описание
МАИС «ЗАГС» версия Microsoft, стр.1, режим доступа: http://www.insoft.ru/insoft/products/products_mais_ZAGS_Microsoft/Opisanie_mais_ZAGS_Microsoft.pdf
23 http://www.insoft.ru/insoft/products/products_mais_ZAGS_Microsoft.htm
24 Временной интервал
обусловлен наличием данных на момент запроса. В электронном формате
Мосгорстат начал получать их с февраля 2009 г.
25 Статус умершего
определяется на основе соотношения постоянного места жительства
умершего (адреса его регистрации) и адреса регистрации смерти.
26 К сожалению,
этой переменной в массивах информации не оказалось, поскольку она
не была предусмотрена в документе, регламентирующем передачу данных
из органов ЗАГС в органы статистики.
27 Полное описание
МАИС «ЗАГС», версия Microsoft, стр. 1.
28 Бойченко E.B.,
Марин Л.Ф. Технологии создания автоматизированных систем о населении.
М.: ИКФ «Каталог», 2003. с. 182.
29 Федеральный закон
от 15 ноября 1997 г. № 143-ФЗ «Об актах гражданского состояния»,
глава V, статья 44 «Изменение записи акта о рождении в связи с усыновлением
ребенка» п. 2.
30 Все приведенные
в данном параграфе работы примеры взяты из сводного файла записей
регистрации смертей, поля «место рождения» умершего. Ошибки этих
же типов были найдены и в других текстовых полях как в массиве данных
регистрации смертей, так и в массиве данных регистрации рождений.
31 Эти формы указаны
в [Общероссийский классификатор стран мира ОК (МК (ИСО 3166) 004-97)
025-95 (в ред. Изменения 1/98, утв. Постановлением Госстандарта
России от 22.10.1998 №37.].
32 Федеральный закон
от 15 ноября 1997 г. № 143-ФЗ «Об актах гражданского состояния»,
глава XIII, статья 6 «Государственная регистрация актов гражданского
состояния», п. 1
33 Безусловно, это
не касается граф, в которые вносится номер дома и, возможно, название
улицы.
34 Что вдвое ниже
показателя, приведенного официальной статистикой. Возможно, к иногородним
были отнесены все записи с неутонченным местом проживания лица.
35 Во всех случаях
процент указан от общего числа записей в массиве. При этом нужно
понимать, что по многим графам довольно значительной оказывается
доля пропусков. Так, в графе «место рождения» умершего незаполненными
были более 11% ячеек.
|