Анализ лонгитюдных данных с RSiena
Вера Титкова о поездке в Университет Гронингена и анализе лонгитюдных данных с RSiena.
В начале декабря младший научный сотрудник Лаборатории Вера Титкова провела две недели в городе Гронинген (Голландия) на факультете социологии Университета Гронингена. Главной целью поездки было освоение и изучение нового для нее метода анализа лонгитюдных сетевых данных c использованием RSiena.
В прошлом году Лаборатория начала новый исследовательский проект – лонгитюдное исследование учащихся ПТУ и колледжей Санкт-Петербурга. Одна из главных исследовательских задач – увидеть формирование и развитие отношений между учащимися, и в частности процессов «выбора» и «влияния». Как получается, что школьники, которые дружат, часто обладают сходным поведением, привычками, ценностями и интересами? Происходит ли это потому, что ученик выбирает себе похожих друзей, или же это друзья влияют на становление его интересов? Проверить, какой эффект важнее для формирования дружб – выбор (social selection - homophily) или влияние (social influence) – позволяет пакет статистического анализа для лонгитюдных данных RSiena.
Данный пакет является расширением для програмной среды R и позволяет реализовать возможности программы Siena (Simulation Investigation for Empirical Network Analysis), которая разработана коллективом оксфордских исследователей для анализа социальных сетей. Siena способна отслеживать динамику сетей и создавать актор-ориентированные модели (actor-oriented models). Эти модели являются по сути цепями Маркова, то есть представляются из себя последовательность случайных событий, для которых при фиксированном настоящем будущее независимо от прошлого. Компьютерное моделирование с ипользованием Siena требует значительных вычислительных ресурсов, способ применим для сетей от 10 до 1000 узлов. Научиться работать с RSiena и было целью моей поездки.
Прежде чем приступить к обучению, я кратко презентовала данные проекта Лаборатории, наши гипотезы и задачи для исследовательской группы, состоящей из Tom Snijders, Christian Steglich, Marijtje van Duijn и Nynke Niezink, которые активно работают с RSiena и принимали участие в разработке аналитического метода для лонгитюдных сетевых данныъ. В ходе дальнейшего обсуждения я получила большое количество советов и конструктивных предложений, касающихся дополнений к опросному инструменту, улучшению моделей и конструированию переменных. Оставшиеся две недели моя работа заключалась в непосредственном разборе скриптов RSiena, создании и описании аналитических моделей.
Факультет социологии Университете Гронингена, как говорят сами сотрудники, является центром сетевого анализа данных с ипользованием Siena, и учиться у создателей этого метода было невероятно продуктивно, местами сложно, но очень интересно. Практическим результатом работы в дальнейшем станет несколько статей, посвященных распространению рисковых практик и анти-школьного поведения среди студентов.
Подготовила Вера Титкова