Мастер-класс по сетевому анализу от А. Семенова из НИУ ВШЭ в Москве
8 апреля в лаборатории прошел открытый семинар по сетевому анализу. Его проводил Александр Семенов, аспирант московской Вышки. Целью семинара было познакомиться с семейством ERGM – Exponential Random Graph Models.
8 апреля в лаборатории прошел открытый семинар по сетевому анализу. Его проводил Александр Семенов, аспирант московской Вышки. Целью семинара было познакомиться с семейством ERGM (p*) – Exponential Random Graph Models. Эти модели – один из множества вариантов для анализа социальных сетей.
Зачем применять статистический подход в анализе социальных сетей? Александр Семенов называет несколько причин. Во-первых, данных подход помогает решить дескриптивные задачи, а именно описывает числовые характеристики на разных уровнях: на уровне узлов, диад\триад, всей сети. Во-вторых, решаются генеративные задачи, которые объясняют, как появилась данная сеть, в чем состоят локальные основания глобальной структуры сети, каковы скрытые процессы формирования сети. На основе полученного графа мы пробуем предположить, за счет чего он появился, ищем ответ на вопрос о том, существуют ли некие социальные силы или эффект, которые влияют на образование сети, а также смотрим, есть ли тенденции к образованию связей, централизации, кластеризации и т.д. Так мы наблюдаем и изучаем генезис сети.
Преимущество ERGM заключается в том, что мы можем включать в модель сразу несколько параметров, например, пол, расу, возраст и пр., а также сразу несколько структурных эффектов – реципрокность, цикличность, транзитивность, – и смотреть их значимость, т.е. изучать, какие эффекты вносят наибольший вклад в объяснение модели. Еще одним преимуществом является то, что с ERGM мы имеем возможность использовать несколько пакетов, например Pnet, statnet, StocNET.
Любопытным упражнением на семинаре была попытка разобраться в рисунке из мануала к программе Pnet, на котором представлены параметры и структурные эффекты сетей. «Метель лепила на окне кружки и стрелы…» - эта цитата из Б.Пастернака, приведенная Александром Семеновым, как нельзя лучше иллюстрирует понятие социальных сетей. Важным и интересным открытием для слушателей стал тот факт, что структурные свойства сети часто оказывают большее влияние на типы связей, чем биологический вид агентов. Для примера было приведено забавное исследование социальных связей между шимпанзе и макаками.
Практическое применение ERGM было продемонстрировано участникам семинара на примере собственного исследования Александра Семенова, которое посвящено изучению сетей в livejournal.com. Для работы были взяты 4 типа сетей, эффекты которых оценивались с помощью ERGM. В лабораторной части семинара участники познакомились с программой ORA и ее многочисленными возможностями визуализации сетевых данных, в числе них, например, есть как возможность анонимизировать сеть, так и опция загрузить фотографии агентов. Кроме этого, ORA считает R, R2, и другие важные статистические параметры.
Александр Семенов продемонстрировал неподдельную увлеченность своим любимым делом, а четырехчасовое погружение в сетевой анализ оставило неизгладимое впечатление на участников семинара. Уставшие, но довольные, они договорились собраться еще раз.
Подготовила Ксения Медведева