11 - 13 апреля в СЛОНе голландские специалисты провели мастер-класс по сетевому анализу
11-13 апреля 2011 г. в лаборатории прошли интенсивные семинары по сетевому анализу. Они были проведены Кристианом Штеглихом и Марайтье Ван Дуийн из университета Гренинген (Голландия).
11-13 апреля в лаборатории прошли интенсивные семинары по сетевому анализу. Они были проведены приглашенными преподавателями – специалистами по сетевому анализу Кристиан Штеглих (Christian Steglich) и Марайтье Ван Дуийн (Marijtje van Duijn) из университета Гренинген в Голландии. Социологический факультет этого университета является одним из крупнейших мировых центров социологии. Кристиан и Марайтье уже 15 лет работают в области сетевого анализа, поэтому у них есть огромный опыт разнообразных сетевых исследований.
Для чего лаборатории нужны были эти семинары? В каких областях применяется сетевой анализ? С ответа на эти вопросы начал свое выступление Кристиан Штеглих. Дело в том, что это современное направление обработки данных в корне отличается от того, что предлагает классическая статистика. Исходным принципом последней является то, что данные изначально собираются независимо друг от друга, а это редко встречается в реальной жизни. Ключевое понятие сетевой статистики – сеть – подразумевает взаимозависимость данных, которые в дальнейшем визуализируются и моделируются с целью облегчения их интерпретации и анализа. Как отметил Кристиан, «если в данных нет взаимозависимостей, вам не нужен сетевой анализ». Причем эти взаимозависимости чаще всего можно обнаружить в таких сферах социальной жизни, как:
- управление: политические сети помогают ответить, например, на вопрос, как государства взаимодействуют друг с другом;
- торговля: рыночные сети показывают движение поставок товаров и взаимоотношения покупателей и продавцов;
- организации: изучение формальных и неформальных связей внутри какой-либо фирмы, особенно среди управленцев, может оказаться важным для объяснения причин ее успеха или неудачи, а на уровне внешних связей сетевой анализ может пригодиться для обнаружения монополий, коррупции и т.д.;
- первичное социальное устройство: изучение такого рода отношений позволяет строить сети и изучать родство, дружбу и пр., а также, например, объяснить понятие социального капитала в терминах социального анализа.
Занятия были очень насыщенными. В рамках теоретической части нас познакомили с историей сетевого анализа и его ключевыми понятиями. Возникновение сетевого анализа в области социальной психологии связано с изучением группового поведения, а дальнейшее развитие произошло благодаря совершенствованию теории графов и практической антропологии. Коллеги из Гренингена закрепили наши знания об основных терминах сетевого анализа, о типах сетей, акторов, а также таких свойствах, как реципрокность, плотность сети и т.д.
Участники семинара познакомились со способами сбора данных для сетевого анализа и типичными проблемами, которые возникают при этом. Среди них можно отметить, например, трудности при определении границы сети. Где они находятся? Где заканчивается сеть? Вторая проблема – чувствительность к пропущенным значениям, которая дает о себе знать, например, когда студент отсутствовал при проведении опроса и его ответов нет. Если этот студент связан со многими людьми, то вся сеть получится нерелевантной. Еще одна трудность, которую необходимо учитывать, – неточность данных, предоставляемых информантом, которая кроется в том, что люди систематически забывают определенные связи, например, на вопрос о друзьях могут не назвать по-настоящему близких людей.
Интересно было узнать о том, какова вероятность реципрокности в сетях разного типа. Оказалось, ее вероятность в эгалитарных сетях (доверие, дружба, коммуникация) выше, чем в иерархических сетях, отражающих отношения распределения власти или цепочки поставок товаров. Что касается свойства транзитивности, то и здесь есть некоторая зависимость: вероятность наличия связи между двумя акторами может зависеть от наличия связи этих акторов с неким третьим вертексом. Это наблюдение позволяет измерять популярность и социальную изоляцию людей. Еще одна любопытная вещь связана с так называемым «эффектом Матвея», когда «богатые богатеют», а именно: вероятность наличия связи между двумя акторами может зависеть от того, насколько много у одного из них связей с другими акторами, т.е. от его валентности.
Занятия помогли ответить участникам семинаров на следующие вопросы:
- Как мы можем описать свойства сети\актора, анализируя связи?
- Как мы можем описать и смоделировать зависимость между структурой сети и характеристиками актора?
- Как мы можем сравнить акторов и их характеристики?
- Как сети развиваются во времени и влияют друг на друга?
На практической части семинаров участники выполняли лабораторные работы, используя программу R. Большое внимание было уделено изучению моделирования, рассмотрению моделей вероятности p1 и р2. Первая модель вероятности р1, которая показывает вероятность возникновения некой сети, разрабатывалась еще в 1980-ые гг. Холландом и Лейнхардтом. Вторая модель р2 предполагает изначальную независимость диад, а также в модели можно использовать меньше параметров. Модель р2 позволяет ответить на такие вопросы, как: влияет ли гомофилия на образование связи, на реципрокность, на плотность сети. Какую модель считать лучше? «Ту, в которой похожие сети имеют примерно равные вероятности», – отвечает Кристиан Штеглих.
Ценным было и то, что участники семинара получили возможность обсудить с коллегами из Гренингена свои проекты, которые предполагают использование сетевого анализа. Об этой части семинаров подробнее в следующей статье.
Подготовила Ксения Медведева