• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Стажёры СЛОНа приняли участие в первой встрече Saint Petersburg R User Group

28 марта прошла первая встреча Saint Petersburg R User Group, объединяющей специалистов, использующих язык статистического моделирования R в своей работе. Формат встреч R User Group предполагает, что участники сообщества сами предлагают потенциально интересные темы для выступлений, а главная цель проведения – обмен опытом и образование новых связей внутри сообщества. Несмотря на то, что Data Science – преимущественно область математиков, инженеров и аналитиков, на встречу попали также и студенты-второкурсники Вышки — стажёры НУЛ СОН.

Студентка 2 курса департамента социологии Настя Нестеренко: «Мне понравилось, что доклады были в целом понятны и доступны. Спикеры говорили о вещах, которые мы, в принципе, тоже делаем. Они останавливались и на совсем базовых темах, да и рассказывали без особого занудства. Понравилось также, что из каждого выступления можно было вынести что-то новое, а где-то просто освежить свои знания».

Всего на встрече было представлено четыре доклада. Первый спикер – Алексей Шлемов – рассказал про направления оптимизации кода в R, дополнительные пакеты, предназначенные для работы с ресурсоёмкими задачами. Филипп Управителев посвятил второе выступление пакету прикладного предиктивного моделирования caret, рассказав о его особенностях, поддерживаемых типах моделей, предобработке данных и анализу результатов.Следующий доклад был представлен Антоном Антоновым, который рассказал про семейство пакетов tidyr, dplyr и magrittr для работы с данными. «С помощью magrittr можно сделать код более читабельным, – сказал спикер, – но не стоит злоупотреблять им». Также он рассказал, как с помощью tidyr и dplyr можно сделать данные более удобными для анализа.

В завершение встречи выступил Алексей Натекин. Он рассказал про организацию больших проектов в R. Очень важно, чтобы код был понятен не только автору, но и другим людям. Для этого необходимо, чтобы код обладал ясной структурой.  Такие меры необходимы, чтобы сделать возможной командную работу. Тем не менее после этого доклада в зале разгорелась дискуссия: не все люди были полностью согласны с выступающим.

Преподаватель курсов по программированию и анализу данных Илья Мусабиров: «Важно, что наши студенты уже сейчас могут полноценно участвовать в сообществе R. Его растущий охват и междисциплинарность делают такие встречи площадкой, где находят общий язык математики, программисты, социологи, психологи, лингвисты. И трём последним категориям особенно важно, что они — полноправные участники диалога, вносящие в него содержательный вклад. Что-то в докладах и обсуждениях пока менее понятно ребятам — например, задача оптимизации кода, они только начинают это осознавать. Что-то знакомо, но преподносится по-новому. А что-то они знают и не хуже остальных участников — например, инфраструктура обработки данных на основе dplyr и magrittr, что с этого года читается социологам прямо с первого курса. Мы надеемся, что в следующем году, с открытием в Питерской Вышке майнора Data Science наше участие и в Saint Petersburg R User Group, и в сообществе R вообще, станет значительно активнее».

Подготовил Денис Булыгин