logo

Разведывательный анализ данных с помощью языка R

Курс предназначен для студентов естественно-научных направлений, которые хотят развиваться в области науки о данных. 

Данные для анализа далеко не всегда попадают в руки исследователя в приемлемой форме. Обычно достаточно большое время уходит на подготовку данных к анализу, сведение информации из разных источников, преобразование данных в необходимую форму или формат. Еще одна проблема заключается в том, что предложенные для анализа данные могут быть плохого качества, содержать много пропущенных значений, выбросов, ошибок. Прежде чем брать данные в исследование необходимо убедиться, что они пригодны для работы. Разведывательный анализ данных может сильно сэкономить время и поможет выявить проблемы на начальном этапе. Работа с огромными таблицами не всегда удобна для человеческого восприятия, важно уметь красиво визуализировать свои результаты, что делает их более наглядными и подкрепляет полученные выводы. Любое исследование проводят для того, чтобы ответить на какой-то вопрос. Как корректно сформулировать этот вопрос? Какие и сколько данных потребуется, чтобы провести исследование? Насколько достоверны полученные нами ответы? 

Язык R обладает мощным функционалом для решения подобных задач. 

Курс состоит из 15 лекций и 15 практических занятий, разделенных на 4 логических блока: 

- введение в R 

- манипуляции с данными табличного типа 

- визуализация данных 

- статистическая обработка 

На лекциях со студентами на примерах разбирают особенности языковых конструкций и основные функции популярных в анализе данных пакетов. Освоение языка программирования невозможно без большого количества практических занятий. На семинарах студентам предлагают решить несколько заданий по материалам лекции под присмотром преподавателей. После занятия студентам выдают домашнее задание для самостоятельной отработки навыков. 

По окончании курса, при условии хорошей работы в аудитории и дома, мы ожидаем увидеть студента, который может преобразовывать данные табличного вида разной сложности, способен красиво представить свои результаты и подготовить иллюстрацию к публикации, умеет строить собственные гипотезы и проверять их. 

Даты проведения:
c   05/01/2022, 12:00 PM
по 05/01/2025, 12:00 PM
Разделов: 9
Участников: 27