Data Science. Уровень 1: основы работы с данными

Анализ данных и искусственный интеллект

Специалист по Data Science – одна из самых востребованных цифровых компетенций на сегодняшний день. Используя методы науки о данных (Data Science), Data Scientist строит и тестирует математические модели для поиска закономерностей, выстраивания прогнозов и формирования эффективных решений в различных направлениях и сферах деятельности.

Программа курса «Data Science. Уровень 1: основы работы с данными» предназначена для тех, кто только начинает свой путь в Data Science, и знакомит слушателей с математическими основами Data Science, основами анализа и работы с базами данных, а также с основами программирования на языке Python и другими рабочими инструментами квалифицированного специалиста Data Science. 

По окончании обучения желающие могут продолжить последовательное освоение технологий Data Science на курсах:

Или получить комплексные знания и новую профессию, пройдя обучение по программам профессиональной переподготовки:

Выпускники курса «Data Science. Уровень 1: основы работы с данными», прошедшие итоговую аттестацию, получают удостоверение о повышении квалификации МГТУ им. Н.Э. Баумана.

Записаться на курс

Расписание

Даты проведения
Время проведения и дни недели
Формат обучения
Длительность курса
Стоимость
28 сен
16 ноя
10:00 - 17:10
сб
онлайн в режиме реального времени
72 ак. часа
71 875 руб 57 500 руб цена со скидкой 20%
Конкуренция на рынке труда?
Сейчас не хватает специалистов
8 000 компаний
90 000 рублей

Курс подойдет

Программистам

получите базовые навыки программирования, научитесь ставить гипотезы, программировать на Python

Новичкам и аналитикам

для улучшения своих знаний и навыков работы в Python и получению базовых знаний по Data Science

Чему вы научитесь

основам языка Python для анализа данных и Data Science

работе с библиотеками Pandas, Numpy, Matplotlib

основам работы с базами данных: SQL, NoSQL, In-memory

основам сбора и подготовке данных для целей анализа и Data Science

математическим основам Data Science: теория вероятности и математическая статистика

пространственному, статистическому и функциональному мышлению

Программа курса

5 тематических
модулей
72 академических
часа
60 аудиторных
часов
Основы программирования на Python для data science
  • Основы языка: переменные и их типы, арифметические операции, операции над строками, функции.
  • Основы объектно-ориентированного программирования: классы, экземпляр класса, поля и методы, наследование, безопасный доступ.
  • Библиотеки Numpy, Scipy: векторы, матрицы, операции над векторами и матрицами, основы линейной алгебры.
  • Работа в среде Pychram - создание законченных скриптов.
  • Работа в среде Google Colab - Python notebooks - рабочий инструмент.
Основы работы с базами данных
  • Основные типы баз данных для data science: основы хранения информации, таблицы и коллекции, отношения между ними, транзакции, уровни изоляции.
  • Реляционные СУБД как основной источник данных для data science: разбор основных возможностей РСУБД на примере PostgreSQL: получение основных данных о ядре БД, psql - встроенный клиент БД; операции DML: выборка, изменение, удаление, вставка данных; операции DDL: создание и удаление баз данных, таблиц, функций, процедур.
  • NoSQL базы данных на примере MongoDB: коллекции, операции по созданию, изменению, вставке и удалению данных.
  • In-Memory базы данных на примере Redis: хранение информации «ключ - значение» - операции вставки, манипуляции и удаление.
  • Примеры работы с основными типами БД из Python из Pycharm и Python Notebook.
Основы анализа данных
  • Основы работы с библиотеками Request, BeatifulSoup - сбор данных с HTML страниц.
  • Библиотеки Pandas и Polars: универсальные табличные процессоры без ограничений. Внутреннее устройство, понятие датафрейма, основные операции, преобразование типов, уменьшение размеров датафреймов. Загрузка данных в датафрейм из разных источников, сохранение данных. Основные аналитические операции: query, groupby, aggregate, sort, pivot_table.
  • Библиотеки Matplotlib и Seaborn: основы визуализации данных.
  • Создание графиков разных типов: linechart, barchart, boxplot, catplot, etc.
  • Тюнинг параметров графиков, ресурсные записи. Exploratory Data Analysis (EDA) - базовые принципы анализа данных с использованием графиков.
  • Основы бизнес-анализа и unit-экономики: анализ данных и расчет бизнес-метрик: LTV, RFM, ARPU, ARPPU, etc.
Математика для data science
  • Элементарные функции: основные определения, предел функции.
  • Непрерывность и дифференцируемость: производные простых и сложных функций, оптимизация функции одной переменной.
  • Теория вероятностей: сложение и произведение вероятностей, формула Бернулли, условная вероятность: теорема Байеса.
  • Математическая статистика: проверка гипотез, статистический вывод, центральная предельная теорема, сравнение средних значений, корреляция, регрессия, bootstrap, АБ тесты.

Преподаватели курса

Преподавательский состав Центра дополнительного образования МГТУ им. Н.Э. Баумана состоит из профессионалов лучшего технического ВУЗа России с многолетним опытом работы в ведущих отраслевых компаниях. Многие из наших специалистов имеют ученые степени и звания.

Наши преподаватели искренне любят свое дело: структурированно и последовательно излагают материал, доступно объясняют верные решения сложных профессиональных задач и разбирают только реальный опыт крупнейших российских и зарубежных компаний. Так, после окончания обучения слушатели Центра дополнительного образования МГТУ им. Н.Э. Баумана могут сразу же применять свои знания и навыки на практике.

Резюме «Дата-аналитик»

Знания и навыки

  • Статистический анализ данных, структурирование больших объемов информации

  • Проведение разведочного анализа данных

  • Разработка алгоритмов расчета сводных таблиц и их формирование

  • Подготовка витрин данных

  • Визуализация результатов исследований

Заработная плата от:
90 000 руб.

Документы об окончании

Задать свой вопрос
+7 (495) 187-85-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00
+7 (495) 187-85-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00