Data Science PRO

Анализ данных и искусственный интеллект

Data Scientist - это многопрофильный специалист, который разбирается в математике и статистике, обучает нейронные сети, программирует на Python, говорит на языке данных и делает прогнозы для принятия эффективных решений практически во всех областях современных науки и бизнеса.

Программа профессиональной переподготовки «Data Science Pro» разработана для знакомства с основными технологиями и подходами анализа данных и предназначена для тех, кто хочет освоить новую востребованную цифровую профессию специалиста по большим данным, начиная с базового уровня.

Программа включает много практической работы, а также лекции, вебинары и учебные консультации. Обучение проходит под руководством высококлассных преподавателей-разработчиков и практиков, кандидатов технических наук, доцентов МГТУ им. Н.Э. Баумана, с интересными домашними заданиями, персонализированной обратной связью и дополнительными учебными материалами.

В ходе обучения и подготовки выпускной работы слушатель выполняет проекты по реальным кейсам в портфолио для дальнейшего трудоустройства и будущей профессиональной деятельности. После сдачи итоговой аттестационной работы выдается диплом о профессиональной переподготовке МГТУ им. Н.Э. Баумана.

Преимущества программы:
  1. Обучение в онлайн-формате в режиме 24х7 из любой удобной локации.
  2. Глубокие фундаментальные знания, актуальная необходимая теория и много прикладной практики.
  3. Интенсивное прохождение программы за 5 месяцев для быстрого старта в профессии.
  4. Занятия с ведущими преподавателями-практиками МГТУ им. Н.Э. Баумана и профильными экспертами.
  5. Доступ к пройденным материалам в течение 4 месяцев после окончания курса.
  6. Помощь в трудоустройстве (рекомендуем резюме лучших выпускников индустриальным партнерам).
  7. Диплом о профпереподготовке МГТУ им. Н.Э. Баумана.

Записаться на курс

Ближайший старт групп

12 декабря

Длительность курса

262 ак. часа

Стоимость курса

130 000 руб.

Форматы обучения

онлайн
Конкуренция на рынке труда?
Сейчас не хватает специалистов
1 100 компаний
сейчас ищут data scientist'а
200 000 рублей
средняя зарплата специалиста в сфере Data Science

Курс подойдет

IT- специалистам

желающим сменить или расширить свою квалификацию

Всем

кто хочет получить новую цифровую профессию специалиста Data Science

Выпускникам

средних профессиональных и высших учебных заведений

Чему вы научитесь

делать описательный анализ Big Data и визуализацию данных

создавать комплексные приложения с обработкой входных данных, передачей в модель и получением наилучшего результата

создавать микросервисы, готовые к интеграции в текущую инфраструктуру

разрабатывать компьютерные программы на основе языка программирования Python

использовать функционал PgAdmin для решения проектных задач

ставить и решать задачи машинного обучения

работать с типовыми решениями и библиотеками программирования: pandas, numpy, scipy, sklearn, matplotlib, seaborn, tensorflow, pytorch

подбирать и тренировать модель машинного обучения или архитектуру нейронной сети

Программа курса

17 тематических
модулей
262 академических
часа
147 аудиторных
часов
Введение в Big data. Знакомство с основными понятиями. Статистика.
  • Введение в предмет.
  • Какие бывают источники данных, характеристики, корреляция.
  • Типы структурированности данных.
  • Введение в статистику. Типы распределений данных. Проверка гипотез, матрицы ошибок.
  • Структуры данных.
  • Техническое задание и требование к проекту Big data, data science.
Базы данных, их типы и моделирование. Взаимодействие пользователей с данными.
  • Системы хранения данных. Базы данных.
  • Реляционные базы данных и их моделирование.
  • PGAdmin. SQL, синтаксис обращения к базам данных. Простые и сложные запросы.
  • Решение практического кейса: «Создание базы данных университета».
Языки программирования, среды исполнения и основные операционные системы, которые используются в задачах Big Data
  • Введение в Python, среды исполнения (IDE).
  • Типы данных в Python. Базовые конструкции и структуры.
  • Циклы и условия.
  • Функции и классы.
  • Библиотеки Numpy, Scipy для научных вычислений.
  • Библиотека Pandas, как стандарт исследования данных.
  • Визуализация в Python и срезы данных. Библиотеки Matplotlib, seaborn, plotly.
  • Работа с командной строкой. Linux, Wiпdows.
  • Решение практического кейса: «Визуализация данных с использованием основных библиотек языка программирования Python в среде Jupyter Notebook».
Основной pipeline машинного обучения и dataflow. Облачные платформы
  • Piprline машинного обучения. Особенности архитектурных решений.
  • Sklearn - основная ML библиотека. Ленивые вычисления.
  • Решение практического кейса: «Создание пайплайна для проекта по машинному обучению с использованием библиотеки Sklearn».
Парсинг данных, подготовка выборки, препроцессинг и балансировка данных
  • Ключевые задачи в подготовке датасетов и их важность.
  • Нормализация и стандартизация. Поиск аномалий и выбросов. Методы обработки и визуализации.
  • Разбалансированные датасеты и методы балансировки. Доверительные интервалы.
  • Обработка категориальных признаков. LabelEncoder, One Hot encoding.
  • Решение практического кейса: «Применение техник препроцессинга данных для подготовки датасета к решению задач машинного обучения».
Обучение без учителя. Работа с размерностью и структурой данных
  • Обучение на размеченных и неразмеченных данных. Проблема снижения размерности данных.
  • Метод главных компонент (Principal Component Analysis).
  • Алгоритмы кластеризации. Метод k-means, c means, hierarchical clustering. Выбор алгоритма кластеризации.
  • Решение практического кейса: «Снижение размерности в задаче определения кредитного потенциала заемщика».
  • Решение практического кейса: «Кластеризация городов Российской Федерации по типу прироста (убыли) населения».
Теория вероятности и вероятностные классификаторы
  • Полная и условная вероятность, теорема Байеса Байесовский вероятностный классификатор.
  • Решение практического кейса: «Решение задачи классификации осколков стекла по их химическому составу «Glass Identification Data Set».
Классификация. Оценка качества алгоритма
  • Задача классификации. Матрица ошибок (Confusion matrix). Точность классификации.
  • Модель анализа ROC-AUC. Методы классификации. Метод ближайших соседей k-NN. Метод опорных векторов (SVM).
  • Решение практического кейса: «Оценка и классификация кредитного потенциала заемщиков».
Ансамбли и повышение точности алгоритмов
  • Ансамбли решателей.
  • Решающие деревья (Decision tree). Случайный лес (Random forest).
  • Ансамбли алгоритмов. Bagging, boosting, stacking.
  • Основы составления сеток обучения.
  • Решение практического кейса: «Решение задач медицинской диагностики с применением ансамблей классификаторов».
  • Решение практического кейса: «Решение задачи анализа сетевой активности с использованием алгоритма AdaBoost».
Регрессия
  • Линейная регрессия. Логистическая регрессия. Метод наименьших квадратов. Средняя квадратичная ошибка, средняя абсолютная ошибка.
  • Авторегрессия ARIMA.
  • Решение практического кейса: «Прогнозирование объемов продаж товаров торгового предприятия».
  • Решение практического кейса: «Оценка кредитоспособности клиентов банка - физических лиц».
Нейронные сети
  • Введение в искусственные нейронные сети.
  • Биологическая модель нейрона. Активационные функции.
  • Полносвязные нейронные сети.
  • Методы обучения нейронных сетей.
  • Борьба с переобучением.
  • Нейронные сети Кохонена.
  • Сверточные нейронные сети.
  • Решение практического кейса: «Моделирование объемов продаж торгового предприятия с использованием нейронных сетей».
  • Решение практического кейса: «Анализ банковского сектора с применением нейронных сетей Кохонена».
Разработка компьютерных программ: написание программного кода и решение практических задач с применением нейронных сетей
  • Решение практического кейса: «Разработка приложения на языке программирования Python для решения задачи компьютерного зрения с использованием нейронных сетей».
Рекомендательные системы
  • Введение. Коллаборативная и Content-based фильтрация.
  • Сингулярное (SVD) разложение матрицы. Достоинства и недостатки.
  • Решение практического кейса: «Создание рекомендательной системы торгового предприятия».
Создание приложений, интеграция в ИТ ландшафт
  • Сортирование и сохранение моделей. Работа с предобученными моделями.
  • Flask приложение.
  • Выведение моделей в production.
  • Контроль версионности моделей с tensorflow sesrving.
  • Облачная платформа Kaggle для решения data science задач.
  • Решение практического кейса: «Создание flask приложения для запуска моделей машинного обучения».
Итоговая аттестация
  • Подготовка и защита ВКР.

Расписание

Даты проведения
Время проведения курса
Дни недели
Формат обучения
12 дек
14 апр
18:30 - 17:10
вт вс
онлайн

Преподаватели курса

Преподавательский состав Центра дополнительного образования МГТУ им. Н.Э. Баумана состоит из профессионалов лучшего технического ВУЗа России с многолетним опытом работы в ведущих отраслевых компаниях. Многие из наших специалистов имеют ученые степени и звания.

Наши преподаватели искренне любят свое дело: структурированно и последовательно излагают материал, доступно объясняют верные решения сложных профессиональных задач и разбирают только реальный опыт крупнейших российских и зарубежных компаний. Так, после окончания обучения слушатели Центра дополнительного образования МГТУ им. Н.Э. Баумана могут сразу же применять свои знания и навыки на практике.

Резюме «Data scientist»

Знания и навыки

  • Извлечение, преобразование, загрузка данных и их обработка

  • Осуществление контроля корректности и полноты данных

  • Формирование отчётов, визуализации данных

  • Создание аналитических моделей данных

  • Формирование гипотез, планирование и проведение экспериментов

Заработная плата от:
200 000 руб.
Желаемая должность:
Data scientist

Документы об окончании

Задать свой вопрос
+7 (495) 182-83-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00
+7 (495) 182-83-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00