Junior data scientist: младший специалист по анализу больших данных

Анализ данных и искусственный интеллект

Центр дополнительного образования МГТУ им. Н.Э. Баумана в целях выполнения программы стратегического академического лидерства «Приоритет-2030» разработал курс по направлению анализа данных: «Junior data scientist: младший специалист по анализу больших данных».

В настоящее время работа в сфере Big Data (больших данных) невозможна без искусственного интеллекта, а именно без нейронных сетей. Развитие этого направления приведет к тому, что к 2030 году среднестатистический человек будет взаимодействовать с устройствами, соединенными с сетями, более 5000 раз в день. Соответственно необходимы специалисты, которые будут создавать алгоритмы обработки данных для подачи их в модель нейронной сети, подбирать ее модель и архитектуру, использовать механизмы для решения реальных задач и многое другое. Курс подойдет специалистам, которые обладают базовыми знаниями в анализе больших данных и хотят изучать эту область углубленно, а также планирует профессиональный рост до позиции middle data scientist.

Продолжительность курса составляет 47 академических часов. Занятия включают в себя лекционные материалы, решение практико-ориентированных кейсов, домашние задания и итоговое тестирование. Преподаватели – не только ведущие ученые – практики, но и специалисты в области больших данных (Big Data) и науке о данных (Data science).

Для успешного освоения курса нашим слушателям предоставляются уникальные опции:

  • оперативная поддержка куратора по всем вопросам обучения в чате Telegram, где слушатель может задать вопросы как во время обучения, так и в неограниченный период времени после завершения курса,

  • онлайн-консультация эксперта-преподавателя по пройденным темам и выполнению практических заданий.

По окончании курса слушатель получит удостоверение о повышении квалификации МГТУ им. Н.Э. Баумана.

МГТУ им. Баумана

Записаться на курс

Расписание

Даты проведения
Время проведения и дни недели
Формат обучения
Длительность курса
Стоимость
21 мар
21 апр
10:00 - 10:00
свободный график
свободное обучение
47 ак. часов
30 800 руб
Конкуренция на рынке труда?
Сейчас не хватает специалистов
9 000 компаний
сейчас ищут младшего специалиста по анализу данных
80 000 рублей
средняя зарплата специалиста в сфере аналитики данных

Курс подойдет

Начинающим аналитикам

Вы сможете углубить свои знания и получить навыки для повышения до уровня middle

Программистам

Вы научитесь строить и обучать нейронные сети для выполнения практических задач

Чему вы научитесь

выполнять обработку данных и препроцессинг для подачи их в модель нейронной сети

подбирать модель или архитектуру нейронной сети, обучить ее для использования в практических задачах

решать задачи классификации и регрессии с применением нейронных сетей

Программа курса

14 тематических
модулей
47 академических
часов
22 аудиторных
часа
Введение в нейронные сети. Обзор библиотеки tensorflow.keras
  • В рамках данной темы будут рассмотрены термины и определения, библиотеки tensorflow.keras, основной функционал. Методы написания нейронных сетей. Разбор основных разделов библиотеки. Области решаемых задач.
Активационные функции
  • В рамках данной темы будут рассмотрены основные активационные функции, применяемые в нейронных сетях: linear, relu, elu, sigmoid, softmax, tang, лучшие практики применения.
Полносвязные нейронные сети. Dense слои
  • В данной теме будут рассмотрены полносвязные нейронные сети Dense слои (перцептрон). Области решаемых задач, основные особенности архитектуры.
Свёрточные нейронные сети. Conv слои
  • В рамках данной темы будут рассмотрены свёрточные нейронные сети Conv слои. Особенности архитектуры свёрточной нейронной сети. Области решаемых задач, принимаемые форматы данных на входе.
Метрики, минимизация ошибки. Градиентный спуск. Борьба с переобучением
  • В рамках данной темы будут рассмотрены основные термины и определения метрик потерь в нейронных сетях, градиентный спуск и его практическое применение, также будут рассмотрены ошибки binary-cross entropy, categorical cross entropy, расстояние кульбака-лейблера. Будет рассмотрено понятие «переобучение», случаи переобучения и методы предотвращения переобучения – случайный выброс нейронов (dropout), нормализация (batch normalization).
Построение архитектуры нейронной сети для задач бинарной и множественной классификации
  • Собрать и обучить простую нейронную сеть, решить задачу множественной классификации. Проверить точность сети, сделать визуализацию процесса обучения.
Анализ аудиосигналов. Особенности препроцессинга и архитектуры нейронной сети
  • В рамках данной темы будут рассмотрены основные принципы при проведении препроцессинга аудиосигналов и их параметризации, пересечение нуля, мел-кепстральные, частота цветности, а также оптимальные архитектуры для работы с аудиосигналами, обзор библиотеки librosa.
Сохранение моделей
  • В рамках данной темы будут рассмотрены основные методы сохранения моделей в различных форматах h5, pkl, save_model. Промежуточное сохранение и callback.
Работа с предобученными моделями
  • В рамках данной темы будут рассмотрены основные вопросы, связанные с использование моделей машинного обучения и нейронных сетей от сторонних поставщиков, понятие сигнатура модели, подготовка данных и входная размерность.
Введение в рекомендательные системы. Коллаборативная фильтрация
  • В рамках данной темы будут рассмотрены области применения рекомендательных систем, основная концепция. Будет разобран метод коллаборативная фильтрация.
Content based фильтрация
  • В рамках данной темы будет рассмотрен метод рекомендательных систем, основанный на информационном следе, потребленном контенте. Будет рассмотрена проблема холодного старта в рекомендательных системах.
Similarity based
  • В рамках данной темы будут рассмотрен метод рекомендательной системы, основанный на схожести объектов.
Сингулярное (SVD) разложение матрицы. Решение проблемы холодного старта
  • В рамках данной темы будет рассмотрена рекомендательная система, основанная на сингулярном разложении матрицы (датасета), как способ решить проблему холодного старта.
Итоговая аттестация
  • Тестирование.

Преподаватели курса

Преподавательский состав Центра дополнительного образования МГТУ им. Н.Э. Баумана состоит из профессионалов лучшего технического ВУЗа России с многолетним опытом работы в ведущих отраслевых компаниях. Многие из наших специалистов имеют ученые степени и звания.

Наши преподаватели искренне любят свое дело: структурированно и последовательно излагают материал, доступно объясняют верные решения сложных профессиональных задач и разбирают только реальный опыт крупнейших российских и зарубежных компаний. Так, после окончания обучения слушатели Центра дополнительного образования МГТУ им. Н.Э. Баумана могут сразу же применять свои знания и навыки на практике.

Резюме «Младший специалист по анализу данных»

Знания и навыки

  • Сбор данных из различных источников

  • Представление полученных результатов в доступной и наглядной форме

  • Оценка качества данных и проведение их очистки и проверки

  • Работа с неструктурированными данными и их структурирование

Заработная плата от:
80 000 руб.
Желаемая должность:
Специалист по анализу данных

Документы об окончании

МГТУ им. Баумана
МГТУ им. Баумана
Задать свой вопрос
+7 (495) 187-85-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00
+7 (495) 187-85-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00