Junior data scientist: младший специалист по анализу больших данных

Аналитика и Data Science
Приоритет - 2030

Центр дополнительного образования МГТУ им. Н.Э. Баумана в целях выполнения программы стратегического академического лидерства «Приоритет-2030» разработал курс по направлению анализа данных: «Junior data scientist: младший специалист по анализу больших данных».

В настоящее время работа в сфере Big Data (больших данных) невозможна без искусственного интеллекта, а именно без нейронных сетей. Развитие этого направления приведет к тому, что к 2030 году среднестатистический человек будет взаимодействовать с устройствами, соединенными с сетями, более 5000 раз в день. Соответственно необходимы специалисты, которые будут создавать алгоритмы обработки данных для подачи их в модель нейронной сети, подбирать ее модель и архитектуру, использовать механизмы для решения реальных задач и многое другое. Курс подойдет специалистам, которые обладают базовыми знаниями в анализе больших данных и хотят изучать эту область углубленно, а также планирует профессиональный рост до позиции middle data scientist.

Продолжительность курса составляет 47 академических часов. Занятия включают в себя лекционные материалы, решение практико-ориентированных кейсов, домашние задания и итоговое тестирование. Преподаватели – не только ведущие ученые – практики, но и специалисты в области больших данных (Big Data) и науке о данных (Data science).

Для успешного освоения курса нашим слушателям предоставляются уникальные опции:

  • оперативная поддержка куратора по всем вопросам обучения в чате Telegram, где слушатель может задать вопросы как во время обучения, так и в неограниченный период времени после завершения курса,

  • онлайн-консультация эксперта-преподавателя по пройденным темам и выполнению практических заданий.

По окончании курса слушатель получит удостоверение о повышении квалификации МГТУ им. Н.Э. Баумана.

Курс подойдет

Начинающим аналитикам

Вы сможете углубить свои знания и получить навыки для повышения до уровня middle

Программистам

Вы научитесь строить и обучать нейронные сети для выполнения практических задач

Чему вы научитесь

Выполнять обработку данных и препроцессинг для подачи их в модель нейронной сети

Подбирать модель или архитектуру нейронной сети, обучить ее для использования в практических задачах

Решать задачи классификации и регрессии с применением нейронных сетей

Программа курса
В этом курсе вас ожидает
14 тематических
модулей
47 академических
часов
В этом курсе вас ожидает
14 тематических
модулей
47 академических
часов
Введение в нейронные сети. Обзор библиотеки tensorflow.keras
    • В рамках данной темы будут рассмотрены термины и определения, библиотеки tensorflow.keras, основной функционал. Методы написания нейронных сетей. Разбор основных разделов библиотеки. Области решаемых задач.
Активационные функции
    • В рамках данной темы будут рассмотрены основные активационные функции, применяемые в нейронных сетях: linear, relu, elu, sigmoid, softmax, tang, лучшие практики применения.
Полносвязные нейронные сети. Dense слои
    • В данной теме будут рассмотрены полносвязные нейронные сети Dense слои (перцептрон). Области решаемых задач, основные особенности архитектуры.
Свёрточные нейронные сети. Conv слои
    • В рамках данной темы будут рассмотрены свёрточные нейронные сети Conv слои. Особенности архитектуры свёрточной нейронной сети. Области решаемых задач, принимаемые форматы данных на входе.
Метрики, минимизация ошибки. Градиентный спуск. Борьба с переобучением
    • В рамках данной темы будут рассмотрены основные термины и определения метрик потерь в нейронных сетях, градиентный спуск и его практическое применение, также будут рассмотрены ошибки binary-cross entropy, categorical cross entropy, расстояние кульбака-лейблера. Будет рассмотрено понятие «переобучение», случаи переобучения и методы предотвращения переобучения – случайный выброс нейронов (dropout), нормализация (batch normalization).
Построение архитектуры нейронной сети для задач бинарной и множественной классификации
    • Собрать и обучить простую нейронную сеть, решить задачу множественной классификации. Проверить точность сети, сделать визуализацию процесса обучения.
Анализ аудиосигналов. Особенности препроцессинга и архитектуры нейронной сети
    • В рамках данной темы будут рассмотрены основные принципы при проведении препроцессинга аудиосигналов и их параметризации, пересечение нуля, мел-кепстральные, частота цветности, а также оптимальные архитектуры для работы с аудиосигналами, обзор библиотеки librosa.
Сохранение моделей
    • В рамках данной темы будут рассмотрены основные методы сохранения моделей в различных форматах h5, pkl, save_model. Промежуточное сохранение и callback.
Работа с предобученными моделями
    • В рамках данной темы будут рассмотрены основные вопросы, связанные с использование моделей машинного обучения и нейронных сетей от сторонних поставщиков, понятие сигнатура модели, подготовка данных и входная размерность.
Введение в рекомендательные системы. Коллаборативная фильтрация
    • В рамках данной темы будут рассмотрены области применения рекомендательных систем, основная концепция. Будет разобран метод коллаборативная фильтрация.
Content based фильтрация
    • В рамках данной темы будет рассмотрен метод рекомендательных систем, основанный на информационном следе, потребленном контенте. Будет рассмотрена проблема холодного старта в рекомендательных системах.
Similarity based
    • В рамках данной темы будут рассмотрен метод рекомендательной системы, основанный на схожести объектов.
Сингулярное (SVD) разложение матрицы. Решение проблемы холодного старта
    • В рамках данной темы будут рассмотрена рекомендательная система, основанная на сингулярном разложении матрицы (датасета), как способ решить проблему холодного старта.
Итоговая аттестация
    • Тестирование

Требования к подготовке

Среднее профессиональное или высшее образование. Знание основ статистики и языка программирования Python. 

Связанные курсы

Преподаватели курса

Преподавательский состав Центра дополнительного образования МГТУ им Н.Э. Баумана состоит из профессионалов лучшего технического ВУЗа России с многолетним опытом работы в ведущих отраслевых компаниях. Многие из наших специалистов имеют ученые степени и звания. Наши преподаватели искренне любят свое дело: структурировано и последовательно излагают материал, доступно объясняют верные решения сложных профессиональных задач и разбирают только реальный опыт крупнейших российских и зарубежных компаний. Так, после окончания обучения слушатели Центра дополнительного образования МГТУ им. Н.Э. Баумана могут сразу же применять свои знания и навыки на практике.


Задать свой вопрос
+7 (495) 182-83-85
director@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00
+7 (495) 182-83-85
director@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00