Junior data analyst: младший аналитик данных

Анализ данных и искусственный интеллект

Центр дополнительного образования МГТУ им. Н.Э. Баумана в целях выполнения программы стратегического академического лидерства «Приоритет-2030» разработал курс по направлению анализа данных: «Junior data analyst: младший аналитик данных».

За ближайшие 10 лет мировой объем данных вырастет более чем в 10 раз, именно область Big Data и информация, будет обладать критически важными свойствами во всех областях, соответственно, спрос на специалистов по аналитике данных также будет расти. Наш курс будет актуальным для тех, кто хочет развить навыки первичной обработки данных, основы языка SQL, языка программирования Python, познакомиться с библиотеками программирования: matplotlib, pandas, sklearn и другими, создавать базы данных в PGAdmin. Обучение на курсе подходит для тех, кто решил освоить новую профессию, начать разбираться в анализе больших данных.

Продолжительность курса составляет 44 академических часа. Занятия включают в себя лекционные материалы, решение практико-ориентированных кейсов, домашние задания и итоговое тестирование. Преподаватели – не только ведущие ученые – практики, но и специалисты в области больших данных (Big Data) и науке о данных (Data science).

Для успешного освоения курса нашим слушателям предоставляются уникальные опции:

  • оперативная поддержка куратора по всем вопросам обучения в чате Telegram, где слушатель может задать вопросы как во время обучения, так и в неограниченный период времени после завершения курса,

  • онлайн-консультация эксперта-преподавателя по пройденным темам и выполнению практических заданий.

По окончании курса слушатель получит удостоверение о повышении квалификации МГТУ им. Н.Э. Баумана.

Записаться на курс

Ближайший старт групп

18 апреля

Длительность курса

44 ак. часа

Форматы обучения

свободное обучение
Конкуренция на рынке труда?
Сейчас не хватает специалистов
10 000 компаний
сейчас ищут младшего аналитика данных
90 000 рублей
средняя зарплата специалиста в сфере анализа данных

Курс подойдет

Начинающим аналитикам

курс расширит ваши компетенции: вы научитесь структурировать "сырые" массивы данных и выдвигать гипотезы на их основе

Начинающим программистам

курс позволит Вам расширить компетенции и улучшить знания языков Python и SQL

Новичкам

для получения стартовых знаний в сфере Big Data, статистики, понимания языков SQL и Python

Чему вы научитесь

сформировать простой запрос в базе данных с использованием SQL

сделать описательный анализ Big Data и визуализацию

создать базу данных Postgres через приложение PGAdmin4

структурировать, анализировать большие массивы данных и принимать решения на их основе

Программа курса

17 тематических
модулей
44 академических
часа
44 аудиторных
часа
Введение в Big Data и Data science. Data science в различных секторах экономики
  • Основные термины. Типы задач, которые решаются с помощью Data Science. Обоснованность применения.
Данные и источники, характеристики, корреляция. Структурированные, полуструктурированные и неструктурированные данные
  • Данные и источники, характеристики, корреляция. Структурированные, полуструктурированные и неструктурированные данные.
Введение в статистику. Закон больших чисел. Нормальное распределение. Проверка гипотез
  • Определение статистической науки.
  • Закон больших чисел, нормальное распределение и его роль в описании и анализе данных.
  • Понятие нулевой гипотезы и проверка нулевой гипотезы, ошибки первого и второго рода.
Типы данных
  • Основные типы данных, которые применяются в data science, программировании и базах данных: целочисленные, логические, строки, числа с плавающей точкой, дата и время, timestamp.
Введение в Python, среды исполнения (IDE). Типы данных в Python
  • Основные среды и продукты: PyCharm, Anaconda, Google Colaboratory.
  • Язык программирования Python как стандарт для работы с большими данными: основные функции, типы данных в Python.
Базовые конструкции и структуры
  • Основные конструкции, списки, словари, множества, кортежи, стеки, очереди, логические условия, арифметические операции.
Циклы и условия. Функции и классы
  • Синтаксис построения циклов, условных операторов, пользовательских функций, классов, наследование и полиморфизм.
Библиотеки Numpy, Scipy для научных вычислений
  • Библиотека NumPy, типы данных, массивы и операции с ними, Матричные операции, семплирование, чтение файлов.
  • Библиотека SciPy. Научные вычисления. Практическое применение. Работа с данными. Тестирование данных.
Библиотека Pandas, как стандарт исследования данных
  • Библиотека Pandas, загрузка и запись данных, срезы данных, мульти индексация, group by, datetime, статистические функции, стандартная визуализация. Преимущества и недостатки библиотеки Pandas.
Визуализация в Python и срезы данных. Библиотеки Matplotlib, seaborn, plotly
  • Библиотека Matplotlib, варианты отрисовки графиков и изображений.
  • Библиотека Seaborn, визуализация парных взаимосвязей, heatmap, диаграммы, тепловая карта корреляции.
  • Библиотека Plotly. Продвинутая визуализация. Динамические графики.
Поиск бизнес решений и анализ датасетов
  • Общий подход к описательному анализу данных.
  • Выявление скрытых закономерностей и корреляций для принятия бизнес-решений.
Системы хранения данных. Базы данных
  • Основные подходы к хранению данных: горизонтально и вертикально масштабируемые системы хранения данных, реляционные и NoSQL. Key-Value хранилища.
Реляционные базы данных и их моделирование
  • Реляционные базы данных для хранения структурированных данных. Основные определения и признаки реляционных баз данных. Понятие и создание моделей (схем) баз данных и установление связей один-ко-многим (one2many), многие-ко-многим (many2many), многие-к-одному (many2one).
Функционал PGAdmin для PostgreSQL
  • Процесс установки реляционных баз данных PostgreSQL.
  • Интерфейс оболочки PGAdmin, основной функционал PGAdmin для удобной навигации по реляционным базам данных. Восстановление и развертывание базы данных из файла.
Язык структурированных запросов SQL. Синтаксис
  • Язык структурированных запросов SQL. Общий подход. Базовая концепция, фильтрация, функции. Функционал PgAdmin. Подзапросы, Join, Табличные операции.
Обращение к базе данных PostgreSQL с помощью языка SQL
  • Задачи создания новых таблиц, внешних и внутренних ключей их связей.
  • Формирование аналитических запросов в реляционной базе данных PostgreSQL.
Итоговая аттестация
  • Тестирование.

Расписание

Даты проведения
Время проведения курса
Дни недели
Формат обучения
Стоимость
18 апр
18 мая
10:00 - 10:00
свободный график
свободное обучение
23 320 руб

Преподаватели курса

Преподавательский состав Центра дополнительного образования МГТУ им. Н.Э. Баумана состоит из профессионалов лучшего технического ВУЗа России с многолетним опытом работы в ведущих отраслевых компаниях. Многие из наших специалистов имеют ученые степени и звания.

Наши преподаватели искренне любят свое дело: структурированно и последовательно излагают материал, доступно объясняют верные решения сложных профессиональных задач и разбирают только реальный опыт крупнейших российских и зарубежных компаний. Так, после окончания обучения слушатели Центра дополнительного образования МГТУ им. Н.Э. Баумана могут сразу же применять свои знания и навыки на практике.

Резюме «Младший аналитик данных»

Знания и навыки

  • Работа с множеством источников данных: сбор, очистка, изучение, анализ данных

  • Визуализация полученных результатов в виде схем, диаграмм, графиков, дашбордов

  • Проведение исследований с целью поиска способов увеличения эффективности компании

  • Решение задач прогнозирования и проверки гипотез

Заработная плата от:
90 000 руб.
Желаемая должность:
Младший аналитик данных

Документы об окончании

Задать свой вопрос
+7 (495) 182-83-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00
+7 (495) 182-83-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00