Loading...

О курсе «Инженер данных»

Курс нацелен на получение компетенций, необходимых для профессиональной деятельности специалиста в области искусственного интеллекта и больших данных при реализации проектов и разработки новых решений на основе данных.

Курс включает изучение основ инженерии больших данных, современных технологий анализа данных и машинного обучения, языков программирования, методов искусственного интеллекта, нейросетевых технологий. Программа нацелена на получение практических навыков по созданию систем анализа больших данных, разработки баз данных, моделирования данных, разработки алгоритмов и программных средств, в том числе с использованием современных интеллектуальных технологий, созданию и внедрению сквозных цифровых субтехнологий искусственного интеллекта.

Программа повышения квалификации построена по модульному принципу, предполагает изучение теоретического материала и практическую отработку полученных знаний.

Для оценки уровня освоения полученных в процессе обучения компетенций слушателям будет предложено пройти итоговое тестирование, а также сформировать портфолио своих выполненных практических работ.

иконка книги Объём курса – 260 академических часов.
Компетенции, которые вы приобретете на курсе
иконка лупы

выбор и применение на практике современных методов и инструментов обработки и анализа больших массивов данных

иконка лупы

классификация и идентификация задачи искусственного интеллекта, выбор адекватных методов и инструментальных средств решения задач искусственного интеллекта

иконка лупы

разработка и применение методов машинного обучения для решения задач

иконка лупы

создание и поддержка системы искусственного интеллекта на основе нейросетевых технологий

иконка лупы

разработка системы анализа больших данных

иконка лупы

создание и внедрение одной или нескольких сквозных цифровых субтехнологий искусственного интеллекта

Программа обучения
  • Тема 1.1 Инженер данных. Цели, направления, задачи, обязанности и функция в команде
  • Тема 1.2 Технологии DataScience и BigData для решения практических задач
  • Тема 1.3 Основы синтаксиса и структур в Python
  • Тема 1.4 Использование библиотек NumPy, SciPy для вычислений
  • Тема 1.5 Обработка данных в Python. Библиотека Pandas
  • Тема 1.6 Библиотеки Python для визуализации данных
  • Тема 1.7 Синтаксис языка программирования С++
  • Тема 2.1 Обработка данных с помощью (Hadoop/Hive/Spark)
  • Тема 2.2 Конвейер данных (Storm, Kafka)
  • Тема 2.3 Базовое представление о Map Reduce
  • Тема 2.4 Распределенная файловая система HDFS
  • Тема 2.5 Статистические методы анализа данных
  • Тема 2.6 Технологии анализа данных
  • Тема 2.7 Использование платформ данных
  • Тема 2.8 Инструменты с открытым исходным кодом для анализа больших данных
  • Тема 2.9 Что такое ETL: как справиться с анализом BigData
  • Тема 3.1 Введение в моделирование данных
  • Тема 3.2 Реляционные базы данных
  • Тема 3.3 Базы данных NoSQL
  • Тема 3.4 Массово параллельная обработка и анализ данных
  • Тема 3.5 Облачные хранилища данных (Data Warehouses
  • Тема 3.6 Data Lake (озеро данных)
  • Тема 4.1 Введение в машинное обучение и обработку данных. Программный инструментарий Data Mining и Machine Learning
  • Тема 4.2 Основной аппарат комбинаторики и мат. статистики. Регрессионный анализ и сжатие данных
  • Тема 4.3 Технологии кластеризации и классификации. Деревья решений. Нейронные сети. Генетические алгоритмы
  • Тема 4.4 Деревья решений
  • Тема 4.5 Методы оптимизации машинного обучения
  • Тема 4.6 GPU в задачах машинного обучения
  • Тема 4.7 Машинное обучение на больших данных. Онлайн обучение и линейные модели
  • Тема 4.8 Рекомендательные системы
  • Тема 4.9 Нейронные сети
Кто может обучаться на курсе

Граждане РФ – жители всех регионов России, если:

  • - старше 18 лет и не достигли пенсионного возраста
  • - имеют среднее профессиональное / высшее образование или являются студентами вуза / колледжа
  • - имеют достаточный уровень базовых знаний в сфере ИТ и могут справиться со вступительным испытанием
2 студента с ноутами