Конспект лекций. — Екатеринбург: Уральский государственный университет путей сообщения, 2019. — 109 с.
Конспект лекций содержит обзорную информацию, теоретические сведения, описания необходимого инструментария и источников.
Предназначен для обучающихся по направлению подготовки «Информационные системы и технологии» всех форм обучения.
Обзор современного состояния анализа данных.Зачем нужны данные?
Что включает в себя интеллектуальный анализ данных?
Инструменты и методы.
Полезные ресурсы и инструменты.
Python.
Hapoop.
Kaggle.com.
Github.
Quorcera.
Академия данных Яндекса.
habr.Необходимые сведения из математики.Линейная алгебра.
Векторы.
Матрицы.Математический анализ.
Функция одной переменной.
Функция нескольких переменных.
Численные методы поиска экстремума функций многих переменных.Теория вероятностей.
Математическая статистика.
Задачи математической статистики.
Основные понятия статистики.
Статистические оценки параметров распределения.Основы программирования алгоритмов анализа данных.О языке программирования Python.
Введение в написание программ.
Типы данных.
Управляющие конструкции.
Оператор условия.
Циклы.
Строки.
Функции.
Структуры данных.Работа с файлами.
Служебные библиотеки Python.
math.
NumPy.
SciPy.
Matplotlib.
Pandas.
PyTables.
Tensorflow.Подготовка данных для анализа.Сбор данных.
Обработка данных.
Преобразование данных.
Предварительный анализ данных.
Задачи интеллектуального анализа данных.Регрессионный анализ.
Нейронные сети.
Деревья принятия решений.
A/B тестирование.
Кластеризация.
Рекомендательные системы.
Темы для самостоятельной работы студентов.10 вопросов Python.
10 вопросов matplotlib.
10 вопросов по NumPy.
10 вопросов по Pandas.
Литература.