Завтра у меня первое занятие в Школе данных Билайн - Введение в машинное обучение. Основные типы задач и методы их решения.
Получил песочницу для запуска скриптов на cloud.sagemath.com
Поставил себе сборку Python 3.5 (Anaconda3 для Windows), а также интерпретатор Jupyter в котором можно меняться документами, а также выполнять код Python. Поставил среду разработчика PyCharm EDU 2.0.3 компании JetBrains.
Первое занятие будет проводить преподаватель ФКН НИУ ВШЭ Юрий Кашницкий.
План занятия:
- Введение в машинное обучение, необходимые навыки
- Задачи классификации, регрессии и кластеризации
- Краткий обзор Kaggle
- Открытие соревнования Kaggle Inclass
- Знакомство с набором данных по автострахованию этого соревнования
- Деревья решений
- Применение дерева решений Scikit-learn к синтетическому набору данных и к данным из контеста Kaggle Inclass
- Настройка параметров дерева, кросс-валидация
- Пример извлечения признака для набора данных соревнования "Titanic: Machine Learning from Disaster"
- Практика на применение дерева решений и случайного леса к набору данных Titanic
Программа курса.
- 1 занятие. «Введение в машинное обучение. Основные типы задач и методы их решения»
- 2 занятие. «Библиотеки и инструменты для анализа данных. Математика в машинном обучении»
- 3 занятие. «Обучение с учителем. Задачи классификации и регрессии»
- 4 занятие. «Оценка качества алгоритмов машинного обучения»
- 5 занятие. «Продвинутые методы классификации и регрессии. Переобучение». Теория
- 6 занятие. «Продвинутые методы классификации и регрессии. Переобучение». Практика
- 7 занятие. «Обучение без учителя»
- 8 занятие. «Анализ социальных сетей». Теория
- 9 занятие. «Анализ социальных сетей». Практика
- 10 занятие. «Обнаружение знаний в данных»
- 11 занятие. «Рекомендательные системы»
- 12 занятие. «Обработка текстов». Теория
- 13 занятие. «Обработка текстов». Практика
- 14 занятие. «Введение в анализ больших данных и масштабируемое машинное обучение». Теория
- 15 занятие. «Введение в анализ больших данных и масштабируемое машинное обучение». Практика
- 16 занятие. «Альтернатива Большим Данным. Large Scale Machine Learning. Обзор инструмента vowpal wabbit»
- 17 занятие. «Соревнования по анализу данных». Теория
- 18 занятие. «Соревнования по анализу данных». Практика
Курс лекций по теме "Машинное обучение" можно найти, например, здесь. Еще домашние задания обещают. Но когда же их делать? В общем, сон на ближайший семестр наверное отменяется.
Комментариев нет:
Отправить комментарий