Завтра у меня первое занятие в Школе данных Билайн

Завтра у меня первое занятие в Школе данных Билайн - Введение в машинное обучение. Основные типы задач и методы их решения.


Получил песочницу для запуска скриптов на cloud.sagemath.com


Поставил себе сборку Python 3.5 (Anaconda3 для Windows), а также интерпретатор Jupyter в котором можно меняться документами, а также выполнять код Python. Поставил среду разработчика PyCharm EDU 2.0.3 компании JetBrains. 

Первое занятие будет проводить преподаватель ФКН НИУ ВШЭ Юрий Кашницкий.

План занятия:

  • Введение в машинное обучение, необходимые навыки
  • Задачи классификации, регрессии и кластеризации
  • Краткий обзор Kaggle
  • Открытие соревнования Kaggle Inclass
  • Знакомство с набором данных по автострахованию этого соревнования
  • Деревья решений
  • Применение дерева решений Scikit-learn к синтетическому набору данных и к данным из контеста Kaggle Inclass
  • Настройка параметров дерева, кросс-валидация
  • Пример извлечения признака для набора данных соревнования "Titanic: Machine Learning from Disaster"
  • Практика на применение дерева решений и случайного леса к набору данных Titanic


Программа курса.
  • 1 занятие. «Введение в машинное обучение. Основные типы задач и методы их решения»
  • 2 занятие. «Библиотеки и инструменты для анализа данных. Математика в машинном обучении»
  • 3 занятие. «Обучение с учителем. Задачи классификации и регрессии»
  • 4 занятие. «Оценка качества алгоритмов машинного обучения»
  • 5 занятие«Продвинутые методы классификации и регрессии. Переобучение». Теория
  • 6 занятие«Продвинутые методы классификации и регрессии. Переобучение». Практика
  • 7 занятие«Обучение без учителя»
  • занятие. «Анализ социальных сетей». Теория
  • 9 занятие. «Анализ социальных сетей». Практика
  • 10 занятие«Обнаружение знаний в данных»
  • 11 занятие. «Рекомендательные системы»
  • 12 занятие«Обработка текстов». Теория
  • 13 занятие. «Обработка текстов». Практика
  • 14 занятие. «Введение в анализ больших данных и масштабируемое машинное обучение». Теория
  • 15 занятие. «Введение в анализ больших данных и масштабируемое машинное обучение». Практика
  • 16 занятие. «Альтернатива Большим Данным. Large Scale Machine Learning. Обзор инструмента vowpal wabbit»
  • 17 занятие. «Соревнования по анализу данных». Теория
  • 18 занятие. «Соревнования по анализу данных». Практика 

Курс лекций по теме "Машинное обучение" можно найти, например, здесь. Еще домашние задания обещают. Но когда же их делать? В общем, сон на ближайший семестр наверное отменяется.

Комментариев нет:

Популярные сообщения

Желающие следить за новостями блога, могут подписаться на рассылку на follow.it (отписаться вы сможете в один клик). 

Еще можно подписаться на Telegram-каналы @abloud62 @abloudrealtime, где также дублируются анонсы практически всех новостей блога. 

 

Translate