Sunday, September 28, 2014

Дайджест наиболее интересных материалов по анализу данных №17 (22 - 28 сентября 2014)

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Соревнования по машинному обучению

  • EN Python Опыт от участия в "Display Advertising Challenge"
    Интересная статья про опыт, полученный от участия в соревновании по машинному обучению "Display Advertising Challenge" на Kaggle, которое закончилось совсем недавно.
  • EN R Использование R, H2O и Domino на Kaggle
    Интересная статья про использование языка программирования R совместно с Domino и H2O в соревновании по машинному обучению под названием "Africa Soil Property Prediction Challenge" на Kaggle.

Онлайн-курсы и обучающие материалы

  • EN Онлайн-курс "Statistical Learning"
    В январе 2014 Стэнфордский университет провел онлайн-курс, основанный на новой книге "An Introduction to Statistical Learning with Applications in R" (ISLR). В данном посте будут представлены видеоматериалы и презентации с данного курса.
  • EN Онлайн-курс "The Caltech-JPL Summer School on Big Data Analytics"
    Достаточно необычный онлайн-курс стартовал в середине сентября на Coursera. По сути, это набор видеолекций и материалов с летней школы машинного обучения от California Institute of Technology.
  • EN Онлайн-курс "Learning From Data"
    На днях на edX стартовала новая сессия данного очень популярного курса по машинному обучению от California Institute of Technology и профессора Yaser Abu-Mostafa в качестве основного инструктора.

Литература

  • EN Обзор книги "Frequent Pattern Mining"
    Обзор книги "Frequent Pattern Mining", вышедшей в 2014 году, от портала KDnuggets.
  • EN Книга "R for Cloud Computing"
    Анонс очень любопытной книги по облачным вычислениям с использованием языка программирования R, которая достаточно скоро появится в продаже.

Теория и алгоритмы машинного обучения, примеры кода

  • EN Что такое Feature Engineering
    Отличная статья от автора блога MachineLearningMastery о процессе Feature Engineering в машинном обучении.
  • EN Динамическое обучение и Sub-Linear Debugging
    Очередная статья с блога Microsoft Technet Machine Learning. На этот раз в статье будет затронута тема динамического обучения (Online Learning) и Sub-Linear Debugging.
  • EN Теория Введение в метод опорных векторов
    Очень простое и краткое введение в метод опорных веторов (Support Vector Machines).
  • EN Для новичков Python Обработка данных с помощью Python
    Данная статья с блога Analytics Vidhya расскажет об обработке данных с помощью языка программирования Python и библиотеки Pandas.
  • EN R Сравнение и выбор обучающих моделей с помощью R Caret
    Очередная статья от автора блога MachineLearningMastery, посвященная возможностям библиотеки машинного обучения Caret для языка программирования R. В данном случае речь пойдет о сравнении обучающих моделей и выборе наиболее эффективной.
  • EN R Как опубликовать графики ggplot2
    Полезная статья, рассказывающая о том, как опубликовать графики, сделанные с помощью библиотеки ggplot2 для языка программирования R, в виде веб-страницы.
  • EN R Работа с Twitter через REST API и R
    Неплохая статья, описывающая возможность работы с данными Twitter через REST API с помощью библиотеки RTwitterAPI для языка программирования R.
  • EN R Выбор параметров с помощью R Caret
    Автор блога MachineLearningMastery рассказывает о функциональности по выбору признаков (Feature Selection) в популярной библиотеке по машинному обучению Caret для языка программирования R.
  • EN R Факторы не являются объектами первого класса в R
    Достаточно большая статья, описывающая тонкости и возможные проблемы в работе с факторами в языке программирования R.
  • EN R Управление зависимостями в R
    Интересная статья про управления зависимостями между библиотеками в языке программирования R, а также о визуализации этих данных о зависимостях между библиотеками.

Видеоматериалы

Data engineering

Обзоры

Предыдущий выпуск: Дайджест наиболее интересных материалов по анализу данных №16 (15 - 21 сентября 2014)

No comments:

Post a Comment