Saturday, June 14, 2014

Дайджест наиболее интересных материалов по анализу данных №1 (2 - 9 июня 2014)

Первый выпуск дайджеста наиболее интересных материалов по теме анализа данных. Данная подборка затрагивает такие темы как популярность NoSQL баз данных и языков программирования. Есть несколько интересных интервью с ведущими специалистами в области анализа данных. Затрагиваются некоторые практические аспекты работы с большими данными и машинным обучением. В данном обзоре достаточно много материалов, которые будут интересны новичкам в данной области.


  • Рейтинг популярности NoSQL и NewSQL баз данных - рейтинг использования NoSQL и NewSQL баз данных на 2014 год
  • Data Shinobi - Основы - первая часть серии статей по анализу больших объемов данных, в первой части закладываются основы дальнейших статей серии и описывается 5 основных фактов о науке о данных, которые автор выяснил в процессе своего роста как профессионала
  • Три интересных, но малоизвестных языка программирования - небольшое описание трех интересных, но не самых популярных языка программирования: Julia, Scala, Erlang. В целом конечно они не являются топовыми языками, но можно не согласиться с терминым "малоизвестные" по отношению к ним, по крайней мере если говорить про Scala и Erlang
  • Ян ЛеКун отвечает на вопросы пользователей Reddit - интересное интервью известного специалиста в области машинного на сайте Reddit (в формате AMA - "ask me anything"). Ян ЛеКун - известный исследователь в области информатики, в частности в таких областях как машинное обучение и компьютерное зрение
  • Как преодолеть проблему отсутствия практического опыта в области аналитики - полезная статья, описывающая проблемы отсутствия реального практического опыта в области анализа данных и как преодолеть данное препятствие из разряда проблемы курицы и яйца, то есть в как получить позицию в области анализа данных если нет практического опыта, но ведь практический опыт получается именно при работе на данной позиции
  • Простая Байесовская сеть через MCMC - статья о применении подхода MCMC (Monte Carlo Markov Chain) в простой Байесовской сети
  • Data Science и статистика - есть ли разница? - автор статьи рассуждает на интересную и популярную тему различия подходов к статистике и науке о данных (data science)
  • Серия статей о Hadoop:
  • Как стать специалистом по анализу данных - любопытная статья о том как сменить профессию на должность в сфере анализа данных. В статье делается акцент на карьерные перемены для тех у кого уже есть солидный опыт в других областях, но в целом данная статья хороша просто как список вещей, которые нужны тому кто решил заняться анализом данных на серьезном уровне
  • Интервью с Philippe Nieuwbourg - небольшое интервью с опытным специалистом по анализу данных, который в данном интервью рассказывает о том как начал заниматься аналитикой и затрагивает такие темы как business intelligence и data mining
  • 20 котортких статей для каждого - 20 небольших статей, которые будут любопытны каждому кто занимается анализом данных
  • Лженаука о данных - в данной статье Vincent Granville (один из создателей DataScienceCentral) рассуждает на тему того, что сейчас зачастую материалы, подаваемые как описание науки о данных (data science), на самом деле достаточно далеки от реальности и являются давно устаревшими подходами к анализу данных. Упоминает он и то что сейчас появилось достаточно много сертификатов в данной сфере, зачастую от известных учебных заведений, которые в общем-то тоже не соответствуют современным реалиям.
  • Три мифа об анализе данных - три основных мифа (по мнению автора статьи) об анализе данных и специалистах в данном вопросе
  • Проклятие больших данных (The curse of big data) - материал, рассказывающий о том какие необычные проблемы добавляются при анализе больших данных (по сравнению с меньшим объемов данных)
  • Что важно знать о машинном обучении - интересный и полезный документ (правда достаточно объемный по сравнению со стандартной статьей), о том что важно знать каждому кто работает в сфере машинного обучения (Machine Learning)

No comments:

Post a Comment