Разное

Big data книги: ТОП-10 книг о Big Data на русском языке – Библиотека программиста

Содержание

ТОП-10 книг о Big Data на русском языке – Библиотека программиста


Просмотров 1.3k.
Обновлено

Что почитать про анализ больших данных? Собрали подборку лучших книг по Big Data на русском языке, которые стоит изучить.

Революция в аналитике. Билл Фрэнкс

Внедрив технологию big data для обработки данных многие компании и IT-корпорации сделали мощный рывок в бизнесе. Автор книги имеет 20-летний опыт работы с аналитическими проектами в реальном масштабном бизнесе и делится опытом внедрения.

Достоинства:

  • все темы рассматриваются со стратегической точки зрения;
  • практическое руководство по операционной аналитике;
  • охвачено широкий круг вопросов;
  • имеются советы для создания успешного сотрудничества между IT-отделом и аналитическим отделом.

Недостатки:

  • много воды;
  • сплошной текст, книга не имеет никаких схем и картинок.

~120 000 ₽ – средняя зарплата аналитика Big Data в Московском регионе (по данным hh.ru)

Убийственные большие данные. Кэти О’Нил

Математические алгоритмы давно превратились в мощное оружие для корпораций и государства. При помощи математических приложений страховые компании, банки и другие компании способны отслеживать каждый шаг человека.

Достоинства:

  • множество практических примеров;
  • взгляд на биг дата с моральной точки зрения и вред для обычных людей;
  • книга будет интересна и понятна гуманитариям.

Недостатки:

  • нет технической информации, просто интересное чтиво для расширения кругозора.

Теоретический минимум по Big Data. Анналин Ын, Кеннет Су

Анализ больших данных – это большой бизнес. Книга обучает основам стремительно развивающейся технологии аналитики и обработки больших данных. В каждой главе рассматривается отдельный алгоритм. Есть примеры их использования на реальных задачах.

Достоинства:

  • наглядные иллюстрации;
  • комментарии, которые позволяют лучше понять тему;
  • хорошо описан теоретический минимум.

Недостатки:

  • слишком поверхностно, без углубления в тему;
  • тем, кто не сталкивался с Большими Данными, будет тяжело воспринимать информацию.

BIG DATA. Вся технология в одной книге. Андреас Вайгенд

Автор убежден, что система Больших Данных несет в себе не только большие риски, но и колоссальные возможности, как для корпораций, так и для обычных людей. Основной вопрос рассмотренный в книге: как при помощи Big Data компании собирают информацию о пользователе, следят за их поведением и определяют его круг интересов.

Достоинства:

  • интересно и полезно для новичков;
  • примеры реальных компаний.

Недостатки:

  • слишком размыто описывается материал;
  • нет технических данных, кодов и алгоритмов.

Основы Data Science и Big Data. Дэви Силен, Арно Мейсман, Мохамед Али

В каждой главе отдельно описывается один из аспектов анализа и обработки данных системы Data Science. Изучение начинается с основ, далее переходит к освоению алгоритмов, работы с большими массивами данных, анализа и визуализации информации.

Достоинства:

  • книга хорошая для изучения основ;
  • описаны возможности языка Python для работы с данными.

Недостатки:

  • примеры поверхностные, многое остается непонятным;
  • опечатки в тексте;
  • встречаются не соответствия между заголовком раздела и его содержанием;
  • мало практики.

Большие данные. Виктор Майер-Шенбергер, Кеннет Кукьер

В книге рассказывается о стремительном развитии вычислительных методов для новых открытий и прогнозов. Описываются основы big data, и влияние на жизнь обычного человека. Даются рекомендации, как можно обезопасить себя от опасности утери конфиденциальности.

Достоинства:

  • даются общие понятные сведения о Big Data;
  • практические советы по защите конфиденциальности;

Недостатки:

  • информация размазана;
  • примеры повторяются;
  • явно видно поклонение авторами системе Больших Данных, не видит ее явных недостатков.

Укрощение больших данных. Билл Фрэнкс

Автор является ведущим аналитиком компании TeraData. Подробная информация об элементах системы Больших данных: трендах, методах, тенденциях развития, технологиях, и как это все повлияет на развитие бизнеса и жизнь человека.

Достоинство:

  • подходит для первого знакомства с возможностями аналитики;
  • хорошее введение в тему;
  • легко читается;

Недостатки:

  • методы анализа описаны общими фразами;
  • имеющиеся технические детали не достаточно расписаны для того, чтобы брать и делать.

Big data простым языком. Алексей Благирев, Наталья Хапаева

Автор книги пытается донести принципы программирования и создания интерфейсов для управления бизнесом и жизнью человека. Девайсы на телефоне делают его уже не просто средством для связи. При развитии этой системы телефоны могут оказаться намного умнее своего обладателя, не говоря уже о других устройствах, которые постепенно собирают всю информацию жизнедеятельности человека.

Достоинства:

  • материал книги систематизирован и структурирован;
  • чувствуется опыт автора;
  • затрагиваются не только Big Data, но и приближенные темы.
  • интересные выводы.

Spark для профессионалов. Сэнди Риза, Ури Лезерсон, Шон Оуэн, Джош Уиллс

Авторы рассматривают Spark комплексно и описывают паттерны, которые позволяют выполнить крупномасштабный анализ данных. В книге раскрываются вопросы выявления мошенничества с кредитными картами, рекомендации множества товаров множеству людей, создание моделей оценки финансовых рисков на основе имитации ценных бумаг. Все эти возможности недоступны, если не научится правильно обрабатывать информацию. Именно для этого создана наука о данных.

Достоинства:

  • в книге описываются сложные методы анализа на простых примерах из жизни;
  • краткий справочник, который ответит на многие вопросы обработки массива данных.

Недостатки:

  • не хватает более широкого описания темы;
  • мягкая обложка.

Работа с BigData в облаках. Александр Сенько

Первое издание на русском языке, в котором описывается технология big data простым языком. В нем рассматриваются многие секреты обработки больших данных в облаках на легких примерах. В книге описаны все этапы процесса: от получения исходных данных до сложного анализа. Автор приводит преимущества информационного облака над другими технологиями.

Достоинства:

  • наличие множества иллюстраций для примеров;
  • подробно описываются все этапы работы MS Azure и AWS;
  • хорошо раскрывается работа в облаке и приводится анализ больших данных.

Недостатки:

  • мягкая обложка.

Выводы

  1. Лучшая книга для того, чтобы освоить основы big data: «BIG DATA. Вся технология в одной книге» Андреас Вайгенд, «Укрощение больших данных» Билл Фрэнкс и «Большие данные» Виктор Майер-Шенбергер, Кеннет Кукьер.
  2. Для тех, кто уже знаком с технологией Big Data, чтобы увеличить свой опыт в этой теме рекомендуется прочитать книгу «Spark для профессионалов» Сэнди Риза, Ури Лезерсон, Шон Оуэн, Джош Уиллс.
  3. Для общей информации и ознакомления с темой можно прочитать книги: «Big data простым языком» Алексей Благирев, Наталья Хапаева, «Работа с BigData в облаках» Александр Сенько и «Теоретический минимум по Big Data» Анналин Ын, Кеннет Су.

Делитесь мнениями и хорошими книгами по технологии Big Data не попавшими в эту подборку в комментариях!

Книга «Теоретический минимум по Big Data. Всё что нужно знать о больших данных»

Cегодня Big Data — это большой бизнес. Нашей жизнью управляет информация, и извлечение выгоды из нее становится центральным моментом в работе современных организаций. Неважно, кто вы — деловой человек, работающий с аналитикой, начинающий программист или разработчик, «Теоретический минимум по Big Data» позволит не утонуть в бушующем океане современных технологий и разобраться в основах новой и стремительно развивающейся отрасли обработки больших данных.

Хотите узнать о больших данных и механизмах работы с ними? Каждому алгоритму посвящена отдельная глава, в которой не только объясняются основные принципы работы, но и даются примеры использования в реальных задачах. Большое количество иллюстраций и простые комментарии позволят легко разобраться в самых сложных аспектах Big Data.

Предлагаем ознакомиться с отрывком «Главные компоненты»

Метод главных компонент (Principal Component Analysis, МГК) — это способ нахождения основополагающих переменных (известных как главные компоненты), которые дифференцируют ваши элементы данных оптимальным образом. Эти главные компоненты дают наибольший разброс данных (рис. 2).

Главная компонента может выражать одну или несколько переменных. Например, мы можем воспользоваться единственной переменной «Витамин C». Поскольку витамин C есть в овощах, но отсутствует в мясе, итоговый график (левая колонка на рис. 3) распределит овощи, но все мясо окажется в одной куче.

Для распределения мясных продуктов мы можем использовать в качестве второй переменной жир, поскольку он присутствует в мясе, но его почти нет в овощах. Тем не менее, поскольку жир и витамин C измеряются в разных единицах, то прежде чем их скомбинировать, мы должны стандартизировать их.

Стандартизация — это выражение каждой переменной в процентилях, которые преобразуют эти переменные в единую шкалу, позволяя нам комбинировать их для вычисления новой переменной:

витамин C – жир

Поскольку витамин C уже распределил овощи вверх, то жир мы вычитаем, чтобы распределить мясо вниз. Комбинирование этих двух переменных поможет нам распределить как овощи, так и мясные продукты (столбец посередине на рис. 3).

Мы можем улучшить разброс, приняв во внимание пищевые волокна, содержание которых в овощах различается:

(Витамин C + пищевые волокна) – жир.

Эта новая переменная дает нам оптимальный разброс данных (правый столбец на рис. 3).

В то время как мы получили главные компоненты в этом примере методом проб и ошибок, МГК может делать это на системной основе. Мы увидим, как это работает, на следующем примере.

Пример: анализ пищевых групп

Используя данные Министерства сельского хозяйства США, мы проанализировали питательные свойства случайного набора продуктов, рассмотрев четыре пищевых переменных: жиры, белки, пищевые волокна и витамин C. Как видно на рис. 4, определенные питательные вещества часто встречаются в продуктах вместе.

В частности, уровни содержания жиров и белков возрастают в одном направлении, противоположном тому, в котором растут уровни пищевых волокон и витамина C. Мы можем подтвердить наши предположения, проверив, какие переменные коррелируют (см. раздел 6.5). И действительно, мы находим значимую положительную корреляцию как между уровнями белков и жиров (r = 0,56), так и между уровнями пищевых волокон и витамина C (r = 0,57).

Таким образом, вместо анализа четырех пищевых переменных по отдельности мы можем скомбинировать высококоррелирующие из них, получив для рассмотрения всего две. Поэтому метод главных компонент относят к техникам уменьшения размерности.

Применив его к нашему пищевому набору данных, мы получим главные компоненты, изображенные на рис. 5.

Каждая главная компонента — это комбинация пищевых переменных, значение которой может быть положительным, отрицательным или близким к нулю. Например, чтобы получить компоненту 1 для отдельного продукта, мы можем вычислить следующее:

.55(пищевые волокна) + .44(Витамин C) – .45(жир) –

.55(белок)

То есть вместо комбинирования переменных методом проб и ошибок, как мы делали раньше, метод главных компонент сам вычисляет точные формулы, при помощи которых можно дифференцировать наши позиции.

Обратите внимание, что основная для нас главная компонента 1 (PC1) сразу объединяет жиры с белками, а пищевые волокна с витамином C, и эти пары обратно пропорциональны.

В то время как PC1 дифференцирует мясо от овощей, компонента 2 (PC2) подробнее идентифицирует внутренние подкатегории мяса (исходя из жирности) и овощей (по содержанию витамина C). Лучший разброс данных мы получим, используя для графика обе компоненты (рис. 6).

У мясных товаров низкие значения компоненты 1, поэтому они сосредоточены в левой части графика, в противоположной стороне от овощных. Видно также, что среди не овощных товаров низкое содержание жиров у морепродуктов, поэтому значение компоненты 2 для них меньше, и сами они тяготеют к нижней части графика. Схожим образом у тех овощей, которые не являются зеленью, низкие значения компоненты 2, что видно в нижней части графика справа.

Выбор количества компонент. В этом примере созданы четыре главных компоненты по числу изначальных переменных в наборе данных. Поскольку главные компоненты создаются на основе обычных переменных, информация для распределения элементов данных ограничивается их первоначальным набором.

Вместе с тем для сохранения простоты и масштабируемости результатов нам следует выбирать для анализа и визуализации только несколько первых главных компонент. Главные компоненты отличаются по эффективности распределения элементов данных, и первый из них делает это в максимальной степени. Число главных компонент для рассмотрения определяют с помощью графика осыпи, который мы рассмотрели в предыдущей главе.

График показывает снижающуюся эффективность последующих главных компонент в дифференцировании элементов данных. Как правило, используется такое количество главных компонент, которое соответствует положению острого излома на графике осыпи.

На рис. 7 излом расположен на отметке в две компоненты. Это означает, что хотя три и более главных компонент могли бы лучше дифференцировать элементы данных, эта дополнительная информация может не оправдать сложности итогового решения. Как видно из графика осыпи, две первые главные компоненты уже дают 70 %-ный разброс. Использование небольшого числа главных компонент для анализа данных дает гарантию того, что схема подойдет и для будущей информации.

Ограничения

Метод главных компонент — это полезный способ анализа наборов данных с несколькими переменными. Однако у него есть и недостатки.

Максимизация распределения. МГК исходит из важного допущения того, что наиболее полезны те измерения, которые дают наибольший разброс. Однако это не всегда так. Известным контрпримером является задача с подсчетом блинчиков в стопке.

Чтобы сосчитать блинчики, мы отделяем один от другого по вертикальной оси (то есть по высоте стопки). Однако если стопка невелика, МГК ошибочно решит, что лучшей главной компонентой будет горизонтальная ось (диаметр блинчиков), из-за того что в этом измерении можно найти больший разброс значений.

Интерпретация компонент. Главная трудность с МГК состоит в том, что необходима интерпретация сгенерированных компонент, и иногда нужно очень постараться, чтобы объяснить, почему переменные должны быть скомбинированы именно выбранным способом.

Тем не менее нас могут выручить предварительные общие сведения. В нашем примере с продуктами скомбинировать пищевые переменные для главных компонент нам помогают именно предварительные знания об их категориях.

» Более подробно с книгой можно ознакомиться на сайте издательства

» Оглавление

» Отрывок

Для Хаброжителей скидка 20% по купону — BigData

10 Data Science книг к прочтению в 2020 году

1. Дж. Грас – Data Science. Наука о данных с нуля

Автор изложил материал по Data Science в необходимом размере для скорейшего старта в
профессии. Знания аналитики и дисциплины не потребуются. В процессе чтения
вы будете изучать Python, алгебру, математический анализ и статистику,
а также теорию вероятностей, машинное обучение и прочие темы. Дополнительный
акцент сделан на методы анализа социальных сетей, основы баз данных и SQL.

Data Science. Наука о
данных с нуля

Книга в телеграм-канале @progbook

2. П. Брюс, Э. Брюс – Практическая статистика для специалистов
Data Science

Для работы с изданием вам понадобятся знания математической
статистики и языка R, а также базовые знания по общей теме.
Легкодоступная форма подачи материала поможет быстро разобраться с такими
темами, как: разведочный анализ данных, статистические эксперименты,
проверка значимости, регрессия, классификация, машинное обучение и обучение без
учителя.

Практическая
статистика для специалистов Data Science

Книга в телеграм-канале @progbook

3. О’Нил, Шатт – Data Science. Инсайдерская информация для новичков

Книга основана на курсе Колумбийского университета по анализу данных. В процессе
обучения вы узнаете о байесовском методе, визуализации данных, статистических
алгоритмах, рекомендательных движках, MapReduce и финансовом моделировании.

Data Science. Инсайдерская информация для
новичков

4. Ын, Су – Теоретический минимум по Big Data. Всё что нужно
знать о больших данных

Издание не ориентировано
только на профессионалов, заняться образованием могут начать аналитики,
бизнесмены, программисты и непрофильные специалисты. На страницах этого труда рассматривается масса алгоритмов, каждому
из которых посвящена отдельная глава, с картинками и примерами из реальных
задач.

Теоретический минимум
по Big Data. Всё что нужно знать о больших данных

5. Силен, Мейсман, Али – Основы
Data Science и
Big Data. Python и наука о данных

Изучение DS вы начнете с базовых вещей, а потом приступите к алгоритмам
машинного обучения, массивам данных, NoSQL и т. д. В качестве языка программирования
в этой книге используется Python со специальными
библиотеками.

Основы Data Science и Big Data. Python и наука о данных

Книга в телеграм-канале @progbook

6. Дж. Вандер Плас –
Python для сложных задач. Наука о данных и машинное обучение

Данное руководство погрузит вас в самые популярные
статистические методы обработки данных и научные исследования. В процессе прочтения
вы сможете разобраться с тем, как считывать различные форматы данных, как их преобразовывать
и визуализировать, а также строить статистические модели и применять машинное
обучение.

Python для сложных задач. Наука о данных
и машинное обучение

Книга в телеграм-канале @progbook

7. R. Shams – Java
Data Science Cookbook

Если вам необходимо
построить научные модели для производства – Java ваше все. С помощью крутых библиотек, таких как MLlib, Weka и DL4j, вы сможете
эффективно выполнить все необходимые задачи по обработке данных. Книга начинается с
рецептов для получения, индексирования и поиска данных. Затем вы перейдете к
различным методам анализа и извлечения информации. Последним учебным этапом
будет обработка Big Data, глубокое обучение и визуализация.

Java
Data Science Cookbook

8. A. Boschetti – Python Data Science Essentials

Здесь вы найдете
подробные примеры, которые помогут понять основные
статистические методы сбора и анализа данных. Вы получите представление о
передовых темах, таких как алгоритмы машинного обучения, распределенные
вычисления, настройка моделей прогноза и обработка естественного языка. А еще вы познакомитесь с инструментами глубокого обучения, такими как XGBoost,
LightGBM и CatBoost.

Python Data Science Essentials

9. D. Toomey – Jupyter for Data Science

Если вы знакомы с Jupyter Notebook и хотите узнать, как использовать его возможности
для выполнения различных задач в Data
Science, эта книга для вас. Данное издание разъяснит каждый
шаг внедрения эффективного конвейера обработки данных с использованием Jupyter от
исследования данных до визуализации. Вы научитесь использовать функции Jupyter, чтобы делиться своими идеями и кодом с
коллегами. В книге также описано, как Python 3, R и Julia могут быть
интегрированы в Jupyter для различных задач
обработки данных.

Jupyter for Data Science

10. P. Prevos – Principles of Strategic Data Science

Книга начинается с
объяснения того, что такое наука о данных и как организации могут ее использовать для оптимизации всех рабочих процессов. Затем автор приводит критерии
надежности информационных продуктов и способы визуализации информации. В
процессе изучения пятиэтапной структуры вы будете открывать для себя
стратегические аспекты DS, которые
позволяют повысить ценность извлекаемых данных. В заключительной главе
рассматривается роль штатного аналитика данных в процессе интеграции DS-подхода в бизнес-процессы организации.

Principles of Strategic Data Science

***

Не рассказали о какой-то интересной книге по теме Data Science? Пишите в комментариях.

Книга «Основы Data Science и Big Data. Python и наука о данных»

Data Science — это совокупность понятий и методов, позволяющих придать смысл и понятный вид огромным объемам данных.

Каждая из глав этой книги посвящена одному из самых интересных аспектов анализа и обработки данных. Вы начнете с теоретических основ, затем перейдете к алгоритмам машинного обучения, работе с огромными массивами данных, NoSQL, потоковым данным, глубокому анализу текстов и визуализации информации. В многочисленных практических примерах использованы сценарии Python.

Обработка и анализ данных — одна из самых горячих областей IT, где постоянно требуются разработчики, которым по плечу проекты любого уровня, от социальных сетей до обучаемых систем. Надеемся, книга станет отправной точкой для вашего путешествия в увлекательный мир Data Science.

Анализировать данные умеют все люди. Способность нашего мозга видеть взаимосвязи, приходить к выводам на основании фактов и учиться на опыте — вот что делает человека человеком. Выживание человека в большей степени, чем любого другого биологического вида на планете, зависит от мозга; человечество сделало максимальную ставку на эту особенность, чтобы занять свое место в природе. Пока эта стратегия работает, и вряд ли мы захотим ее поменять в ближайшем будущем.

Однако в том, что касается тривиальной обработки чисел, возможности нашего мозга ограниченны. Он не справляется с объемом данных, который мы в состоянии воспринять за один раз, и с нашей любознательностью. По этой причине мы доверяем машинам часть своей работы: выявление закономерностей, формирование связей и получение ответов на многочисленные вопросы.

Стремление к знаниям заложено в наших генах. Применение компьютеров для выполнения части работы в наши гены не заложено, но без них не обойтись.

Структура книги

В главах 1 и 2 приводятся общие теоретические основы, необходимые для понимания других глав книги:

— Глава 1 знакомит читателя с data science и большими данными. Она завершается практическим примером Hadoop.

— Глава 2 посвящена процессу data science. В ней описаны шаги, присутствующие почти в каждом проекте data science.

В главах 3–5 описано применение принципов машинного обучения к наборам данных постепенно увеличивающихся размеров:

— В главе 3 рассматриваются относительно небольшие данные, легко помещающиеся в памяти среднего компьютера.

— В главе 4 задача усложняется: в ней рассматриваются «большие данные», которые могут храниться на вашем компьютере, но не помещаются в памяти, вследствие чего обработка таких данных без вычислительного кластера создает проблемы.

— В главе 5 мы наконец-то добираемся до настоящих больших данных, с которыми невозможно работать без многих компьютеров.

В главах 6–9 рассматриваются некоторые интересные вопросы data science, более или менее независимые друг от друга:

— В главе 6 рассматривается архитектура NoSQL и ее отличие от реляционных баз данных.

— В главе 7 data science применяется к потоковым данным. Здесь основная проблема связана не с размером, а со скоростью генерирования данных и потерей актуальности старых данных.

— Глава 8 посвящена глубокому анализу текста. Не все данные существуют в числовой форме. Глубокий анализ и аналитика текста начинают играть важную роль в текстовых форматах: электронной почте, блогах, контенте веб-сайтов и т. д.

— В главе 9 основное внимание уделяется последней части процесса data science (визуализации данных и построению прототипа приложения), для чего мы рассмотрим ряд полезных инструментов HTML5.

В приложениях А–Г рассматриваются процедуры установки и настройки систем Elasticsearch, Neo4j и MySQL, упоминаемых в главах книги, а также Anaconda — программного пакета Python, чрезвычайно полезного в data science.

Для кого написана эта книга

Эта книга знакомит читателя с областью data science. Опытные специалисты data science поймут, что по некоторым темам материал изложен в лучшем случае поверхностно. Другим читателям сообщим, что для извлечения максимальной пользы из книги потребуются некоторые предварительные условия: чтобы браться за практические примеры, желательно обладать хотя бы минимальными познаниями в SQL, Python, HTML5 и статистике или машинном обучении.

Об авторах

Дэви Силен — опытный предприниматель, автор книг и профессор. Вместе с Арно и Мо он является совладельцем Optimately и Maiton — двух компаний data science, базирующихся в Бельгии и Великобритании соответственно, а также одним из совладельцев еще одной компании data science в Сомалиленде. Все эти компании специализируются на стратегической обработке «больших данных»; многие крупные компании время от времени обращаются к ним за консультациями. Дэви является внештатным преподавателем школы менеджмента IESEG в Лилле (Франция), где он преподает и участвует в исследованиях в области теории «больших данных».
Мохамед Али — предприниматель и консультант в области data science. Вместе с Арно и Мо он является совладельцем Optimately и Maiton — двух компаний data science, базирующихся в Бельгии и Великобритании соответственно. Его увлечения лежат в двух областях: data science и экологически рациональные проекты. Последнее направление воплотилось в создании третьей компании, базирующейся в Сомалиленде.
Арно Мейсман — целеустремленный предприниматель и специалист data science. Вместе с Дэви и Мо он является совладельцем Optimately и Maiton — двух компаний data science, базирующихся в Бельгии и Великобритании соответственно, а также одним из совладельцев еще одной компании data science в Сомалиленде. Все эти компании специализируются на стратегической обработке «больших данных»; многие крупные компании время от времени обращаются к ним за консультациями. Арно — специалист data science с широким кругом интересов, от розничной торговли до игровой аналитики. Он полагает, что информация, полученная в результате обработки данных, в сочетании с некоторым воображением, поможет нам улучшить этот мир.

» Более подробно с книгой можно ознакомиться на сайте издательства

» Оглавление

» Отрывок

Для Хаброжителей скидка 25% по купону — Data Science

Литература по data science | Data Science

Предпосылки к изучению data science начались с курсов статистики и эконометрики. Предлагаю вашему вниманию книги по data science, с которыми я в той или иной степени ознакомился и которые помогают понять как исследовать данные, для чего это нужно и как это использовать в бизнесе (содержания многих книг пересекаются, но интересны, по-своему, своими примерами и манерой изложения). Для удобства список разбит на несколько разделов (по направлению), но в главном разделе источники могут пересекаться (проранжированно в произвольном порядке). Некоторые книги изданы на русском и английском. Все книги доступны на Амазоне (англ.), на Озоне и в Лабиринте (русск.). И да, стоят они недёшево (хотя некоторые из них доступны бесплатно, смотрите снизу источники из LeanPub). Самые интересные я себе покупал, но большинство из них брал в библиотеке университетов, в которых учился или с которыми сотрудничаю.

I. Литература по data science (наука о данных)

1. Data Science for Business. Foster Provost, Tom Fawcett.
2. Doing Data Science. Rachel Schutt, Cathy O’Neil.
3. Agile Data Science. Russell Jurney.
4. Applied Data Science. Ian Langmore, Daniel Krasner.
5. О чем говорят цифры. Как понимать и использовать данные. Томас Дэвенпорт, Ким Хо.
Keeping Up With The Quants: Your Guide to Understanding and Using Analytics. Thomas H. Davenport, Jinho Kim.
6. Аналитика как конкурентное преимущество. Том Дэвенпорт и Джон Харрис.
7. Sexy Little Numbers: How to Grow Your Business Using the Data You Already Have. Maex Dimitri, Paul B. Brown.
Ключевые цифры: Как заработать больше, используя данные, которые у вас уже есть. Димитри Маекс, Пол Браун
8. Data Smart: Using Data Science to Transform Information into Insight. John W. Foreman.
Много цифр: Анализ больших данных при помощи Excel. Джон Форман.
9. Data Analysis with Open Source Tools. Philipp K. Janert.
10. Data Scientists at Work. Sebastian Gutierrez.
11. Data Science For Dummies. Lillian Pierson.
12. Data Science at the Command Line. Jeroen Janssens.
13. Data Science from Scratch. Joel Grus.
14. Learning to Love Data Science: Explorations of Emerging Technologies and Platforms for Predictive Analytics, Machine Learning, Digital Manufacturing, and Supply Chain Optimization. Mike Barlow.
15. Data Science in R: A Case Studies Approach to Computational Reasoning and Problem Solving. Deborah Nolan, Duncan Temple Lang.
16. Parallel Computing for Data Science with Examples in R, C++ and CUDA. Norman Matloff.
17. Practical Data Science with R. Nina Zumel, John Mount.
18. Introducing Data Science: Big Data, Machine Learning, and more, using Python Tools. Davy Cielen, Arno D.B. Meysman, Mohamed Ali.
19. Practical Data Science Cookbook: 89 hands-on recipes to help you complete real-world data science projects in R and Python. Tony Ojeda, Sean Patrick Murphy, Benjamin Bengfort, Abhijit Dasgupta.
20. Data Analytics: Models and Algorithms for Intelligent Data Analysis. Thomas A. Runkler.
21. Clean Data: Save time by discovering effortless strategies for cleaning, organizing, and manipulating your data. Megan Squire.

II. Книги по Big Data (большие данные)

1. Big data at work: dispelling the myths, uncovering the opportunities. Thomas H. Davenport.
2. Real-Time Big Data Analytics: Emerging Architecture. Mike Barlow.
3. Big Data Analytics with Spark. Mohammed Guller.
4. Big Data Glossary. Pete Warden.
5. Big Data For Dummies. Judith Hurwitz, Alan Nugent, Dr. Fern Halper, and Marcia Kaufman.
6. Big Data: A Revolution That Will Transform How We Live, Work, and Think. Viktor Mayer-Schönberger, Kenneth Cukier.
Большие данные: Революция, которая изменит то, как мы живем, работаем и мыслим. Виктор Майер-Шенбергер и Кеннет Кукьер.
7. Taming the Big Data Tidal Wave: Finding Opportunities in Huge Data Streams with Advanced Analytics. Bill Franks.
Укрощение больших данных: Как извлекать знания из массивов информации с помощью глубокой аналитики. Билл Фрэнкс.
8. Big Data Analytics: From Strategic Planning to Enterprise Integration with Tools, Techniques, NoSQL, and Graph. David Loshin.
9. The Analytics Revolution: How to Improve Your Business By Making Analytics Operational In The Big Data Era. Bill Franks.
Революция в аналитике: Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики. Билл Френкс.
10. Getting a Big Data Job For Dummies. Jason Williamson.
11. Hadoop For Dummies. Robert D. Schneider.
12. Hadoop: The Definitive Guide. Tom White.
Hadoop: Подробное руководство. Том Уайт.
13. Learning Spark: Lightning-Fast Big Data Analysis. Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia.
Изучаем Spark: молниеносный анализ данных. Карау Х., Конвински Э., Венде П., Захария М.
14. Advanced Analytics with Spark. Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills.
15. Big data: using smart big data, analytics and metrics to make better decisions and improve performance. Bernard Marr.
16. Big Data: Principles and Best Practices of Scalable Real-time Data Systems. Nathan Marz, James Warren.
17. Новые методы работы с большими данными: победные стратегии управления в бизнес- аналитике: Научно-практический сборник. Под редакцией доктора технических наук, профессора А. В. Шмида. — М.: ПАЛЬМИР, 2016.

III. Книги по Data Mining (дата майнинг, интеллектуальный анализ данных)

1. Data mining: practical machine learning tools and techniques. Ian H. Witten, Eibe Frank, Mark A. Hall.
2. A Practical Guide to Data Mining for Business and Industry. Andrea Ahlemeyer-Stubbe, Shirley Coleman.
3. Learning Data Mining with R: Develop key skills and techniques with R to create and customize data mining algorithms. Bater Makhabel.
4. Data Mining Algorithms: Explained Using R. Paweł Cichosz.
5. Data Mining and Business Analytics with R. Johannes Ledolter.
6. Data Mining For Dummies. Meta. S. Brown.
7. Data mining for business intelligence: concepts, techniques, and applications in Microsoft Office Excel with XLMiner. Galit Shmueli, Nitin R. Patel, Peter C. Bruce.
8. Data mining: concepts and techniques. Jiawei Han, Micheline Kamber, Jian Pei.
9. Programming Collective Intelligence. Toby Segaran.
Программируем коллективный разум. Тоби Сегаран.
10. Data mining with R: learning with case studies. Luis Torgo.
11. Mining the Social Web. Matthew A. Russell.
12. Commercial data mining: processing, analysis and modeling for predictive analytics projects. David Nettleton.
13. R and Data Mining: Examples and Case Studies. Yanchang Zhao.
14. Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery. Graham Williams.
15. Data Mining. Чубукова И.А.
16. Бизнес-аналитика: от данных к знаниям. Паклин Н.Б., Орешков В.И.
17. Mastering Social Media Mining with R: Extract valuable data from social media sites and make better business decisions using R. Sharan Kumar Ravindran, Vikram Garg.
18. Social Media Mining with R: Deploy cutting-edge sentiment analysis techniques to real-world social media data using R. Nathan Danneman, Richard Heimann.
19. Mining of Massive Datasets. Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman.

IV. Книги по Machine Learning (машинное обучение)

1. Machine Learning: the Art and Science of Algorithms that Make Sense of Data. Peter Flach.
Машинное обучение: наука и искусство построения алгоритмов, которые извлекают знания из данных. Петер Флах.
2. Building Machine Learning Systems with Python. Luis Pedro Coelho, Willi Richert.
Построение систем машинного обучения на языке Python. Луис Педро Коэльо, Вилли Ричарт.
3. Machine Learning with Spark: Create scalable machine learning applications to power a modern data-driven business using Spark. Nick Pentreath.

V. Книги по R

1. Getting Started with RStudio. John Verzani.
2. Learning Predictive Analytics with R: Get to grips with key data visualization and predictive analytic skills using R. Eric Mayor.
3. Mastering Data Analysis with R: Gain clear insights into your data and solve real-world data science problems with R – from data munging to modeling and visualization. Gergely Daróczi.
4. Parallel R. Q. Ethan McCallum and Stephen Weston.
5. R in Action: Data analysis and graphics with R. Robert I. Kabacoff.

VI. Книги по Python

1. Python for Data Analysis. Wes McKinney.
Python и анализ данных. Уэс Маккинли.
2. Python Data Analysis: Learn how to apply powerful data analysis techniques with popular open source Python modules. Ivan Idris.
3. Python Machine Learning: Unlock deeper insights into machine learning with this vital guide to cutting-edge predictive analytics. Sebastian Raschka.
4. Python in Practice: Create Better Programs Using Concurrency, Libraries, and Patterns. Mark Summerfield.
Python на практике: создание качественных программ с использованием параллелизма, библиотек и паттернов. Марк Саммерфилд.

VII. Книги по Business Intelligence и Visualization (визуализация)

1. Business intelligence and the cloud: strategic implementation guide. Michael S. Gendron.
2. Oracle Business Intelligence: The Condensed Guide to Analysis and Reporting. Yuli Vasiliev.
3. Visual Intelligence: Microsoft Tools and Techniques for Visualizing Data. Mark Stacey, Joe Salvatore, Adam Jorgensen.
4. Communicating Data with Tableau. Ben Jones.
5. Creating Data Stories with Tableau Public: Illustrate your data in a more interactive and interesting way using Tableau Public. Ashley Ohmann, Matt Floyd.
6. Data Visualization For Dummies. Mico Yuk, Stephanie Diamond.
7. Graph Analysis and Visualization: Discovering Business Opportunity in Linked Data. Richard Brath, David Jonker.
8. Interactive Data Visualization for the Web. Scott Murray.
9. Learning QlikView Data Visualization: Visualize and analyze data with the most intuitive business intelligence tool, QlikView. Karl Pover.
10. Python Data Visualization Cookbook: Over 60 recipes that will enable you to learn how to create attractive visualizations using Python’s most popular libraries. Igor Milovanović.
11. SAS Programming and Data Visualization Techniques: A Power User’s Guide. Philip R. Holland.
12. Tableau Dashboard Cookbook: Over 40 recipes on designing professional dashboards by implementing data visualization principles. Jen Stirrup.
13. Visualizing Data. Ben Fry.
14. Storytelling with Data: A Data Visualization Guide for Business Professionals. Cole Nussbaumer Knaflic

VIII. Книги по базам данных и Data Warehousing

1. Database systems: a practical approach to design, implementation, and management. Connolly, Thomas M., Carolyn E. Begg.
2. Beginning Database Design Solutions. Rod Stephens.
3. Build Your Own Database Driven Web Site Using PHP & MySQL. Kevin Yank.
4. Databases for Small Business: Essentials of Database Management, Data Analysis, and Staff Training for Entrepreneurs and Professionals. Anna Manning.
5. Databases: A Beginner’s Guide. Andrew J. Oppel.
6. Building a Data Warehouse: With Examples in SQL Server. Vincent Rainardi.
7. The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling. Ralph Kimball, Margy Ross.
8. NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence. Pramod J. Sadalage, Martin Fowler.
NoSQL: новая методология разработки нереляционных баз данных. Прамодкумар Дж. Садаладж, Мартин Фаулер.
9. Understanding SQL. Martin Gruber.
SQL для простых смертных. Мартин Грабер.

IX. Книги по Information Retrieval (информационный поиск)

1. Web Information Retrieval. Stefano Ceri, Alessandro Bozzon, Marco Brambilla, Emanuele Della Valle, Piero Fraternali, Silvia Quarteroni.
2. Search Patterns. Peter Morville, Jeffery Callender.
3. An Introduction to Information Retrieval. Christopher D. Manning, Prabhakar Raghavan, Hinrich Schutze.
Введение в информационный поиск. Кристофер Д. Меннинг, Прабакар Рагаван, Генрих Шетзе.

X. Бесплатные книги по data science из LeanPub (узнал про них из курсов data science на Coursera)

1. The Art of Data Science. A Guide for Anyone Who Works with Data. Roger D. Peng, Elizabeth Matsui.
2. The Elements of Data Analytic Style. A guide for people who want to analyze data. Jeff Leek.
3. Developing Data Products in R. Brian Caffo.
4. Executive Data Science. A Guide to Training and Managing the Best Data Scientists. Brian Caffo, Roger D. Peng, Jeffrey Leek.
5. Exploratory Data Analysis with R. Roger D. Peng.
6. The Hitchhiker’s Guide to Ggplot2 in R. Jodie Burchell, Mauricio Vargas.
7. Statistical inference for data science. A companion to the Coursera Statistical Inference Course. Brian Caffo.
8. Advanced linear models for data science. Brian Caffo.
9. How to be a modern scientist. Jeffrey Leek.
10. Regression Models for Data Science in R. A companion book for the Coursera Regression Models class. Brian Caffo.
11. Report Writing for Data Science in R. Roger D. Peng.
12. R Programming for Data Science. Roger D. Peng.

Похожие книги

Big data простым языком

Наш телефон знает о нас больше, чем мы думаем. Он умеет собирать и анализировать информацию о том, как мы передвигаемся по городу, какие посты лайкаем и какими приложениями пользуемся. Он сообщит о пробках и поторопит на работу, чтобы мы не опоздали; подберет музыку под наше настроение и составит список персональных рекомендаций, чем можно занять себя в течение дня. Телефон – больше не устройство, по которому звонят, это уже средство управления окружающим нас миром. Незаметно мы окружили себя такими интерфейсами, которые создают невидимый барьер между человеком и окружающей средой. Планирование, управление, коммуникация, все теперь строится через эти программы и девайсы. Даже человеческие отношения. Но насколько глубока кроличья нора? Каждому предстоит разобраться в этом самому. Эта книга поможет донести основные принципы проектирования и создания таких интерфейсов управления бизнесом, обществом и окружающим нас миром посредством Больших данных. Читайте, наслаждайтесь и помните: сожжение книг противозаконно.

Простые сказки на французском языке

Книга представляет собой сборник французских сказок, адаптированных (без упрощения текста оригинала) по методу Ильи Франка. Уникальность метода заключается в том, что запоминание слов и выражений происходит за счет их повторяемости, без заучивания и необходимости использовать словарь. Пособие способствует эффективному освоению языка, может служить дополнением к учебной программе. РЕКОМЕНДОВАНО для «нулевого» и начального этапов обучения французскому языку.

Язык жестов. Как читать мысли без слов? 49 простых правил

Можно ли узнать настроение человека по его внешнему виду? Можно ли определить, какое он принял решение, если не было сказано ни слова? Можно ли обмануть так, чтобы никто этого не заметил, или уличить человека в обмане без детектора лжи? Можно, если вы умеете читать тайный язык жестов! Перед вами свод уникальных правил, которые помогут вам стать специалистом в общении без слов. Вы научитесь не только читать мысли и чувства, которые от вас хотят скрыть, но и обретете уверенность в общении с любыми собеседниками.

Простой учебник английского языка – от нуля до среднего уровня. Версия 2.0

Этот учебник подойдет для обучения от нуля и до среднего уровня знания английского языка. Перевод и транскрипция всех английских слов удобно дается в местах использования этих слов (совсем не нужно заглядывать в словарь). Приводятся достаточные сведения по грамматике, и в дальнейшем для уверенного среднего уровня владения английским языком вам следует лишь пополнять словарный запас.

Простой учебник английского языка. Самоучитель. Версия 3.0

Этот простой учебник подойдет для обучения от нуля и до среднего уровня знания английского языка. Перевод и транскрипция всех английских слов удобно дается в местах использования этих слов (совсем не нужно заглядывать в словарь).

Формула прибыли. О чем говорят цифры. Простым языком для нефинансиста

Краткий курс для нефинансиста о том, как образуется прибыль бизнеса. В книге рассмотрены основные финансовые понятия и процесс формирования прибыли. Практические приемы, позволят читателю самостоятельно сделать управленческие расчеты и задать правильные вопросы, в том числе и финансистам. Вы сможете без посторонней помощи прочесть отчет о финансовом результате вашего бизнеса или даже публичной компании. Знания применимы для бизнеса любого масштаба. Вы узнаете, о чем действительно говорят цифры.

Стратегическое управление. Простым языком

Данная книга предназначена, прежде всего, для собственников коммерческих предприятий. Несмотря на звучное название рассматриваемого предмета, писалась она для владельцев бизнесов малого и среднего размера. Таким образом, впервые предмет, считавшийся ранее предназначенным для крупных предприятий, стал применим для значительно меньших организаций. Книга написана практиками. Фактически, она является отчетом об исследованиях, которые длились более десяти лет. Так же книга является прикладным пособием по выходу из оперативного управления, которое в народе принято называть «текучкой». Авторы утверждают, что пребывание в оперативном управлении для собственника не является оптимальным состоянием. Книга раскрывает способ, как собственник может управлять предприятием на расстоянии, концентрируя свое внимание на будущем развитии, а организация при этом расти и увеличивать доход.

Библейские истории, рассказанные простым языком, без терминов и родословных

Рассказы написаны понятным стилем о всяких проблемах простых людей, которые только слышат из СМИ, но конкретно мало понимают, что происходит на самом деле, – эти пробелы в толковании старой и новой информации устраняет автор.

Маркетинг наизнанку. Простым языком о маркетинге

Рассуждать о маркетинге стало трендом.Дефицит информации – это уже не про сегодняшний день.А вот найти качественную информацию в одном месте, изложенную просто, понятно и структурно – не просто. По крайней мере, это сложность, которая сопровождала меня на этапе моего профессионального развития и становления в маркетинге. Эта книга призвана рассказать об основах маркетинга простым языком.

Простым языком о логопедии

Назначение книги – помочь тем, кто воспитывает ребёнка, имеющего трудности в становлении речи. Познакомить с актуальными методами коррекции и профилактики логопедических проблем, дать практический материал. Пособие предназначено для учителей-логопедов, воспитателей ДОУ, родителей детей дошкольного и младшего школьного возраста с речевыми нарушениями.

Цигун. Простые упражнения для поддержания тонуса организма

Недаром секреты восточной медицины с каждым годом все сильнее набирают популярность. В этой книге собраны простые и эффективные упражнения древней практики Цигун, которые помогут при лечении и профилактике множества заболеваний и будут очень полезны для поддержания тонуса организма. Упражнения прекрасно подойдут для: укрепления позвоночника; предупреждения развития радикулита; укрепления поясничного и крестцового отделов; сохранения женского и мужского здоровья.

Почему я верю. Простые ответы на сложные вопросы

В своей новой книге известный миссионер и писатель протоиерей Андрей Ткачев предлагает нам совершить путь от начала поиска жизненного смысла до обретения этого смысла в христианстве. Автор раскрывает свой личный опыт веры и знакомит читателя с убеждениями великих ученых и отцов Церкви. Преодолевая вопросы и сомнения, он буквально «за руку» вводит нас туда, где вера и знания реализуются в осмысленную и наполненную жизнь – отец Андрей вводит нас в Православную Церковь.

Как добиваться своего с помощью НЛП. 49 простых правил

НЛП, или нейролингвистическое программирование, – относительно молодое и очень перспективное направление психологии. Освоив основные правила и законы НЛП, вы сможете изменить свою жизнь к лучшему. С помощью этой книги вы научитесь: полностью управлять собой, своим телом, физическим состоянием, мыслями, чувствами, эмоциями; управлять другими людьми, располагать к себе, успешно проводить переговоры любой сложности, влюблять в себя любого; не только решать любые проблемы, но и извлекать из них максимальную пользу; достигать любых целей в карьере, учебе, личной жизни, самосовершенствовании.

Школа гейши в 10 простых уроках

Вы уже посмотрели фильм «Мемуары гейши?» Если да, вам не нужно объяснять, о чем эта книга. Если нет – обязательно посмотрите. Ведь культура изысканной и утонченной женственности, созданная в Японии в 18–19 веках, и развивающаяся до настоящего времени, давно перешагнула границы японской традиции и стала бесценным достоянием женщин всего мира. Изысканная элегантность и утонченная сексуальность, грация и пластика движений, искусство макияжа и ухода за лицом и телом, умение одеваться в стиле ики, походка укеаюми, голос, имеющий чувственное звучание, уверенная осанка и техника взгляда насаке-мезукай, соблазн духов, оставляющий мимолетный аромат… А также искусство сексуальной кулинарии и эротической медитации, любовные афродизиаки и искусство создания эротической обстановки, и, конечно, все мельчайшие нюансы постельного искусства – это далеко не полный перечень того, что Элиза Танака – всемирно известный эксперт в области японской культуры гейш – просто и очень увлекательно изложила на страницах своих «10 простых уроков».

Из области таинственного. Простая речь о бытии и свойствах

Изучение душевной жизни человека, наблюдение таинственных явлений в области психики, может доставить человеку столь прочное и, можно сказать опытное убеждение в бытии души и ее бессмертии, что никакие сомнения неверия не могут поколебать его веры. А эта вера в бессмертие человеческого духа осмыслит всю его жизнь и наполнит ее такой радостью, которая избавит его от самых ужасных искушений жизни и гибельного пессимизма…

ТехнологИя счастья. Простые и доступные способы самоосчастливливания 🙂

Эта книжечка – конспект различных идей о том, как сделать свою жизнь более счастливой. Идеи эти накапливались уже довольно долго, как в результате анализа многообразных источников, так и благодаря личной практике и работе творческой группы. Эта группа на протяжении последних 25 лет развивает систему, которую мы называем ТехнологИя.

Как научиться разбираться в людях? 49 простых правил

«Чужая душа – потемки…». Как часто вы произносите вслух или про себя это расхожее выражение? Как часто вы, пообщавшись с приятелем, коллегой по работе или соседом, пожимаете плечами: «Странный он какой-то…». Если чаще, чем вам хотелось бы, тогда эта книга вам необходима. Это карманный справочник человеческих характеров, который раскроет вам секреты общения с окружающими вас людьми. Вы научитесь понимать и предсказывать мысли, чувства и поступки любого человека. 49 простых правил научат вас безошибочно разбираться в людях.

Простой курортный роман

Курортный роман. Что может быть романтичней? Сладкая пилюля. Лёгкий и приятный способ убежать от забот. Забыть на время обо всём на свете и наслаждаться свободой. Так думала героиня романа, с головой окунаясь в пучину приключений и страсти. Вот только она забыла, что, принимая такое сильное лекарство, нельзя забывать о побочных эффектах. Каких? Об этом вы сможете узнать, прочитав «Простой курортный роман».

Кулинарный ежедневник для работающих женщин. Простые рецепты на каждый день

Ох, нелегко бывает современным женщинам! Работа, работа и еще раз работа… Что тут греха таить: успешная карьера и кулинарные подвиги представляются нам вещами несовместимыми. Так хочется побаловать любимых мужчин, родных и близких людей каким-нибудь вкусным и необычным блюдом, а времени-то и нет. Как быть? Ограничиться покупными полуфабрикатами? Наша книга призвана решить эту непростую проблему. В ней собрано множество оригинальных кулинарных рецептов специально для занятых, работающих женщин. Это быстрые, простые блюда, процесс приготовления которых в основном занимает от 5 до 45 минут. Это несколько десятков вариантов меню на каждый день, которым не обязательно следовать строго, достаточно выбрать любое понравившееся вам блюдо. Это легкие закуски и салаты, бутерброды и каши на завтрак, супы и борщи на обед, аппетитные и питательные вторые горячие блюда из мяса и рыбы, овощей и грибов. Мы также дополнили книгу рецептами выпечки и десертов, которыми вы сможет порадовать ваших домочадцев и гостей в праздничные дни.

21 простая техника саморазвития

Книги по саморазвитию похожи. Разные книги разными словами рассказывают об одних и тех же принципах улучшения жизни. Во всех этих принципах действует принцип Парето. 20% техника дают 80% эффекта. Сложные принципы и техники не работают. Простые техники проще запомнить и применить. И именно они дают 80% эффекта улучшения жизни. В книге собрана 21 простоя техника кардинального улучшения жизни. Каждая техника по отдельности может качественно изменить жизнь. Техники можно применять как комплексно, так и брать любую из них и получать результаты от ее внедрения.

Заметки минималиста. Роскошь простых вещей

Легкая, полезная, познавательная книга, не только о том, как максимально эффективно организовать пространство, вокруг себя, но и о моногом другом, что призвано помочь читателям в обретении чувства легкости. Мы тратим немало времени и средств на обслуживание базовых потребностей, а ведь многое можно делать совсем иначе, высвободив время для того, что действительно важно и приносит удовольствие. Мы позволяем обидам, претензиям, ожиданиям и страхам быть «камнями в наших карманах» на пути к счастливой жизни. Пришло время навести глобальный порядок и расставить приоритеты, пришло время исполнять мечты и наполнять жизнь всем тем что первостепенно и ценно. Заметки минималиста – книга о том, как взять жизнь в свои руки. Полезные советы, которые уже сегодня вы можете применить в своей жизни, будь то полезный рецепт, идея по организации интерьера или откровение из жизни автора, которая может помочь вам в осознании своей личной истории.

Здесь все проще и легче

Космические путешественники Тролль и Женька спускаются на неизведанную планету. Согласно доступной им информации на этой планете отсутствуют разумные формы жизни. Но Женька все равно надеется найти новую инопланетную цивилизацию… А неизведанная планета скрывает совсем другую тайну…

Простые чудеса. Сказки, меняющие мир

В небольшом сборнике сказок вы найдёте добрые, пронизанные глубоким трепетным отношением к природе истории для детей.Герои книги – обычные ребята, которые живут по соседству с нами. Они пытаются помочь. И пусть на первый взгляд эти дела кажутся маленькими, зато они имеют большие последствия – мир вокруг постепенно меняется. Под заботливыми руками расцветает Земля.Ненавязчиво сказки дарят понимание, что в руках детей мир, в котором мы будем жить завтра. А в наших силах пробудить сердца ребят.

В поисках простых истин

О любви, дружбе и смысле жизни. Субъективный взгляд на основные ценности человеческой культуры. Порой мы ищем то, что давно уже имеем.

Школа гламура в 10 простых уроках

Простое и доступное руководство по основам гламура. 10 простых и эксклюзивных уроков представляют собой программу комплексного обучения. Урок за уроком вы становитесь все сексуальнее и приобретаете гламурный шарм.

Теоретический минимум по Big Data. Всё что нужно знать о больших данных

Добавить

  • Читаю
  • Хочу прочитать
  • Прочитал

Анналин Ын

Жанр: Техническая литература

Серия: Библиотека программиста (Питер)

Год издания: 2017

Издательство: Питер

Фрагмент книги

Оцените книгу

Скачать книгу

244 скачивания

Читать онлайн

О книге «Теоретический минимум по Big Data. Всё что нужно знать о больших данных»

Cегодня Big Data – это большой бизнес. Нашей жизнью управляет информация, и извлечение выгоды из нее становится центральным моментом в работе современных организаций. Неважно, кто вы – деловой человек, работающий с аналитикой, начинающий программист или разработчик, «Теоретический минимум по Big Data» позволит не утонуть в бушующем океане современных технологий и разобраться в основах новой и стремительно развивающейся отрасли обработки больших данных. Хотите узнать о больших данных и механизмах работы с ними? Каждому алгоритму посвящена отдельная глава, в которой не только объясняются основные принципы работы, но и даются примеры использования в реальных задачах. Большое количество иллюстраций и простые комментарии позволят легко разобраться в самых сложных аспектах Big Data.

Произведение было опубликовано в 2017 году издательством Питер. Книга входит в серию «Библиотека программиста (Питер)». На нашем сайте можно скачать книгу «Теоретический минимум по Big Data. Всё что нужно знать о больших данных» в формате pdf или читать онлайн. Здесь так же можно перед прочтением обратиться к отзывам читателей, уже знакомых с книгой, и узнать их мнение. В интернет-магазине нашего партнера вы можете купить и прочитать книгу в бумажном варианте.

Отзывы читателей

Подборки книг

Похожие книги

Популярные книги жанра «Техническая литература»

Информация обновлена:

Топ-10 лучших книг по большим данным, которые вы должны прочитать


В условиях экспоненциального роста объемов данных в текущем сценарии организации, независимо от их размера, используют технологии больших данных, чтобы оставаться конкурентоспособными. В этой статье мы перечисляем 10 лучших книг, чтобы получить значимое представление о концепции больших данных.

1 | Слишком велико, чтобы игнорировать: экономическое обоснование больших данных, автор отмеченного наградами автора Фил Саймон

Обзор: Эта книга представляет собой убедительное экономическое обоснование использования больших данных.В нем перечислены общие тенденции, которые привели к появлению больших данных, а также представлены обширные тематические исследования и примеры от отраслевых экспертов, чтобы дать представление о различных способах, которыми большие данные могут принести пользу организациям.



Стоимость: Вы можете купить на Amazon издание этой книги для Kindle и версию в мягкой обложке по цене 329,57 и 359 фунтов стерлингов соответственно.

Нажмите здесь, чтобы купить книгу.

2 | Революция данных: большие данные, открытые данные, инфраструктуры данных и их последствия Роб Китчин

Обзор: В этой книге содержится синоптический и критический анализ возникающего ландшафта данных, синоптический обзор больших данных, открытых данных и инфраструктур данных, введение в концептуальное мышление о данных, инфраструктурах данных, аналитике данных и рынках данных, анализ последствия революции данных для академической, деловой и государственной практики и т. д..

Стоимость: Вы можете купить на Amazon издание этой книги как для Kindle, так и в мягкой обложке, что обойдется вам в 2234,61 ₹ и 2550,00 соответственно.

Нажмите здесь, чтобы купить книгу.

3 | Большие данные в действии: развенчивая мифы, раскрывая возможности, Т. Х. Давенпорт

Обзор: В этой книге автор объясняет, что означают большие данные и почему каждый в бизнесе должен о них знать. Книга охватывает все основы, например, что означают большие данные с технической, потребительской и управленческой точек зрения, каковы возможности и затраты, где они могут иметь реальное влияние на бизнес и какие аспекты этой горячей темы были переоценены.Эта книга также поможет вам понять причины, по которым большие данные важны для вас и вашей организации, какие технологии вам нужны для управления ими, как большие данные могут изменить вашу работу, вашу компанию и отрасль, а также другие важные темы.

Стоимость: Вы можете купить на Amazon издание этой книги для Kindle и версию в мягкой обложке по цене 703,95 и 741,00 соответственно.

Нажмите здесь, чтобы купить книгу.

4 | Большие данные: принципы и передовая практика масштабируемых систем данных в реальном времени Натан Марц и Джеймс Уоррен

Обзор: Эта книга по большим данным научит вас создавать системы больших данных с использованием архитектуры, которая использует преимущества кластерного оборудования вместе с новыми инструментами, разработанными специально для сбора и анализа данных веб-масштаба.В нем описывается масштабируемый и простой для понимания подход к системам больших данных, которые могут быть созданы и запущены небольшой командой. В этой книге также рассказывается о теории систем больших данных, о том, как реализовать их на практике, а также о том, как развертывать и эксплуатировать их после создания.

Стоимость: Вы можете купить эту книгу в мягкой обложке на Amazon, что обойдется вам всего в 446.00.

Нажмите здесь, чтобы купить книгу.

5 | Большие данные на практике Бернар Марр

Обзор: Эта книга заполняет пробел в знаниях, показывая, как крупные компании используют большие данные каждый день, с близкого расстояния, на месте.Здесь вы можете узнать, как была профилирована каждая компания, узнать, какие данные использовались, какие проблемы были решены и какие процессы были внедрены, чтобы сделать это практичным, а также технические детали, проблемы и уроки, извлеченные из каждого уникального сценария.

Стоимость: Вы можете купить на Amazon издание этой книги для Kindle и версию в мягкой обложке за 329,57 и 338 фунтов стерлингов соответственно.

Нажмите здесь, чтобы купить книгу.

6 | Демистификация больших данных Дэвид Стивенсон

Обзор: Цель этой книги — демистифицировать термин «большие данные» и предоставить практические способы использования этих данных с помощью науки о данных и машинного обучения.В первой части книги рассказывается о больших данных, искусственном интеллекте и машинном обучении, а также о сценариях использования аналитики больших данных. Часть вторая включает в себя обеспечение работы экосистемы больших данных для организации, большие данные могут помочь в выработке стратегии и т. Д.

Стоимость: Вы можете купить на Amazon издание этой книги для Kindle и версию в мягкой обложке по цене 260,30 и 280,00 фунтов стерлингов соответственно.

Нажмите здесь, чтобы купить книгу.

7 | Аналитика в мире больших данных: основное руководство по науке о данных и ее приложениям Барт Басенс

Обзор: Эта книга написана с большим практическим вниманием к теме больших данных и аналитики.В книгу включены примеры из реальной жизни автора из личного опыта консультирования и исследований (банковское дело, розничная торговля, государственное управление), а также обзор дальновидных идей и последних событий в сфере бизнеса.

Стоимость: Вы можете купить на Amazon издание этой книги для Kindle и книгу в твердом переплете по цене 482,52 и 663,00 соответственно.

Смотрите также

Нажмите здесь, чтобы купить книгу.

8 | Большие данные для начинающих: понимание SMART больших данных, интеллектуального анализа и анализа данных для повышения эффективности бизнеса, принятия жизненных решений и многого другого! Винс Рейнольдс

Обзор: Эта книга поможет вам понять интеллектуальные большие данные, интеллектуальный анализ данных и анализ данных для повышения эффективности бизнеса, принятия жизненных решений и многого другого.Он также включает в себя то, что большие данные могут сделать для вас, понимание аналитики, препятствий и важности больших данных и связанных с ними проблем и т. Д.

Стоимость: Вы можете купить на Amazon издание этой книги для Kindle и книгу в твердом переплете по цене 392,94 и 772 фунта стерлингов соответственно.

Нажмите здесь, чтобы купить книгу.

9 | От больших данных к большой прибыли: успех с данными и аналитикой Рассел Уокер

Обзор: Автор этой книги описывает использование внутренних больших данных для стимулирования инноваций с целью повышения операционной эффективности, а также способы разработки внешних больших данных для измерения или даже подсказки решений клиентов о покупке.Вы узнаете природу больших данных, новые меры, которые они создают для рыночной активности, и выгоды, которые они могут предложить за счет взаимосвязанности делового и социального мира и других актуальных тем.

Стоимость: Вы можете купить как издание для Kindle, так и книгу в твердом переплете на Amazon по цене 455,18 и 1383 фунтов стерлингов соответственно.

Нажмите здесь, чтобы купить книгу.

10 | Большие данные и аналитика Сима Ачарья и Субхашини Челлаппан

Обзор: В этой книге подробно рассматриваются концепции и практика больших данных, Hadoop и аналитики.Книга охватывает все: от подхода «сделай сам» и руководств по созданию кластера Hadoop до более глубокого понимания концепций и множества проверенных временем практических упражнений по изученным концепциям.

Стоимость: Вы можете купить на Amazon издание этой книги для Kindle и версию в мягкой обложке по цене 394,40 и 485 фунтов стерлингов соответственно.

Нажмите здесь, чтобы купить книгу.


Если вам понравилась эта история, присоединяйтесь к нашему сообществу Telegram.

Кроме того, вы можете написать для нас и стать одним из 500+ экспертов, которые написали статьи на AIM. Поделитесь своими номинациями здесь.

.

Лучшие книги по аналитике и большим данным, которые вы должны прочитать

Поговорка «знание — сила» как никогда актуальна благодаря широко распространенному коммерческому использованию больших данных и аналитики данных.

Эта тенденция возникла в результате новых требований современного рынка, и она сохраняется. Скорость генерации данных в последние годы экспоненциально выросла. Для сравнения: только через Google в секунду выполняется 40 000 поисковых запросов — это 3.46 миллионов запросов в день и 1,2 триллиона запросов в год.

Компании, как большие, так и маленькие, ищут лучшие способы использовать свои данные для получения конкурентного преимущества. Имея это в виду, мы подготовили список из 15 лучших книг по аналитике данных и больших данных, а также журналы и обзоры подлинных читателей, одобренные сообществом Goodreads. Независимо от того, являетесь ли вы полным новичком или опытным профессионалом в области бизнес-аналитики, вы найдете здесь несколько книг по анализу данных, которые помогут вам улучшить свое понимание этой важной области.И с этим пониманием вы сможете задействовать потенциал аналитики данных для создания стратегических преимуществ, использовать свои метрики для преобразования их в потрясающие бизнес-панели и определять новые бизнес-возможности или, по крайней мере, участвовать в процессе.

Прежде чем мы углубимся в подробности, вот три идеи аналитики больших данных, которые позволят оценить их актуальность и важность.

Важная информация о больших данных и аналитике данных

  • Всего через пять лет количество умных подключенных устройств на планете превысит 50 миллиардов, и все они будут генерировать данные, которые можно будет совместно использовать, собирать и анализировать.
  • Белый дом инвестировал невероятные 200 миллионов долларов в проекты с большими данными — истинное свидетельство растущей важности и актуальности аналитики больших данных во всех секторах.
  • На данный момент анализируется и используется только 5% всех доступных данных — просто подумайте о потенциале.

Лучшие книги по аналитике и большим данным за все время

1) Доступность аналитики данных, А. Махешвари

Лучшее для : новый стажер, который даже не понимает, что такое наука о данных

Отрывок из восторженного обзора :

«Я определенно рекомендую эту книгу всем, кто заинтересован в изучении Data Analytics с нуля, и сказал бы, что это лучший доступный ресурс среди всех других книг по Data Analytics.”

Если бы нам нужно было выбрать одну книгу, которую мог бы прочитать новичок в области науки о данных, то это была бы эта. Обновленная в 2018 году книга «Доступность бизнес-аналитики и интеллектуального анализа данных», несомненно, является лучшей книгой по аналитике данных, и она делает именно то, что подразумевает ее название: она легко объясняет анализ данных и делает ее понятной и удобоваримой для непосвященных. .

Книга способствует легкому пониманию благодаря:

  • Конкретные, реальные примеры в начале каждой главы
  • Интуитивно организованный план, подобный семестровому курсу в колледже
  • Примеры из каждой главы, чтобы связать материал вместе

Благодаря своему содержанию и ясному объяснению, «Доступная аналитика данных» стала учебным пособием для многих университетов США и всего мира.Автор, Анил Махешвари, доктор философии, обладает практическими и интеллектуальными знаниями в области анализа данных; он проработал в IBM 9 лет в области науки о данных, прежде чем стал профессором.

В книге также есть материалы, полученные «краудсорсингом», поскольку в издание 2017 года было добавлено 4 главы на основе отзывов рецензентов и читателей. На Kindle 156 страниц, это книга, которую вы могли бы закончить за один (долгий) присест, если бы вы были так склонны, и которую вы также можете использовать в качестве вдохновения при работе над стратегией бизнес-аналитики.

2) Прогностическая аналитика: возможность предсказать, кто нажмет, купит, солгает или умрет Э. Сигель

Подходит для: человека, который слышал много шума о прогнозной аналитике, но не имеет твердого представления об этом предмете

Отрывок из восторженного отзыва:

«Фрикономика больших данных».

—Штейн Кретцингер, исполнительный директор-учредитель отдела рекламы. com

Мы включили прогнозную аналитику в наш список наиболее важных тенденций в области бизнес-аналитики, поскольку она широко признана как стратегия, позволяющая раскрыть потенциал больших данных.С точки зрения бизнеса, прогнозная аналитика используется для анализа текущих данных и исторических фактов, чтобы лучше понять клиентов, продукты и конкурентов, а также определить потенциальные риски и возможности для компании.

Однако из-за своего обширного применения прогнозная аналитика не должна касаться только профессионалов бизнеса. Большинство людей знают, что компании собирают данные о нашем местоположении GPS, текстовые сообщения, информацию о покупках по кредитным картам, сообщения в социальных сетях, историю поиска Google и т. Д., и эта книга даст вам представление об их процедурах сбора данных и причинах их возникновения.

Книга Эрика Сигеля по анализу данных — это открытое чтение для всех, кто хочет узнать, что такое предиктивная аналитика и как предиктивную аналитику можно развернуть в широком диапазоне дисциплин. Это не руководство, поэтому специалист по данным, ищущий инструкции, будет разочарован. Хотя есть некоторое обсуждение алгоритмов, включая линейную регрессию или деревья решений, это легко понять даже неспециалисту.

Книга

Сигеля поясняет, что предиктивная аналитика — это не скрытая процедура, используемая компаниями для увеличения продаж, а значительный технологический скачок, который, прогнозируя поведение человека, может помочь бороться с финансовыми рисками, улучшить здравоохранение, уменьшить спам, ужесточить преступность. борьба, и да, рост продаж. Недавно он был пересмотрен и обновлен в январе 2016 года.

3) Слишком большой, чтобы игнорировать: экономическое обоснование больших данных, автор отмеченный наградами автор П. Саймон

Лучшее для : член вашей управленческой команды, который закатывает глаза, когда появляются большие данные или прогнозная аналитика

Отрывок из восторженного обзора :

«Саймон представляет для нетехнологов очень тщательное исследование нового мира« больших данных »со множеством иллюстраций того, как компании начинают использовать этот ресурс в своих интересах.”

Есть два типа людей, которым следует прочитать эту книгу: люди, которые не верят в достоинства больших данных и прогнозной аналитики, и люди, которые настолько заинтересованы в этих темах, что им нравится узнавать о текущих вариантах использования этих технологий. и это делает его одной из лучших книг по большим данным.

«Слишком большой, чтобы игнорировать» рассматривает множество примеров того, как компании (и местные органы власти!) Используют большие данные в своих интересах, в том числе:

  • Progressive Insurance использует GPS-трекеры / акселерометры, которые определяют рейтинги безопасности клиентов
  • Способность Google прогнозировать местные вспышки гриппа путем измерения всплесков локальных поисковых запросов, связанных с гриппом
  • Правительство Бостона ремонтирует выбоины, используя данные, которые жители вводят в свои смартфоны

Автор, Фил Саймон, выступавший с основными докладами в EA, Cisco, Zappos и Netflix, является экспертом в упрощении технической информации.Саймон утверждает, что большие данные — это не только область потенциальных инноваций, но и важный фактор, который ваша компания должна решить прямо сейчас, чтобы выжить на современном рынке. В его аргументе есть безотлагательность и ясность, в основе которых лежит следующий момент: большие данные — это не прихоть. Это огромное изменение в ведении бизнеса, и оно уже происходит.

Замечательно свободный от жаргона и наполненный тематическими исследованиями и примерами, фраза «Слишком большой, чтобы игнорировать» является отличным введением в большие данные, как видно через призму: что большие данные могут сделать для меня и моего бизнеса?

4) Экономичная аналитика: используйте данные, чтобы ускорить создание лучшего стартапа, А.Кролл и Б. Йосковиц

Лучшее для : любой сотрудник вашей компании, который хочет глубоко понять своих клиентов с помощью аналитики данных

Выдержки из восторженных отзывов :

«Так же полезно для сегодняшних многомиллиардных компаний, как и для предпринимателей».

— Джон Стормер, Salesforce.com

«Ваши конкуренты будут использовать эту книгу, чтобы перерасти вас».

Майк Вольпе, Hubspot

Эрик Рейс начал глобальное движение, выпустив книгу «Экономичный стартап».Философия книги заключается в том, чтобы как можно быстрее получать обратную связь от клиентов и быстро повторять ее на основе этой обратной связи. Применение «философии бережливого производства» к аналитике данных было лишь вопросом времени.

Однако не обманывайтесь — точно так же, как вам не нужно быть буквально стартапом, чтобы извлечь большую пользу из книги Эрика Райса, компании любого размера и формы могут узнать много ценной информации из «Lean Analytics» ». В книге три основные идеи:

  1. Самый большой риск, с которым сталкивается ваша компания, — это вкладывать много времени и ресурсов в создание чего-то, чего рынок не хочет.
  2. Соответствие продукта рынку — самый важный фактор для правильного выбора.
  3. Используя правильные аналитические показатели, вы можете определить, на каких продуктах или услугах сосредоточиться или создавать — и как их продавать.

В современном мире каждая компания может потерпеть крах. Вам решать: хотите ли вы подорвать собственную компанию изнутри, будучи интрапренером, или вы собираетесь позволить кому-то другому помешать вам на рынке?

Прочитав эту книгу, вы получите необходимый инструментарий, чтобы убедиться, что первое происходит, а не второе.

5) Интеллектуальные данные: использование науки о данных для преобразования информации в понимание, Дж. У. Форман

Подходит для: немного технического читателя, который хорошо разбирается в Excel, но мало разбирается в науке о данных

Отрывок из восторженного отзыва:

«Что мне больше всего нравится в этой книге, так это то, что в ней не делается попытки взмахом волшебной палочки данных вылечить все недуги вашей компании. Вместо этого он фокусируется на нескольких областях, в которых данные и аналитические методы могут принести конкретную пользу, и дает вам ровно столько, чтобы начать работу.”

«Data Smart» содержит конкретные советы о том, какие аналитические методы следует применять для эффективного анализа данных. Это полезное чтение для всех, у кого есть небольшой опыт в прикладной математике и программа для работы с электронными таблицами на своем компьютере. Это хорошо продуманный и разработанный учебник с множеством простых для понимания реальных примеров для бизнес-профессионала, который должен работать с наборами данных.

Каждая глава описывает различные методы в электронной таблице, включая нелинейное программирование и генетические алгоритмы, кластеризацию, модульность графов, интеллектуальный анализ данных в графах, контролируемый искусственный интеллект посредством логистической регрессии, ансамблевые модели, прогнозирование, сезонные корректировки и интервалы прогнозирования с помощью моделирования Монте-Карло, как а также переход от электронных таблиц к языку программирования R.

«Data Smart» содержит достаточно практической информации, чтобы фактически начать проводить анализ с использованием старого доброго Microsoft Excel. Его цель не в том, чтобы произвести революцию в вашем бизнесе с помощью дополнительного программного обеспечения, а в постепенном улучшении процессов с помощью доступных аналитических методов. Однако, как только вы начнете работать с более крупными наборами данных корпоративного уровня с миллионами строк и сотнями столбцов информации, Excel может оказаться не в состоянии обрабатывать такие объемы. На данный момент наиболее доступным и эффективным решением будет обращение к самообслуживанию бизнес-аналитики.

6) Большие данные: революция, которая изменит то, как мы живем, работаем и думаем В. Майер-Шенбергер и К. Цукьер

Подходит для: читателя, интересующегося тем, как большие данные могут улучшить качество нашей жизни (и не только с точки зрения бизнеса)

Отрывок из восторженного отзыва:

«Оптимистичный и практичный взгляд на революцию в области больших данных — именно то, что нужно, чтобы получить представление о больших изменениях, которые уже происходят, и о грядущих изменениях. .- Кори Доктороу, boingboing.com

.

Это еще одна книга по большим данным, которая дает читателям более общий взгляд на ключевые проблемы, связанные с большими данными, а авторы предлагают свое мнение и идеи о том, как будут развиваться технологии. Это было бы идеальным чтением для новичков в этой теме, которые хотят понять, каким образом большие данные могут быть использованы для улучшения качества жизни людей — от определения покупательских моделей покупок до прогнозирования вспышек гриппа.

Книга также проливает свет на то, как ключевые характеристики больших данных (объем, разнообразие, скорость и достоверность) изменят способ обработки и управления данными.В нем упоминается полнота данных (в отличие от выборки), возможность количественной оценки и оцифровки новых форматов информации, которые ранее были недоступны, а также возможность использования новых баз данных (таких как Hadoop и NoSQL) и статистических инструментов (машинное обучение и data mining) для описания огромных объемов данных.

7) Бизнес-неинтеллект: понимание и инновации помимо аналитики и больших данных, Б. Девлин

Подходит для: опытного профессионала в области бизнес-аналитики, готового глубоко и серьезно задуматься над важными проблемами анализа данных и больших данных

Отрывок из восторженного отзыва:

«… образец хранилища данных и бизнес-аналитики.Он проникает в каждый укромный уголок отрасли, показывает как великие успехи, так и глубины безумия (и того и другого раскрыто много). В этой книге подробно рассказывается, что настоящий «отец хранилищ данных» думает о своих детях, и это не всегда красиво… »

Эта книга особенно полезна для тех, кто живет и дышит BI — и кто готов критически взглянуть на свои идеи в этой области. В этой, порой противоречивой и непоколебимой книге доктор Барри Девлин показывает, как современный бизнес-аналитика часто не справляется с данными из мобильных, социальных сетей и Интернета вещей.Девлин также утверждает, что современные бизнес-решения должны приниматься на основе комбинации управляемых данными (рациональных) и эмоциональных (интуитивных) источников, а не только на основе данных, и что бизнес-аналитика должна отражать эти потребности.

Книга также служит историей бизнес-аналитики, больших данных и аналитики данных, поскольку Девлин подробно описывает прошлое, настоящее и будущее этой области. Он делает это, чтобы бросить вызов многим предположениям в современной аналитике данных и сбору данных, показывая, как быстро старые передовые практики устаревают из-за огромного объема и скорости современных источников данных.

Если вы готовы мыслить по-другому, «Бизнес-неразум» — одна из лучших книг по анализу данных для этого.

8) Большие данные в действии: развенчание мифов, раскрытие возможностей, Т. Х. Давенпорт

Подходит для: менеджеров, которые хотят начать и управлять процессом больших данных как в малых, так и в крупных организациях

Отрывок из восторженного отзыва:

«Это обязательное чтение для менеджеров, которым нужно прямое, свободное от шумихи введение в большие данные, четкий и проясняющий« сигнал »в невероятном шуме вокруг сбивающего с толку и неправильно обозначенного термина.» — Forbes

Эта книга, содержащая советы о том, как разработать стратегию и план действий в отношении больших данных, какие технологии вам нужны для их использования и как нанять подходящих людей для обработки больших данных, явно ориентирована на менеджеров.

Он также предлагает обзор технологий больших данных, объясняет, что необходимо для успеха с большими данными, и дает примеры как успешных, так и неудачных практик обработки данных, применяемых стартапами, онлайн-фирмами и крупными компаниями. Также автор вводит понятие «аналитика 3.0 », чтобы описать, как компании могут сочетать традиционную аналитику с подходом к большим данным. Он признает крупные онлайн-компании, такие как Google или Facebook, создателями лучших инструментов и технологий для работы с большими данными, а также управленческой отчетности на основе данных и передового опыта.

«Большие данные в действии» — приятное чтение, однако такая доступность может быть достоинством для одних читателей и недостатком для других. Критики отмечают, что книга предлагает довольно свежий подход к предмету, поскольку она воздерживается от использования технических терминов и, таким образом, избегает ответов на некоторые элементарные вопросы.

9) Аналитика в мире больших данных: Основное руководство по науке о данных и ее приложениям, Б. Басенс

Подходит для: аналитиков бизнес-данных, консультантов и аспирантов в области бизнес-аналитики

Отрывок из восторженного отзыва:

«В области, переполненной шумихой и преувеличениями,« Аналитика в мире больших данных »обеспечивает серьезное, сфокусированное внимание на особенностях и передовых методах реализации».

Это настоящее руководство по анализу данных, которое подойдет читателям, которые уже имеют базовые знания в области интеллектуального анализа данных и бизнес-аналитики и ищут структурные и технические инструкции о том, как проводить аналитику больших данных в реальном управлении бизнесом.

С очень сильной практической направленностью «Аналитика в мире больших данных» начинается с предоставления читателям базовой номенклатуры, модели аналитического процесса и ее связи с другими соответствующими дисциплинами, такими как статистика, машинное обучение и искусственный интеллект. Затем автор выделяет наиболее важные этапы модели процесса, такие как выборка, обработка пропущенных значений и выбор переменных. В последующих главах основное внимание уделяется прогнозной и описательной аналитике.

Кроме того, включены и подробно описаны многочисленные тематические исследования по управлению рисками, обнаружению мошенничества, управлению взаимоотношениями с клиентами и веб-аналитике. В седьмой главе автор дает нам конкретные инструкции о том, какие инструменты и методы бизнес-аналитики следует использовать, чтобы заставить аналитику работать. Темы, затронутые здесь, варьируются от подходов к бэктестированию и сравнительному анализу до вопросов качества данных, программных инструментов и методов документирования моделей.

Созданная как доступный ресурс, эта важная книга по большим данным не содержит исчерпывающего описания всех аналитических методов.Вместо этого в нем освещаются методы анализа данных, которые действительно обеспечивают добавленную стоимость в бизнес-среде.

10) Наука о данных для бизнеса: что нужно знать о интеллектуальном анализе данных и аналитическом мышлении, Ф. Провост и Т. Фосетт.

Подходит для: человека, который прочитал несколько вводных книг по науке о данных и готов бросить вызов самим себе и погрузиться глубже

Отрывок из восторженного отзыва:

«Книга обеспечивает удовлетворительно хороший баланс между техническими основами и бизнес-приложениями: достаточно цифр и технических деталей для прочного фундамента, дополненного многочисленными бизнес-кейсами и примерами, чтобы увидеть, как технические детали встают на свои места.”

Многие книги об аналитике данных и больших данных посвящены «как» науки о данных — методам и механизмам. «Наука о данных для бизнеса» тоже делает это, но также раскрывает «почему» науки о данных и дает представление о некоторых полезных способах размышления о науке о данных в деловой среде.

В книге рассматриваются некоторые основополагающие принципы аналитики данных, и она предназначена для начинающих лиц, принимающих решения на основе данных, которые хотят разумно участвовать в использовании больших данных и аналитики для улучшения стратегических и тактических решений своей компании.

Наконец, «Наука о данных для бизнеса» содержит достаточно подробностей, объясняющих методы интеллектуального анализа данных, используемые сегодня, с использованием большого количества научного мышления, не перегружая читателя числами и уравнениями. Этому способствует использование технических разделов, которые читатель может пропустить или проглотить по своему усмотрению.

11) Numsense! Наука о данных для обывателя: без математики, добавленные Анналин Нг и Кеннет Су

Подходит для: Любой непрофессионал без опыта работы в математике или аналитике, который хочет работать в этой области или руководить другими специалистами по данным

Отрывок из восторженного отзыва:

«Numsense! Наука о данных для обывателя — отличная маленькая книга.Это может быть не только прекрасным введением для кого-то, у кого мало или вообще каких-либо познаний в области науки о данных, но также и хорошее резюме по нескольким различным областям для тех, кто знаком. Пять звезд за то, что написано в названии «.

Для книг по большим данным, ориентированных на практическое применение цифровых данных, Numsense! один из лучших на рынке. Это удобоваримое руководство не только говорит с читателем ясным и понятным языком, но также содержит полезные советы в таких областях, как A / B-тестирование, анализ социальных сетей, регрессионная аналитика, кластеризация и многое другое.

Обладая вдохновляющими примерами из реальной жизни и исчерпывающим глоссарием терминов, эта книга по анализу данных является обязательной к прочтению всем, кто хочет начать путь на всю жизнь к аналитическому просвещению.

12) Взлом роста: как самые быстрорастущие компании сегодня способствуют прорывному успеху, Шон Эллис и Морган Браун

Подходит для: начинающего предпринимателя, стремящегося к росту и развитию своей империи, используя мощь больших данных

Отрывок из восторженного отзыва:

«Книга обязательна для прочтения всем, кто интересуется предметом обсуждения.Автор (ы) излагает очень подробную, но краткую картину того, что включает в себя взлом роста, и пошаговый метод того, как это сделать. Они убедительно показывают, что методы или мышление взлома роста могут и должны применяться к вам, независимо от того, работаете ли вы в стартапе или в большой компании ».

Growth hacking — относительно новое явление, дающее понятие использования ключевых идей, данных и цифровых стратегий для связи с вашей целевой аудиторией на более значимом и более личном уровне. И если все сделано правильно, это работает.

Из всех доступных сегодня книг на тему взлома роста это самая вдохновляющая, самая понятная и, в конечном счете, самая полезная. Вы не только получите осязаемое представление о том, как такие бренды, как Airbnb и Pinterest, стали мировыми сенсациями, но и получите доступ к набору инструментов для взлома роста на основе обоснованных решений, основанных на данных.

13) Управление персоналом, управляемым данными: как использовать аналитику и метрики для повышения производительности Бернарда Марра

Подходит для: бизнес-руководителей, руководителей и директоров по персоналу, стремящихся улучшить свои методы ведения бизнеса с помощью реальной аналитики больших данных

Отрывок из восторженного отзыва:

«Практическое, вдохновляющее руководство для специалистов по кадрам, эта книга показывает, как данные, собранные компанией, могут быть использованы для улучшения функции управления персоналом и, в свою очередь, компании в целом.Это намного больше, чем просто хранение кадровой информации на компьютере, но многим профессионалам еще предстоит увидеть полезность и потенциал HR, управляемого данными. Такая книга может это изменить! »

В современном мире данные служат для повышения продуктивности, производительности и эффективности всех секторов, дисциплин и отделов — и человеческие ресурсы не исключение.

Для специалистов по персоналу, которые хотят установить подробные ключевые показатели эффективности управления персоналом, использовать ценность цифровых показателей и аналитические данные для улучшения таких областей, как обучение и развитие, защита данных, управление персоналом и организационная эффективность, это одна из лучших книг по цифровым данным, которую вы можете мог когда-либо читать.

Наполненная практическими идеями и простыми для понимания тематическими исследованиями, эта библия больших данных, основанная на HR, послужит неоценимым справочником в вашем стремлении к совершенствованию человеческих ресурсов.

14) Создание ценности с помощью аналитики социальных сетей: управление, согласование и анализ текста социальных сетей, сетей, действий, местоположения, приложений, гиперссылок, мультимедиа и данных поисковых систем. Автор: Гохар Ф. Хан

Подходит для: любого человека, который хочет получить информацию и метрики на основе данных через известные платформы социальных сетей

Отрывок из восторженного отзыва:

«» Гохар Хан — пионер в развивающейся области аналитики социальных сетей.Этот последний текст является обязательным к прочтению бизнес-лидерами, менеджерами и академиками, поскольку он дает четкое и краткое представление о создании ценности для бизнеса с помощью данных социальных сетей через призму социальных сетей «, — Лаик Хан, директор исследовательской группы аналитики социальных сетей , Университет Огайо.

Если у вас есть твердое рабочее представление о функциональности самых известных в мире платформ социальных сетей и ключевых показателях эффективности цифрового маркетинга, но вы хотите получить больше пользы от каждого канала, эту книгу больших данных просто необходимо прочитать.

Знания автора в этой области не только обширны и впечатляют, но и представлены таким образом, чтобы начинающие специалисты по данным, маркетологи, руководители социальных сетей и бизнес-лидеры могли с легкостью извлекать бесценные кусочки информации.

Используя аналитику больших данных для уточнения и продвижения своей стратегии в социальных сетях, вы выделяетесь среди конкурентов — и эта книга по большим данным поможет вам в этом.

15) Аналитическая философия: очень краткое введение Майкла Бини

Подходит для: человек, желающих понять историю, происхождение и основные принципы аналитического мышления, основанного на данных

Отрывок из восторженного отзыва:

«Краткое, восхитительно доступное и интеллектуально стимулирующее введение в философию в аналитической традиции, особенно в ее формирующую фазу.»- Эрих Рек, профессор Калифорнийского университета в Риверсайде

Одна из самых плодотворных существующих книг по анализу данных, эта проницательная, информативная и освежающая работа в прозе служит идеальным дополнением к более практичным книгам и инструментам из нашего списка.

Углубляясь в саму идею предмета и предпосылки, лежащие в основе аналитического мышления, эта книга точно определяет, почему аналитика больших данных так ценна, предлагая удобоваримые концепции, которые будут служить самой основой всего, что вы делаете с доступной вам цифровой информацией. .Настоящее обязательное чтение для всех, кто жаждет просвещения в области больших данных.

«Самый ценный товар, о котором я знаю, — это информация». — Гордон Гекко , Уолл-стрит

Если вы нашли наш список лучших книг по аналитике данных и большим данным полезным, но ваша жажда знаний еще не утолена, взгляните на наши лучшие книги по бизнес-аналитике или наши публикации о книгах по визуализации данных, чтобы продолжать расширять свое понимание науки о данных.А если вы хотите применить на практике полученные знания в области анализа больших данных, воспользуйтесь нашей онлайн-панелью инструментов.

Итак, какие книги по большим данным самые лучшие? Вот резюме:

  1. Доступность аналитики данных , А. Махешвари
  2. Прогностическая аналитика: возможность предсказать, кто кликнет, купит, солгает или умрет Э. Сигель
  3. Слишком большой, чтобы игнорировать: экономическое обоснование больших данных , автор отмеченный наградами автор П. Саймон
  4. Экономичная аналитика: использование данных для ускорения запуска лучшего стартапа , А.Кролл и Б. Йосковиц
  5. Интеллектуальные данные: использование науки о данных для преобразования информации в понимание , Дж. У. Форман
  6. Большие данные: революция, которая изменит то, как мы живем, работаем и мыслим В. Майер-Шенбергер и К. Цукьер
  7. Business UnIntelligence: понимание и инновации помимо аналитики и больших данных , Б. Девлин
  8. Большие данные в действии: развенчивая мифы, раскрывая возможности , Т. Х.Давенпорт
  9. Аналитика в мире больших данных: Основное руководство по науке о данных и ее приложениям , Б. Басенс
  10. Наука о данных для бизнеса: что нужно знать о интеллектуальном анализе данных и аналитическом мышлении , Ф. Провост и Т. Фосетт
  11. Numsense! Наука о данных для обывателя: математика не добавлена ​​ Анналин Нг и Кеннет Су
  12. Хакерский рост: как самые быстрорастущие компании сегодня добиваются успеха Шон Эллис и Морган Браун
  13. Управление персоналом на основе данных: как использовать аналитику и метрики для повышения производительности Бернар Марр
  14. Создание ценности с помощью аналитики социальных сетей: управление, согласование и анализ текста социальных сетей, сетей, действий, местоположения, приложений, гиперссылок, мультимедиа и данных поисковых систем by Gohar F.Хан
  15. Аналитическая философия: очень краткое введение Майкл Бини

Чтобы начать более глубокое понимание собственных наборов данных, вы можете бесплатно попробовать наш онлайн-инструмент визуализации данных с 14-дневной пробной версией!
.

Топ-25 лучших книг по большим данным на Amazon, которые вы должны прочитать

В Интернете доступно множество бесплатных ресурсов (таких как руководства для покупателей и передовые методы Solutions Review), и они прекрасны, но иногда лучше делать что-то по старинке. Есть несколько ресурсов, которые могут сравниться с подробными и исчерпывающими деталями хорошей книги.

Solutions Review провела для вас исследование, просмотрев многие из этих книг. Мы тщательно отобрали лучшие книги по большим данным на основе релевантности, популярности, рейтингов, даты публикации и способности повысить ценность для бизнеса.Каждая указанная книга имеет не менее 10 отзывов пользователей Amazon и рейтинг 3,0 или выше.

Ниже вы найдете библиотеку книг от признанных лидеров, экспертов и профессионалов в области технологий в этой области. От информационных панелей до аналитики данных — этим публикациям есть что предложить даже самым опытным профессионалам в области данных.

Большие данные: революция, которая изменит то, как мы живем, работаем и мыслим

«Независимо от того, используются ли они АНБ для борьбы с терроризмом или интернет-магазины для прогнозирования моделей покупок клиентов, большие данные — это революция, происходящая вокруг нас, в процессе навсегда меняющих экономику, науку, культуру и сам образ жизни. считать.Но это также создает новые угрозы — от нарушения конфиденциальности в том виде, в каком мы ее знаем, до перспективы наказания за то, что мы еще даже не сделали, исходя из способности больших данных предсказывать наше будущее поведение. То, что мы уже видели, — это лишь верхушка айсберга. Большие данные — первая крупная книга об этой потрясающей теме, в которой два ведущих эксперта объясняют, что такое большие данные, как они изменят нашу жизнь и что мы можем сделать, чтобы защитить себя от их опасностей ».

Большие данные: методы и технологии в геоинформатике

«Предлагая перспективу на основе анализа времени, приложений и ресурсов, эта книга знакомит читателей с геопространственными приложениями, подпадающими под категорию больших данных.Он исследует новые тенденции в сборе геопространственных данных, такие как гео-краудсорсинг и передовые технологии сбора данных, такие как облака точек LiDAR. В книге представлен ряд тем, касающихся методов и технологий больших данных в геоинформатике, включая распределенные вычисления, аналитику геопространственных данных, социальные сети и географическую информацию, предоставляемую добровольцами. Большие данные: методы и технологии в геоинформатике решают эти проблемы, объединяя охват методов и технологий для хранения, управления и вычисления больших геопространственных данных.”

Разработка приложений с интенсивным использованием данных; Основные идеи, лежащие в основе надежных, масштабируемых и обслуживаемых систем

«В этом практическом и исчерпывающем руководстве автор Мартин Клеппманн поможет вам ориентироваться в этом разнообразном ландшафте, исследуя плюсы и минусы различных технологий обработки и хранения данных. Программное обеспечение постоянно меняется, но основные принципы остаются неизменными. Из этой книги инженеры-программисты и архитекторы узнают, как применять эти идеи на практике и как в полной мере использовать данные в современных приложениях.Загляните под капот систем, которые вы уже используете, и узнайте, как использовать и управлять ими более эффективно ».

Большие данные для чайников

«Управление большими данными — одна из основных задач, стоящих перед бизнесом, промышленностью и некоммерческими организациями. Наборы данных, такие как транзакции клиентов для мегамаркетинга, погодные условия, отслеживаемые метеорологами, или активность в социальных сетях, могут быстро превзойти возможности традиционных инструментов управления данными.Если вам нужно разрабатывать решения для больших данных или управлять ими, вы оцените, как эти четыре эксперта определяют, объясняют и проводят вас через эту новую и часто сбивающую с толку концепцию. Вы узнаете, что это такое, почему это важно и как выбирать и внедрять эффективные решения. Большие данные для чайников избавляют от путаницы и помогают вам взять на себя ответственность за решения для больших данных для вашей организации ».

Большие данные: принципы и лучшие практики масштабируемых систем данных в реальном времени

«Big Data учит создавать системы больших данных с использованием архитектуры, специально разработанной для сбора и анализа данных веб-масштаба.В этой книге представлена ​​Lambda-архитектура — масштабируемый и простой для понимания подход, который может быть построен и реализован небольшой командой. Вы изучите теорию систем больших данных и способы их применения на практике. Помимо знакомства с общей структурой обработки больших данных, вы познакомитесь с конкретными технологиями, такими как базы данных Hadoop, Storm и NoSQL. Эта книга не требует предварительного знакомства с крупномасштабным анализом данных или инструментами NoSQL. Полезно знакомство с традиционными базами данных ».

Стратегия данных: как получить прибыль из мира больших данных, аналитики и Интернета вещей

«Стратегия данных Бернарда Марра — обязательное руководство для создания надежной стратегии обработки данных.Объясняя, как определить ваши стратегические потребности в данных, какие методы использовать для сбора данных и, что наиболее важно, как преобразовать ваши данные в организационные идеи для улучшения принятия бизнес-решений и повышения производительности, это важное чтение для всех, кто стремится использовать ценность своих бизнес-данных и получить конкурентное преимущество. Data Strategy, наполненная тематическими исследованиями и примерами из реальной жизни, советами о том, как развить компетенцию в области данных в организации, а также критически важным освещением того, как сделать так, чтобы ваши данные не стали помехой, предоставит любой организации инструменты и стратегии, необходимые для получать прибыль от больших данных, аналитики и Интернета вещей.”

Большие данные: использование SMART больших данных, аналитики и показателей для принятия более эффективных решений и повышения производительности

«Вокруг больших данных столько шума. Нам всем нужно знать, что это такое и как работает — это очевидно. Но достаточно ли базового понимания теории, чтобы придерживаться ее на стратегических встречах? Вероятно. Но что отличает вас от остальных, так это то, что вы знаете, как ИСПОЛЬЗОВАТЬ большие данные для получения надежных, реальных бизнес-результатов — и применять их для повышения производительности.Большие данные дадут вам четкое понимание, схему и пошаговый подход к построению вашей собственной стратегии больших данных. Это очень необходимое практическое введение в практическое применение темы. Проиллюстрированный многочисленными реальными примерами из различных компаний и организаций, Big Data проведет вас через пять шагов модели SMART: начать со стратегии, измерить показатели и данные, применить аналитику, сообщить результаты, преобразовать ».

Большие данные на практике: как 45 успешных компаний использовали аналитику больших данных для достижения выдающихся результатов

«От технологий, средств массовой информации и розничной торговли до спортивных команд, государственных учреждений и финансовых институтов — узнайте о реальных стратегиях и процессах, используемых для изучения клиентов, улучшения производства, стимулирования инноваций, повышения безопасности и многого другого.Каждая глава организована для удобной навигации и имеет одинаковую структуру, чтобы быстро предоставить вам необходимую информацию. Для каждой из описанных компаний узнайте, какие данные использовались, какие проблемы они решали и какие процессы применяли, чтобы сделать их практичными, а также технические детали, проблемы и уроки, извлеченные из каждого уникального сценария ».

Большая книга информационных панелей: визуализация данных с использованием реальных бизнес-сценариев

«Состоит из десятков примеров, касающихся различных отраслей и отделов (здравоохранение, транспорт, финансы, человеческие ресурсы, маркетинг, обслуживание клиентов, спорт и т. Д.)) и различных платформ (печать, настольный компьютер, планшет, смартфон и дисплей в конференц-зале). Большая книга информационных панелей — единственная книга, которая сочетает отличные информационные панели с реальными бизнес-сценариями. Если вы составите книгу на основе этих сценариев и предложите практические и эффективные примеры визуализации, Большая книга информационных панелей станет надежным ресурсом, который вы откроете, когда вам понадобится создать эффективную информационную панель для бизнеса ».

Learning Spark: молниеносный анализ больших данных

«Объем данных во всех областях увеличивается.Как с этим можно эффективно работать? Эта книга, недавно обновленная для Spark 1.3, представляет Apache Spark, кластерную вычислительную систему с открытым исходным кодом, которая позволяет быстро писать и запускать аналитику данных. Со Spark вы можете быстро обрабатывать большие наборы данных с помощью простых API-интерфейсов на Python, Java и Scala. Эта версия включает новую информацию о Spark SQL, Spark Streaming, настройке и координатах Maven. Написанная разработчиками Spark, эта книга поможет специалистам по обработке данных и инженерам приступить к работе в кратчайшие сроки.Вы узнаете, как выполнять параллельные задачи с помощью всего нескольких строк кода, и охватить приложения от простых пакетных заданий до потоковой обработки и машинного обучения ».

Большие данные в действии: развенчивая мифы, раскрывая возможности

«Когда термин« большие данные »впервые появился на сцене, автор бестселлеров Том Дэвенпорт (« Конкуренция в аналитике, аналитика в работе ») подумал, что это просто еще один пример технологической ажиотажа. Но его исследования в последующие годы изменили его мнение.Эта книга, содержащая десятки примеров компаний, включая UPS, GE, Amazon, United Healthcare, Citigroup и многие другие, поможет вам воспользоваться всеми возможностями — от улучшения решений, продуктов и услуг до укрепления отношений с клиентами. Он покажет вам, как заставить большие данные работать в вашей организации, чтобы вы тоже могли использовать всю мощь этого постоянно развивающегося нового ресурса ».

Наука о данных и аналитика больших данных: обнаружение, анализ, визуализация и представление данных

«Наука о данных и аналитика больших данных — это использование возможностей данных для получения новых идей.Книга охватывает широкий спектр действий, методов и инструментов, которые используют специалисты по данным. Содержимое сосредоточено на концепциях, принципах и практических приложениях, применимых к любой отрасли и технологической среде, а обучение поддерживается и объясняется примерами, которые вы можете воспроизвести с помощью программного обеспечения с открытым исходным кодом. Начни обнаруживать, анализировать, визуализировать и осмысленно представлять данные уже сегодня! »

Большие данные для начинающих: понимание SMART больших данных, интеллектуального анализа данных и аналитики данных для повышения эффективности бизнеса, принятия жизненных решений и многого другого (данные… компьютерное программирование, взлом роста, ITIL)

«Большие данные для начинающих!» Ускоренный курс для начинающих по пониманию и интерпретации больших данных! Готовы ли вы узнать, как понять SMART Big Data, интеллектуальный анализ данных и аналитику данных для повышения эффективности бизнеса, принятия жизненных решений и многого другого? Если так, то вы пришли в нужное место — независимо от того, насколько мало у вас опыта! Вот предварительный обзор того, что такое большие данные для начинающих! Содержит … Загадка под названием «большие данные». Как лучше понять большие данные. Что большие данные могут сделать для вас? Понимание аналитики (и важности) препятствий и важности ситуации с большими данными Мы внимательно изучаем ключевые проблемы, связанные с большими данными, которые создают ценность для бизнеса с помощью интеллектуального анализа данных и многого другого! »

Слишком большой, чтобы игнорировать: экономическое обоснование для больших данных (Wiley и SAS Business Series)

«Большие данные — это не временное увлечение.Фактически, в ближайшие годы он будет только усиливаться, и его последствия для будущего бизнеса невозможно переоценить. «Слишком большой, чтобы игнорировать» объясняет, почему большие данные так важны. Саймон дает здравые советы без жаргона людям и организациям, которые хотят понять и использовать большие данные. Книга, наполненная тематическими исследованиями, примерами, анализом и цитатами реальных практиков в области больших данных, обязательна к прочтению для руководителей компаний, владельцев компаний, лидеров отрасли и бизнес-профессионалов.”

Кадровая аналитика в эпоху больших данных: изменение способов привлечения, приобретения, развития и удержания талантов

«Аналитика персонала в эпоху больших данных» — это план для использования вашего кадрового резерва с помощью аналитики данных. Эта книга, написанная глобальным вице-президентом по бизнес-аналитике и прогнозной аналитике Monster Worldwide, наполнена полезными идеями, которые помогут вам найти, нанять, приобрести, привлечь, удержать, продвигать и управлять исключительными талантами, в которых нуждается ваша организация.Благодаря уникальному подходу, который применяет аналитику к каждому этапу процесса найма и всего цикла планирования и управления персоналом, это информативное руководство обеспечивает ключевую перспективу, которая делает аналитику в HR действительно полезным способом ».

Большие данные, большая аналитика: новые тенденции бизнес-аналитики и аналитики для современного бизнеса

«Доступность больших данных, недорогого аппаратного обеспечения и нового программного обеспечения для управления информацией и аналитики стало уникальным моментом в истории бизнеса.Конвергенция этих тенденций означает, что у нас есть возможности, необходимые для быстрого и экономичного анализа потрясающих наборов данных, впервые в истории. Эти возможности не являются ни теоретическими, ни тривиальными. Они представляют собой настоящий скачок вперед и открывают возможность добиться огромных успехов с точки зрения эффективности, производительности, доходов и прибыльности. Эра больших данных наступила, и это поистине революционные времена. В этой своевременной книге рассматриваются передовые компании, поддерживающие захватывающее новое поколение бизнес-аналитики.”

Этика больших данных: баланс риска и инноваций

«Каковы правила вашей организации по созданию и использованию огромных наборов данных, полных личной информации? В этой книге рассматриваются этические вопросы, возникающие в связи с феноменом больших данных, и объясняется, почему предприятиям необходимо пересматривать бизнес-решения, касающиеся конфиденциальности и идентификации. Авторы Корд Дэвис и Дуг Паттерсон предлагают методы и приемы, которые помогут вашему бизнесу провести прозрачное и продуктивное этическое исследование ваших текущих методов обработки данных.Из этой книги вы узнаете, как согласовать свои действия с четко сформулированными ценностями компании и сохранить доверие клиентов, партнеров и заинтересованных сторон ».

От больших данных к большой прибыли: успех с данными и аналитикой

«В книге« От больших данных к большой прибыли »Рассел Уокер исследует использование больших данных для стимулирования инноваций в области операционной эффективности и роста бизнеса. Уокер исследует природу больших данных и то, как компании могут использовать их для создания новых возможностей монетизации.Используя тематические исследования Apple, Netflix, Google, LinkedIn, Zillow, Amazon и других лидеров по использованию больших данных, Уокер исследует, как цифровые платформы, такие как мобильные приложения и социальные сети, меняют характер взаимодействия с клиентами и способы использования больших данных. создается и используется компаниями. Такие изменения, как указывает Уокер, потребуют тщательного рассмотрения юридических и негласных методов ведения бизнеса, поскольку они влияют на конфиденциальность потребителей ».

Аналитика в мире больших данных: Основное руководство по науке о данных и ее приложениям (Wiley и SAS Business Series)

«Книга основана на опыте автора Барта Басенса в вопросах больших данных, аналитики и ее приложений в электронной среде.г. кредитный риск, маркетинг и мошенничество, чтобы предоставить четкую дорожную карту для организаций, которые хотят использовать аналитику данных в своих интересах, но нуждаются в хорошей отправной точке. Компания Baesens провела обширное исследование больших данных, аналитики, управления взаимоотношениями с клиентами, веб-аналитики, обнаружения мошенничества и управления кредитными рисками и использует этот опыт, чтобы внести ясность в сложную тему. Для организаций, желающих расширить свои возможности с помощью аналитики данных, этот ресурс является справочным материалом по использованию данных для расширения бизнес-возможностей.”

Большие данные, интеллектуальный анализ данных и машинное обучение: создание ценности для бизнес-лидеров и практиков (Wiley и SAS Business Series)

«Большие данные — это большой бизнес. Но наличия данных и вычислительной мощности для их обработки недостаточно для получения значимых результатов. Большие данные, интеллектуальный анализ данных и машинное обучение: создание ценности для бизнес-лидеров и специалистов-практиков — это полный ресурс для руководителей в области технологий и маркетинга, стремящихся преодолеть ажиотаж и добиться реальных результатов, которые позволят достичь чистой прибыли.Предлагая увлекательный и подробный обзор текущего состояния аналитики больших данных и растущей тенденции к высокопроизводительным вычислительным архитектурам, книга представляет собой подробный взгляд на то, как можно использовать аналитику больших данных для содействия позитивным изменениям и повышения эффективности ».

Бизнес, основанный на больших данных: как использовать большие данные, чтобы привлечь клиентов, превзойти конкурентов и увеличить прибыль

«Бизнес, основанный на больших данных: как использовать большие данные для привлечения клиентов, опередить конкурентов и увеличения прибыли», доказывает, что большие данные реальны, а не просто шумиха.Лучшая информация позволяет принимать более обоснованные решения, лучше ориентироваться и расширять охват. Большие данные стали незаменимым инструментом для наиболее эффективных маркетологов в бизнесе, и они перестают быть конкурентным преимуществом и больше похожи на отраслевой стандарт. Чтобы оставаться актуальным по мере развития рынка, необходимо полное понимание и применение больших данных, а бизнес, основанный на больших данных, предоставляет практические рекомендации, которые нужны бизнесу ».

Маркетинг больших данных: более эффективное взаимодействие с клиентами и повышение ценности

«Многие современные компании попадают в ловушку внутренних данных, парализованных внутренними разрозненными хранилищами и применяющими устаревшие маркетинговые подходы.В результате потребители теряют терпение, акционеры требуют роста и дифференциации, а маркетологи вынуждены пытаться распутать огромный беспорядок. Маркетинг больших данных представляет собой стратегический план действий для руководителей, которые хотят избавиться от хаоса и начать создавать конкурентные преимущества и рост выручки. Используя реальные примеры, нетехнический язык, дополнительные загружаемые ресурсы и здоровую дозу юмора, маркетинг больших данных поможет вам открыть для себя средство, предлагаемое маркетингом на основе данных.”

Большие данные для бизнеса: полное руководство по пониманию науки о данных, аналитики данных и интеллектуального анализа данных для ускорения роста и улучшения бизнеса (серия книг по аналитике данных)

«Большие данные для бизнеса: полное руководство по пониманию науки о данных, аналитики данных и интеллектуального анализа данных для ускорения роста и улучшения бизнеса. Это ваше необходимое руководство, чтобы изучить и узнать о влиянии больших данных на бизнес, а также понять, как вы можете начать формировать идеи о том, как вы можете использовать их для роста своего бизнеса.Итог: чего вы ждете? Начните сегодня, сделав самые разумные инвестиции, которые вы только можете сделать. Инвестиции в себя, свои знания и рост своего бизнеса ».

Архитектура данных: учебник для специалистов по данным: большие данные, хранилище данных и хранилище данных

«Сегодня мир пытается создавать и обучать специалистов по данным из-за феномена больших данных. И все глубоко изучают эту технологию. Но никто не смотрит на более широкую архитектурную картину того, как большие данные должны вписываться в существующие системы (системы хранилищ данных).Взгляд на более широкую картину, в которую вписываются большие данные, дает специалисту по обработке данных необходимый контекст для того, как части головоломки должны сочетаться друг с другом. Большинство ссылок на большие данные рассматривают только одну крошечную часть гораздо большего целого. Пока собранные данные не будут помещены в существующую структуру или архитектуру, они не могут быть использованы в полной мере. Архитектура данных a Primer for Data Scientist обращается к более широкой архитектурной картине того, как большие данные сочетаются с существующей информационной инфраструктурой, что является важной темой для специалиста по данным.”

Как заставить большие данные работать для вашего бизнеса

«Большие данные произвели революцию в способах ведения бизнеса. Сегодня важные бизнес-решения могут быть основаны на огромном количестве данных, имеющихся в нашем распоряжении. Однако, хотя большие данные могут показаться ответом на любую бизнес-проблему, для многих получение реальной ценности из данных — получение бизнес-информации — сложная задача. Большие данные для многих сами по себе являются большой проблемой, и многие из них пытаются получить обещанные им награды.В этом доступном и вдохновляющем руководстве Судхи Синха, эксперт в области управления, технологий и устойчивого развития, предлагает уникальный взгляд на большие данные и способы извлечения из них максимальной выгоды — с помощью точной и тщательной аналитики ».

Ознакомьтесь с дополнительными ресурсами:

Тимоти Кинг

Тимоти — старший редактор Solutions Review. Он является признанным идейным лидером и влиятельным лицом в области корпоративного бизнес-анализа и анализа данных. Тимоти был назван журналом Richtopia одним из ведущих бизнес-журналистов мира.Совок? Имя, инициалы, фамилия на solutionsreview dot com.

Последние сообщения Тимоти Кинга (посмотреть все)

.

10 лучших книг по науке о данных и вычислениям больших данных

Область больших данных продолжает расти вместе с современными технологиями. Существует большой спрос на специалистов по данным, которые знают, что делают и любят работать в среде больших данных.

Но чтобы попасть в эту область, требуется обширная практика и желание продолжать учиться. К счастью, есть множество книг по большим данным, которые вы можете использовать, чтобы погрузиться в эту область.

В недавнем посте я рассказал о лучших книгах по машинному обучению, касающихся больших данных.Но в этой статье я расскажу о 10 лучших книгах для разработчиков больших данных и специалистов по данным любого уровня подготовки.

Лучшее введение в области науки о данных

Многие люди хотят изучать науку о данных, не вдаваясь в технические подробности. Если у вас нет предварительных знаний и вы хотите начать работу, я бы порекомендовал Data Smart от Джона Формана.

Стиль письма Джона очень непринужденный, и в целом книга насчитывает более 400 страниц с подробными объяснениями, упражнениями и тематическими исследованиями для начинающих специалистов по данным, которые разбираются в этой теме.

Основы больших данных

Каждый должен с чего-то начинать, и Big Data Essentials — отличное место для начала. Книга очень доступна по цене и охватывает идеи больших данных всего на 220 страницах.

Независимо от того, рассматриваете ли вы науку о данных как карьеру или просто хотите чем-то заняться, эта книга познакомит вас с жаргоном и методологиями анализа больших данных. Стиль письма невероятно прост, и каждая глава читается как исследовательская работа.

Вы узнаете об облачных вычислениях, базах данных NoSQL и распределенных системах, которые совместно используют большие объемы данных. Если вы прочитаете каждую главу в этой книге, вы уйдете с гораздо более глубоким пониманием того, как большие данные работают в реальном мире.

Это не совсем практическая книга, хотя по всему тексту есть несколько пошаговых упражнений.

Но это книга, в большей степени основанная на теории, и она идеально подходит для всех, кто хочет понять концепции больших данных в современном мире.

Введение в науку о данных

Вот еще одна фантастическая вводная книга для специалистов по данным, которые также интересуются программированием. Издание «Введение в науку о данных», изданное Мэннингом, — очень качественная книга, как и большинство других их изданий.

Более 320 страниц вы будете работать с Python для изучения больших данных с помощью сторонних библиотек и пользовательских скриптов. Авторы преподают большие данные с практической точки зрения, так что вы получите настоящее понимание того, как работают большие данные и как работают специалисты по данным.

Различные упражнения охватывают разные темы от машинного обучения до социальных сетей и анализа больших данных. Это очень практичная книга, которая научит вас реальным рабочим процессам для карьеры в области науки о данных.

Однако у вас должен быть некоторый опыт работы с Python, прежде чем вы начнете читать эту книгу. Многие библиотеки больших данных работают на самых популярных языках, и Python — отличный выбор.

Но если у вас уже есть опыт программирования на другом языке, вы можете попробовать изучить Python, работая над этими уроками.Я бы не советовал эту стратегию, но она определенно возможна, если вы преданы делу.

Большие данные

Это еще одна невероятная книга Мэннинга, нацеленная на более широкую картину структур больших данных. В Big Data вы узнаете о приложениях реального времени и больших приложениях на основе баз данных, таких как магазины электронной торговли.

Каждая глава посвящена отдельной области — от моделирования данных до хранения и анализа. Во многих главах также есть подробные упражнения по работе с фреймворками больших данных, такими как Hadoop, Apache Storm, Cassandra и другими механизмами баз данных NoSQL.

Но вам действительно не нужно быть экспертом в каком-либо из этих инструментов, прежде чем брать книгу. Это одна из наиболее технических книг, которая по-прежнему предназначена для новичков с небольшим опытом работы с большими данными.

Стиль написания изысканный, и авторы стараются, чтобы все было достаточно простым для понимания независимо от фона.

Однако было бы упущением игнорировать технические сложности каждого урока. Вы можете обойтись без особых знаний в области ИТ, но, безусловно, поможет, если у вас есть опыт работы с базами данных NoSQL или Hadoop / Scala.

Большие данные для начинающих

Хотя эта книга предназначена для начинающих, я удивлен, как много деталей вы получаете в каждой главе. На 150 страницах Big Data For Beginners объясняются основы работы с большими данными с нетехнической точки зрения.

Эта книга может быть идеальным вариантом для менеджеров и продавцов, которым необходимо разбираться в больших данных в корпоративной корпорации, не вдаваясь в подробности. Но это также хорошая книга для начинающих исследователей данных, которые просто не знают, с чего начать с большими данными.

В каждой главе не так много примеров или подробностей, поэтому вам захочется большего. Однако, что касается базового введения, я очень доволен этой книгой и тем, что она предлагает.

Если вы ищете вводную книгу с немного большим «толчком», я бы, вероятно, порекомендовал «Введение в науку о данных» вместо этой.

Рассказывание историй с помощью данных

С большими наборами данных проще использовать инструменты визуализации для выявления тенденций и графической демонстрации этих идей.Но с чего начать, имея такое количество инструментов?

Storytelling with Data — это книга из 288 страниц, полная ресурсов больших данных для визуализации и коммуникации. Вы узнаете, как интерпретировать большие наборы данных и как преобразовывать их в презентации, которые упростят использование данных.

Вы узнаете все факторы, которые влияют на рассказывание историй, зная свою аудиторию, понимая контекст ваших данных и научившись выбирать лучшие графические представления на основе того, что вы показываете.Наука о данных — это не только математика, но и представление и коммуникация.

Если вы надеетесь заняться наукой о данных или хотите улучшить свою текущую работу в области больших данных, эту книгу необходимо прочитать. В нем рассказывается обо всех визуальных компонентах, о которых вы редко думаете, когда только начинаете. Вы получите примеры и полезные советы, которые помогут вам превратиться из новичка в области больших данных в более компетентного специалиста по данным.

Большие данные в действии

Если вы не знаете, что такое большие данные и почему они могут повлиять на ваш бизнес, тогда Big Data at Work — это самая первая книга, которую вы должны прочитать.Он написан опытным аналитиком данных Томом Дэвенпортом на 228 страницах, посвященных большим данным в современном мире.

Вы узнаете, откуда пришли большие данные и почему они так важны в наше время. Вы также узнаете, как большие данные связаны с реальными показателями, такими как продажи, конверсии и техническая поддержка клиентов. Изучая данные, вы можете точно определить возможности и потенциальные дыры в своем бизнес-плане.

Эта книга объединяет технологии больших данных с бизнес-аспектами ведения бизнеса.Стиль письма очень разговорный, поэтому он подходит для широкой аудитории владельцев бизнеса и специалистов по данным.

Plus автор использует реальные примеры таких крупных корпораций, как UPS, GE и Citigroup.

Неважно, что вы продаете или какой тип клиентов вы обслуживаете, эта книга — безупречное введение в большие данные для реального мира.

Наука о данных для бизнеса

Эта книга очень похожа на предыдущую, за исключением того, что она намного длиннее и техничнее.

Data Science for Business учит, как большие данные могут использоваться для отслеживания показателей и улучшения определенных KPI независимо от бизнес-целей.

Авторы действительно заставляют задуматься о науке о данных с практической точки зрения. Вы узнаете об основах интеллектуального анализа данных и об инструментах, которые можно использовать для улучшения процесса интеллектуального анализа данных.

Вы также узнаете, как подходить к бизнес-задачам с научной точки зрения, используя данные для резервного копирования ваших решений. Используется ли это для вашего собственного или для чужого бизнеса, инструменты и методы, описанные в этой книге, работают одинаково.

Если вы ищете работу аналитика данных, в этой книге также есть советы по собеседованию и примеры вопросов, которые могут вам задать работодатели. Это одна из лучших вводных книг для изучения науки о данных и ее применения в коммерческих предприятиях, в которой содержится более 400 страниц методов науки о данных.

Data Smart: использование науки о данных для преобразования информации в Insight

Многие компании используют анализ данных для планирования будущего и выявления потенциальных тенденций.Это применимо к любой вообразимой метрике, однако это настолько расплывчатое понятие, что сложно начать.

Data Smart — это вводная книга на 430 страниц, написанная аналитиком данных Джоном Форманом. Он пишет в очень естественном стиле, который нравится любому, от маркетинга до продаж или руководству организации.

В этой книге вы будете работать с данными в электронных таблицах и узнаете, как систематизировать, сортировать шаблоны, фильтровать большие пакеты данных и анализировать эти данные на предмет проблем или распространенных явлений.Отсюда вы научитесь критически относиться к таким данным. Что это значит? Как вы можете использовать данные для улучшения определенных показателей?

Признанные бизнес-показатели — это еще не все. Но большинство точек данных основаны на показателях, и они являются лучшими точками в вашем распоряжении для специалистов по данным, которые могут выполнять свою работу.

Эту книгу долго читают, но это одна из лучших книг для погружения в практическую науку о данных. Не имеет значения, в какой сфере вы работаете и каковы ваши цели. Эта книга поможет вам понять большие данные и науку о данных с нуля.

Большие данные на практике

Примеры из практики могут быть столь же полезны, как и личный опыт, потому что они помогают понять через истории из вторых рук. В книге «Большие данные на практике» вы получите 45 уникальных тематических исследований от корпораций и небольших специалистов по обработке данных, работающих на платформах больших данных.

Вы узнаете всевозможные удобные приемы у таких крупных компаний, как Walmart, Apple, Microsoft и других известных компаний индустрии моды и развлечений.Большие данные пронизывают весь земной шар и предлагают решения, которые никогда не были возможны с такими подробностями.

К сожалению, эта книга не является учебником для практических занятий. Вы не научитесь создавать что-либо самостоятельно и не научитесь каким-либо конкретным инструментам для работы с большими данными.

Но вы узнаете много полезных советов, рабочих процессов и предложений от экспертов по данным и от крупных брендов со всего мира. Вы узнаете, как большие данные используются в корпорациях и как можно применять аналогичные методы в своей работе.

Это очень забавная книга, и ее на удивление быстро читают. Но я думаю, что это еще лучше сочетается с такой практической книгой, как Big Data.

От больших данных к большой прибыли

.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *