Обработка больших данных с каждым днем приобретает все большее значение. В этой книге подробно рассматривается организация обработки больших данных с использованием аналитической операционной системы Apache Spark. Тщательно описываются процессы потребления, преобразования и публикации результатов обработки данных; продемонстрированы возможности Apache Spark при работе с разнообразными форматами исходных данных (текст, JSON, XML, СУРБД и многими другими) и при публикации результатов в разнообразных форматах. Особое внимание уделяется обработке потоковых данных, что весьма важно в современных условиях. Подробно рассмотрены организация и архитектура кластера Spark. В приложениях представлена обширная справочная информация, необходимая каждому разработчику, использующему Spark.
Книга содержит множество иллюстраций и примеров исходного кода на языке Java с подробными комментариями.
Издание предназначено для разработчиков, начинающих осваивать систему Spark.
Чтобы оставить свою оценку и/или комментарий, Вам нужно войти под своей учетной записью или зарегистрироваться
Пока никто не оставил впечатление о книге...
Пока никто не оставил цитат из этой книги...
Автор | Н. Козлова |
Жанр | Прочие издания |
Год | 2010 |
Автор | Осовицкая З., Казаринова А. |
Жанр | Прочие издания |
Год | 2007 |
Автор | |
Жанр | Прочие издания |
Год | 2007 |
Автор | |
Жанр | Прочие издания |
Год | 2020 |
Жанр | Прочие издания |
Год | 2008 |