Если у вас уже есть положительный опыт использования Spark для решения небольших задач, но вы по-прежнему ломаете голову – где та самая непревзойденная производительность Spark, позволяющая перемалывать колоссальные объемы данных – то эта книга для вас. Она расскажет, как эффективно использовать Spark для укрощения больших данных и вырасти из новичка в специалиста. Идеально подходит для программистов, инженеров по работе с данными, системных администраторов, обслуживающих крупномасштабные приложения. Предисловие 14 Глава 1. Введение в эффективный Spark 19 Глава 2. Как работает Spark 25 Глава 3. Наборы DataFrame/Dataset и Spark SQL 46 Глава 4. Соединения (SQL и Core) 95 Глава 5. Эффективные преобразования 107 Глава 6. Работа с данными типа «ключ — значение» 149 Глава 7. Выходим за рамки Scala 201 Глава 8. Тестирование и валидация 228 Глава 9. Spark MLlib и ML 246 Глава 10. Компоненты и пакеты фреймворка Spark 280 Приложение. Тонкая настройка, отладка и другие аспекты, обычно игнорируемые разработчиками 301 Название: Эффективный Spark. Масштабирование и оптимизация Автор: Карау Х., Уоррен Р. Год: 2018 Жанр: программирование Серия: Бестселлеры O’Reilly Издательство: Питер Язык: Русский Формат: pdf Качество: eBook Страниц: 352 Размер: 7 MB Скачать Карау Х., Уоррен Р. - Эффективный Spark. Масштабирование и оптимизация (2018) Ключевые теги: книга, компьютерная литература, Эффективный Spark, Масштабирование и оптимизация
Не забудь оставить отзыв о статье.
|