Data Algorithms with Spark: Recipes and Design Patterns for Scaling Up using PySpark (2022) (Mahmoud Parsian)
Автор: Mahmoud Parsian
Скорость, простота использования, сложная аналитика и многоязыковая поддержка Apache Spark делают практическое знание этой кластерной вычислительной платформы необходимым навыком для инженеров и специалистов по анализу данных. С помощью этого практического руководства любой, кто ищет введение в Spark, сможет изучить практические алгоритмы и примеры с использованием PySpark.
В каждой главе автор показывает, как решить проблему данных с помощью набора преобразований и алгоритмов Spark. Вы узнаете, как решать проблемы, связанные с ETL, паттернами проектирования, алгоритмами машинного обучения, разбиением данных и анализом геномики.