Building ETL Pipelines with Python: Create and deploy enterprise-ready ETL pipelines by employing modern methods (2023) (Brij Kishore Pandey)
Автор: Brij Kishore Pandey
В этой книге вы пройдете через весь процесс разработки ETL-конвейера данных, начиная с введения в основы конвейеров данных и создания среды разработки Python для создания конвейеров. Изучив принципы построения ETL-конвейеров и процесс разработки ET, вы будете готовы к проектированию пользовательских ETL-конвейеров. Далее вы познакомитесь с этапами процесса ETL, который включает в себя извлечение ценных данных, их преобразование, очистку, манипулирование и обеспечение целостности данных, а также загрузку обработанных данных в системы хранения. Вы также рассмотрите несколько модулей ETL на языке Python, сравните их преимущества и недостатки при построении конвейеров данных и использовании облачных инструментов, таких как AWS, для создания масштабируемых конвейеров данных.