Web Data Mining with Python: Discover and extract information from the web using Python (2023) (Dr. Meenakshi Srivastava)
Автор: Dr. Meenakshi Srivastava
В начале книги рассматриваются ключевые понятия веб-майндинга и его таксономия. Затем рассматриваются основы веб-скрейпинга, его применение и компоненты, а также такие темы, как юридические аспекты, связанные со скрейпингом, извлечение и предварительная обработка данных, скрейпинг динамических веб-сайтов и CAPTCHA. Книга также познакомит вас с концепцией поиска мнений и поиска веб-структур. Кроме того, в книге рассказывается об анализе веб-графов, извлечении информации из веб-страниц, веб-поиске и гиперссылках, поиске по гиперссылкам (Hyperlink Induced Topic Search, HITS) и алгоритмах разбиения, которые используются для веб-анализа. В конце книги вы узнаете о различных методах интеллектуального анализа, позволяющих обнаружить интересные закономерности использования веб-данных.