Se a programaÃ§ÃŖo Ê como mÃĄgica, entÃŖo o web scraping Ê certamente uma forma de aplicaÃ§ÃŖo dessa mÃĄgica. Ao escrever um programa automatizado simples, vocÃĒ pode consultar servidores da web, solicitar dados e analisÃĄ-los para extrair as informaçÃĩes necessÃĄrias. Esta terceira ediÃ§ÃŖo, totalmente atualizada, nÃŖo sÃŗ apresenta vocÃĒ ao web scraping, mas tambÊm serve como um guia abrangente para coletar quase todos os tipos de dados disponÃveis na web. A Parte I deste livro tem como foco os princÃpios bÃĄsicos do web scraping: como utilizar Python para solicitar informaçÃĩes de um servidor web, realizar o tratamento bÃĄsico da resposta do servidor e começar a interagir com sites de forma automatizada. A Parte II explora uma variedade de ferramentas e aplicaçÃĩes mais especÃficas para se adequar a qualquer cenÃĄrio de web scraping que vocÃĒ provavelmente encontrarÃĄ. Este livro mostra como: âĸFazer o parsing de pÃĄginas HTML complexas âĸDesenvolver crawlers com o framework Scrapy âĸAprender mÊtodos para armazenar os dados coletados âĸLer e extrair dados de documentos âĸLimpar e normalizar dados mal formatados âĸLer e escrever linguagens naturais âĸRastrear formulÃĄrios e logins âĸFazer o scraping de JavaScript e rastrear APIs âĸUtilizar e escrever software de conversÃŖo de imagem em texto âĸEvitar armadilhas de scraping e bloqueadores de bots âĸUtilizar scrapers para realizar testes em seu site "Trata-se de um livro excelente e informativo, que ensina e prepara o leitor para fazer web scraping de forma consciente e eficaz. Eu o recomendaria a todos aqueles que desejam coletar dados de sites ou que planejam criar um site para compartilhamento de dados." âMichael Hopkins P.Geo., PMP