Web Scraping com Python – 3a EdiÃ§ÃŖo: Coletando dados da web moderna, EdiÃ§ÃŖo 3

¡ Novatec Editora
āļ‰-āļ´āˇœāļ­
384
āļ´āˇ’āļ§āˇ”
āˇƒāˇ”āļ¯āˇ”āˇƒāˇ”āļšāļ¸āˇŠ āļŊāļļāļē⎒

āļ¸āˇ™āļ¸ āļ‰-āļ´āˇœāļ­ āļœāˇāļą

Se a programaÃ§ÃŖo Ê como mÃĄgica, entÃŖo o web scraping Ê certamente uma forma de aplicaÃ§ÃŖo dessa mÃĄgica. Ao escrever um programa automatizado simples, vocÃĒ pode consultar servidores da web, solicitar dados e analisÃĄ-los para extrair as informaçÃĩes necessÃĄrias. Esta terceira ediÃ§ÃŖo, totalmente atualizada, nÃŖo sÃŗ apresenta vocÃĒ ao web scraping, mas tambÊm serve como um guia abrangente para coletar quase todos os tipos de dados disponíveis na web. A Parte I deste livro tem como foco os princípios bÃĄsicos do web scraping: como utilizar Python para solicitar informaçÃĩes de um servidor web, realizar o tratamento bÃĄsico da resposta do servidor e começar a interagir com sites de forma automatizada. A Parte II explora uma variedade de ferramentas e aplicaçÃĩes mais específicas para se adequar a qualquer cenÃĄrio de web scraping que vocÃĒ provavelmente encontrarÃĄ. Este livro mostra como: â€ĸFazer o parsing de pÃĄginas HTML complexas â€ĸDesenvolver crawlers com o framework Scrapy â€ĸAprender mÊtodos para armazenar os dados coletados â€ĸLer e extrair dados de documentos â€ĸLimpar e normalizar dados mal formatados â€ĸLer e escrever linguagens naturais â€ĸRastrear formulÃĄrios e logins â€ĸFazer o scraping de JavaScript e rastrear APIs â€ĸUtilizar e escrever software de conversÃŖo de imagem em texto â€ĸEvitar armadilhas de scraping e bloqueadores de bots â€ĸUtilizar scrapers para realizar testes em seu site "Trata-se de um livro excelente e informativo, que ensina e prepara o leitor para fazer web scraping de forma consciente e eficaz. Eu o recomendaria a todos aqueles que desejam coletar dados de sites ou que planejam criar um site para compartilhamento de dados." —Michael Hopkins P.Geo., PMP

āļšāļģ⎊āļ­āˇ˜ āļ´āˇ’⎅⎒āļļāļŗ

Ryan Mitchell, engenheira de software sÃĒnior na GLG, Ê especialista em web scraping, segurança na web e ciÃĒncia de dados. Ela jÃĄ organizou workshops e palestrou em diversos eventos, como Data Day e DEF CON, alÊm de ter ensinado programaÃ§ÃŖo web e ciÃĒncia de dados e prestado consultoria em vÃĄrias instituiçÃĩes. Ryan tambÊm Ê autora do livro Instant Web Scraping with Java (Packt Publishing).

āļ¸āˇ™āļ¸ āļ‰-āļ´āˇœāļ­ āļ…āļœāļēāļąāˇŠāļą

āļ”āļļ āˇƒāˇ’āļ­āļą āļ¯āˇ™āļē āļ…āļ´āļ§ āļšāˇ’āļēāļąāˇŠāļą.

āļšāˇ’āļē⎀⎓āļ¸āˇš āļ­āˇœāļģāļ­āˇ”āļģ⎔

⎃⎊āļ¸āˇāļģ⎊āļ§āˇŠ āļ¯āˇ”āļģāļšāļŽāļą āˇƒāˇ„ āļ§āˇāļļ⎊āļŊāļ§āˇŠ
Android āˇƒāˇ„ iPad/iPhone ⎃āļŗāˇ„āˇ Google Play āļ´āˇœāļ­āˇŠ āļē⎙āļ¯āˇ”āļ¸ āˇƒāˇŠāļŽāˇāļ´āļąāļē āļšāļģāļąāˇŠāļą. āļ‘āļē āļ”āļļ⎚ āļœāˇ’āļĢ⎔āļ¸ āˇƒāļ¸āļŸ āˇƒāˇŠāˇ€āļēāļ‚āļšāˇŠâ€āļģ⎓āļē⎀ ⎃āļ¸āļ¸āˇ”⎄⎔āļģ⎊āļ­ āļšāļģāļą āļ…āļ­āļģ āļ”āļļāļ§ āļ•āļąāˇ‘āļ¸ āļ­āˇāļąāļš āˇƒāˇ’āļ§ āˇƒāļļ⎐āļŗāˇ’⎀ āˇ„āˇ āļąāˇœāļļ⎐āļŗāˇ’⎀ āļšāˇ’āļē⎀⎓āļ¸āļ§ āļ‰āļŠ āˇƒāļŊ⎃āļē⎒.
āļŊ⎐āļ´āˇŠāļ§āˇœāļ´āˇŠ āˇƒāˇ„ āļ´āļģ⎒āļœāļĢāļš
āļ”āļļāļ§ āļ”āļļ⎚ āļ´āļģ⎒āļœāļĢāļšāļē⎚ ⎀⎙āļļ⎊ āļļāˇŠâ€āļģāˇ€āˇŠāˇƒāļģāļē āļˇāˇāˇ€āˇ’āļ­āļē⎙āļąāˇŠ Google Play āļ¸āļ­ āļ¸āˇ’āļŊāļ¯āˇ“ āļœāļ­āˇŠ āˇāˇŠâ€āļģāˇ€āˇŠâ€āļēāļ´āˇœāļ­āˇŠāˇ€āļŊāļ§ āˇƒāˇ€āļąāˇŠ āļ¯āˇ’āļē ⎄⎐āļš.
eReaders āˇƒāˇ„ ⎀⎙āļąāļ­āˇŠ āļ‹āļ´āˇāļ‚āļœ
Kobo eReaders ⎀⎐āļąāˇ’ e-ink āļ‹āļ´āˇāļ‚āļœ āļ´āˇ’⎅⎒āļļāļŗ āļšāˇ’āļē⎀⎓āļ¸āļ§, āļ”āļļ āˇ€āˇ’āˇƒāˇ’āļąāˇŠ āļœāˇœāļąāˇ”⎀āļšāˇŠ āļļāˇāļœāˇ™āļą āļ”āļļ⎚ āļ‹āļ´āˇāļ‚āļœāļēāļ§ āļ‘āļē āļ¸āˇāļģ⎔ āļšāˇ’āļģ⎓āļ¸ āˇƒāˇ’āļ¯āˇ” āļšāˇ… āļē⎔āļ­āˇ” āˇ€āˇš. āļ†āļ°āˇāļģāļšāļģ⎔ āļ‰-āļšāˇ’āļē⎀āļąāļēāļ§ āļœāˇœāļąāˇ” āļ¸āˇāļģ⎔ āļšāˇ’āļģ⎓āļ¸āļ§ āˇ€āˇ’āˇƒāˇŠāļ­āļģāˇāļ­āˇŠāļ¸āļš āļ‹āļ¯āˇ€āˇ” āļ¸āļ°āˇŠâ€āļē⎃⎊āļŽāˇāļą āļ‹āļ´āļ¯āˇ™āˇƒāˇŠ āļ…āļąāˇ”āļœāļ¸āļąāļē āļšāļģāļąāˇŠāļą.