使用Python搜刮網路資料的12堂實習課

· 博碩文化
4.0
1 جائزہ
ای بک
352
صفحات

اس ای بک کے بارے میں

網路爬蟲是AI範疇中,取得資料與儲存的一項重要技能,而Python是爬蟲過程中相當好用的工具


全書以簡單的Python程式為主軸,讓您可以輕鬆學會如何利用Python的模組擷取公開的網站資料、網頁內容,並建立自己的自動化爬蟲程式,增進您在網路上搜刮資料的能力與效率,是已具有Python基礎的學習者最佳的爬蟲入門工具書。


★本書特色★

✪了解網站、網頁、瀏覽器間的關係,認識爬蟲程式

✪了解網路上格式HTML/CSV/JSON/XLSX

✪使用requests模組取得網路上的資料

✪擷取及解析JSON及CSV格式資料檔案

✪利用Regular Expression及BeautifulSoup模組剖析網頁資料

✪活用Chrome開發人員工具找出網頁中特定資料的CSS選擇器內容

✪使用Selenium自動化工具擷取動態網頁

✪把擷取的資料儲存到MySQL及MongoDB資料庫

✪利用排程器做到自動化資料擷取及通知的功能

✪透過Scrapy框架建立爬蟲程式,大量搜刮資料

درجہ بندی اور جائزے

4.0
1 جائزہ

مصنف کے بارے میں


何敏煌


國立交通大學資訊科學博士,現任職於國立高雄科技大學博雅教育中心,平時除了研究KVM虛擬雲端容錯與分散式系統相關技術之外,也利用閒暇之餘致力於推廣資訊科技、Maker自學課程、與程式設計教育。 個人網站:http://drho.club

اس ای بک کی درجہ بندی کریں

ہمیں اپنی رائے سے نوازیں۔

پڑھنے کی معلومات

اسمارٹ فونز اور ٹیب لیٹس
Android اور iPad/iPhone.کیلئے Google Play کتابیں ایپ انسٹال کریں۔ یہ خودکار طور پر آپ کے اکاؤنٹ سے سینک ہو جاتی ہے اور آپ جہاں کہیں بھی ہوں آپ کو آن لائن یا آف لائن پڑھنے دیتی ہے۔
لیپ ٹاپس اور کمپیوٹرز
آپ اپنے کمپیوٹر کے ویب براؤزر کا استعمال کر کے Google Play پر خریدی گئی آڈیو بکس سن سکتے ہیں۔
ای ریڈرز اور دیگر آلات
Kobo ای ریڈرز جیسے ای-انک آلات پر پڑھنے کے لیے، آپ کو ایک فائل ڈاؤن لوڈ کرنے اور اسے اپنے آلے پر منتقل کرنے کی ضرورت ہوگی۔ فائلز تعاون یافتہ ای ریڈرز کو منتقل کرنے کے لیے تفصیلی ہیلپ سینٹر کی ہدایات کی پیروی کریں۔