PythonとScrapyを使ったWebスクレイピング

· インプレス NextPublishing
ଇବୁକ୍
99
ପୃଷ୍ଠାଗୁଡ଼ିକ

ଏହି ଇବୁକ୍ ବିଷୟରେ

本書ではWebスクレイピングを、PythonとScrapyフレームワークを利用して行うことをソースコードとともに解説します。Webサイトには多くの情報があり、ブラウザの利用だけでも取得できます。しかし、Webサイトを閲覧するという行為が能動的であり手間と時間を使うことになります。本書はPythonを使って普通のサイトからWebスクレイピングをはじめ、少しづつ難易度を高めていく実践的な内容です。

【目次】
第1章 環境構築
第2章 最初のスクレイピング
第3章 POSTメソッドがあるサイトでスクレイピング
第4章 データベースを使用する
第5章 動的画面のスクレイピング
第6章 Lazy loading画面のスクレイピング
第7章 Dropboxと連携する
第8章 Cloudサービスを使ってスクレイピング
第9章 cloudサービスで定期的実行をする

ଲେଖକଙ୍କ ବିଷୟରେ

川原 英明
ファミコンゲームの開発時代からのエンジニア。iモード登場時にはIT企業を経て、SESで大手IT企業で常駐を経験。その後はスタートアップ企業に転職。多くの案件を経験しており、対応できる開発言語は10を超える。得意言語はPerl、Python、PHP、Shell script。2021年秋からは採用関連も担当。

ପଢ଼ିବା ପାଇଁ ତଥ୍ୟ

ସ୍ମାର୍ଟଫୋନ ଓ ଟାବଲେଟ
Google Play Books ଆପ୍କୁ, AndroidiPad/iPhone ପାଇଁ ଇନଷ୍ଟଲ୍ କରନ୍ତୁ। ଏହା ସ୍ଵଚାଳିତ ଭାବେ ଆପଣଙ୍କ ଆକାଉଣ୍ଟରେ ସିଙ୍କ ହୋ‍ଇଯିବ ଏବଂ ଆପଣ ଯେଉଁଠି ଥାଆନ୍ତୁ ନା କାହିଁକି ଆନଲାଇନ୍ କିମ୍ବା ଅଫଲାଇନ୍‍ରେ ପଢ଼ିବା ପାଇଁ ଅନୁମତି ଦେବ।
ଲାପଟପ ଓ କମ୍ପ୍ୟୁଟର
ନିଜର କମ୍ପ୍ୟୁଟର୍‍ରେ ଥିବା ୱେବ୍ ବ୍ରାଉଜର୍‍କୁ ବ୍ୟବହାର କରି Google Playରୁ କିଣିଥିବା ଅଡିଓବୁକ୍‍କୁ ଆପଣ ଶୁଣିପାରିବେ।
ଇ-ରିଡର୍ ଓ ଅନ୍ୟ ଡିଭାଇସ୍‍ଗୁଡ଼ିକ
Kobo eReaders ପରି e-ink ଡିଭାଇସଗୁଡ଼ିକରେ ପଢ଼ିବା ପାଇଁ, ଆପଣଙ୍କୁ ଏକ ଫାଇଲ ଡାଉନଲୋଡ କରି ଏହାକୁ ଆପଣଙ୍କ ଡିଭାଇସକୁ ଟ୍ରାନ୍ସଫର କରିବାକୁ ହେବ। ସମର୍ଥିତ eReadersକୁ ଫାଇଲଗୁଡ଼ିକ ଟ୍ରାନ୍ସଫର କରିବା ପାଇଁ ସହାୟତା କେନ୍ଦ୍ରରେ ଥିବା ସବିଶେଷ ନିର୍ଦ୍ଦେଶାବଳୀକୁ ଅନୁସରଣ କରନ୍ତୁ।