ШТА ЈЕ ЦРАВЛНСЦРАПЕ?
ЦравлНСцрапе олакшава пузање интернетом, праћење линкова од веб локације до веб локације, завиривање ту и тамо, упознавање са етичким индексирањем интернета и ХТМЛ стругањем. Ово је право пузање кроз непознате, а можда и непознате аспекте интернета.
ЦравлНСцрапе вам дозвољава да посетите произвољне веб-сајтове да бисте извукли све податке који се тамо могу наћи – техничке делове као што су детаљи ХТМЛ кода, слике, икона, аутор, опис, кључне речи, мета подаци, подаци из образаца, медији, а посебно ИП адресе, географске Локације и везе - а још посебно - везе до других веб локација!
Уз ЦравлНСцрапе, претраживање веба је под вашом контролом. Типичном веб пописивачу, као што је Гоогле бот, дат је скуп „сеед сајтова“ и пуштен је да може да индексира и скреже. Са ЦравлНСцрапе, ви сте бот, а ЦравлНСцрапе је ваш алат за пузање и стругање. Ви контролишете избор локације за семе, које сајтове ћете посетити и које податке ћете састругати.
Ако сте заинтересовани за претраживање интернета и стругање веб локација, требало би да уживате у раду са овом апликацијом. Може бити досадно док се не упознате са одабиром | Цопи | Налепите на свој уређај, како да користите Тхе Стацк, док се не прилагодите темпу пузања! и док не откријете које су веб локације „добре семе“ за ваша интересовања – пожељно оне са много веза ван сајта.
ЕТИЧКО СКРЕПАЊЕ ХТМЛ-а...
Веб пописивач треба да поштује правила која поставља роботс.ткт. ЦравлНСцрапе вам даје алате за рад на овај начин. ХТМЛ сцрапинг је као и сваки други алат - можете га користити за добре ствари, а можете га користити за лоше ствари. То што ХТМЛ стругање само по себи није противзаконито не значи да можете да скидате било коју веб локацију коју желите. Неки сајтови изричито забрањују екстракцију података путем датотеке роботс.ткт или њихове странице са условима коришћења услуге. ЦравлНСцрапе вам даје алате за преузимање и проучавање датотеке роботс.ткт, тако да можете да изаберете да посетите или не посећујете појединачне сајтове, као и да скрежете или не стружете различите фасцикле и датотеке, према потреби.
ДЕЕП ВЕБ!
Помоћу ЦравлНСцрапе-а можете прикупити УРЛ-ове страница на којима ћете можда желети да издвојите ХТМЛ код и податке. Са Дееп Цравлинг идеја је да претражите било коју веб страницу за везе, посебно за везе ка другим веб локацијама. Затим истражите те сајтове за даље везе, ка другим земљама, било где. Затим наставите, све дубље и дубље, у Ворлд Виде Веб.
ПОЧЕТАК...
Из уводног погледа ЦравлНСцрапе има практичне, уводне лекције за почетак. Поред тога, открићете да можете да изађете из било које друге апликације као што су Гоогле мапе, Гоогле претрага, уређивач текста и у свој омиљени прегледач, а затим се вратите на ЦравлНСцрапе, а да своје „мрвице хлеба“ нетакнуте у Стацк-у, тако да можете да идете где год да сте тамо је место за одлазак и истраживање свега што се тамо налази, са поверењем да се тамо можете поново вратити.
ПРЕГЛЕД ЈЕ ДОСТУПАН!
Ово уводно Пописивање почиње прегледом опција менија ЦравлНСцрапе тако да стекнете разумевање структуре и тока апликације. Затим почиње претраживање на хттпс://ввв.екампле.цом у Фениксу, Аризона, Сједињене Америчке Државе и обилази интернет до Стокхолма, Шведска. Након тога, можда бисте могли да преузмете ову апликацију и наставите ову турнеју кроз Стокхолм, Шведска; Лондон, Енглеска; Даблин, Ирска; и, добро, било где...
… да видите шта можете да видите
ПРАТИТЕ ОВУ ЛИНК ДА ПОЧНЕТЕ...
хттпс://мицквебсите.цом/ЦравлХелпс/АбоутЦравлНСцрапе.хтмл
Мик
МултиМИПС@гмаил.цом