www :: مكشطة :: Lite

إطار لإزالة النتائج من محركات البحث
التحميل الان

www :: مكشطة :: Lite الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • GPL v3
  • اسم الناشر:
  • Roger Pettett
  • موقع ويب الناشر:
  • http://search.cpan.org/~rpettett/

www :: مكشطة :: Lite العلامات


www :: مكشطة :: Lite وصف

إطار لإزالة النتائج من محركات البحث www :: SCRAPER :: LITE هي وحدة مكشطة HTTP مكتوبة في Perl.synopsis My Domain My Domain = 'http: //devsite.local/'؛ بلدي مكشطة $ = www :: scraper :: lite-> جديد ()؛ SCRAPER-> الزحف (المجال $، {'// A' => Sub {# Handler for All 'a' علاماتي (مكشطة $، العقد $) =_؛ $ scraper-> enqueue (grep {$ _ _ = ~ M {^ $ domain}} {^ $ domain} # فقط خريطة المجال {$ scraper-> url_remove_anchor ($ _)} # فقط صفحات الفهرس دون خريطة {$ scraper-> url_make_absolute ($ _)} # الفهرس يحتاج إلى خريطة url مطلق { $ _->> {HREF}} # # سحب href من "A" عقدة DOM @ {$ العقد})؛}، '/ *' => Sub {# Handler لجميع المحتوى الخاص بي (مكشطة، $ العقد) = _؛ طباعة مكشطة $ -> {الحالي} -> {استجابة} -> المحتوى؛ # افعل شيئا مفيدا مع استجابة HTTP}،})؛ متطلبات: perl. صارم تحذيرات LWP :: UserAgent HTML :: Treebuilder :: XPath


www :: مكشطة :: Lite برامج ذات صلة

lexicals.

الحصول على تجزئة من المتغيرات الحالية الخاصة بك الحالية ...

120

تحميل