الويب :: مكشطة

التحميل الان

الويب :: مكشطة الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • Perl Artistic License
  • السعر:
  • FREE
  • اسم الناشر:
  • Tatsuhiko Miyagawa
  • موقع ويب الناشر:
  • http://search.cpan.org/~miyagawa/

الويب :: مكشطة العلامات


الويب :: مكشطة وصف

مجموعة أدوات تجريف الويب باستخدام محددات HTML و CSS أو تعبيرات XPath Web :: Scraper عبارة عن مجموعة أدوات مكشطة على شبكة الإنترنت، مستوحاة من حصري روبي المكافئ. يوفر واجهة DSL-ISH لاجتياز مستندات HTML وإرجاع خطط بيانات Perl مرتبة بدقة. توفر كتل المكشطة والمعالجة طريقة لتحديد شرائح المستند لاستخراجها. يفهم CSS و HTML محددات وكذلك تعبيرات XPath.Synopsis استخدم URI؛ استخدام الويب :: مكشطة؛ # أولا، قم بإنشاء مكشطة كتلة My Tweets $ Tweets = Scraper {# تحليل الكل LIS مع الفئة "الحالة"، قم بتخزينها في تغريدات "تغريدات" الناتجة #. قمنا بتضمين مكشطة أخرى لكل سقسقة. عملية "Li.Status"، "تغريدات [] المحتوى "، الجسم => النص"؛ عملية ". نينتري التاريخ"، متى => نص "؛ عملية "A "، LINK => '@ Href'؛ } } بلدي res = $ Tweets-> كشط (URI-> جديد ("http://twitter.com/miyagawa"))؛ # النتيجة تحتوي النتيجة على صفيف تغريدات مأهولة بالسكان لبلدي Tweet (@ $ res -> {tweets}}) {print "$ tweet -> {body} $ tweet -> {{}} (link: $ tweet -> {link })\ن"؛ } متطلبات: perl.


الويب :: مكشطة برامج ذات صلة