الويب :: مكشطة الترتيب والملخص
- رخصة:
- Perl Artistic License
- اسم الناشر:
- Tatsuhiko Miyagawa
- موقع ويب الناشر:
- http://search.cpan.org/~miyagawa/
الويب :: مكشطة العلامات
الويب :: مكشطة وصف
مجموعة أدوات تجريف الويب باستخدام محددات HTML و CSS أو تعبيرات XPath Web :: Scraper عبارة عن مجموعة أدوات مكشطة على شبكة الإنترنت، مستوحاة من حصري روبي المكافئ. يوفر واجهة DSL-ISH لاجتياز مستندات HTML وإرجاع خطط بيانات Perl مرتبة بدقة. توفر كتل المكشطة والمعالجة طريقة لتحديد شرائح المستند لاستخراجها. يفهم CSS و HTML محددات وكذلك تعبيرات XPath.Synopsis استخدم URI؛ استخدام الويب :: مكشطة؛ # أولا، قم بإنشاء مكشطة كتلة My Tweets $ Tweets = Scraper {# تحليل الكل LIS مع الفئة "الحالة"، قم بتخزينها في تغريدات "تغريدات" الناتجة #. قمنا بتضمين مكشطة أخرى لكل سقسقة. عملية "Li.Status"، "تغريدات [] المحتوى "، الجسم => النص"؛ عملية ". نينتري التاريخ"، متى => نص "؛ عملية "A "، LINK => '@ Href'؛ } } بلدي res = $ Tweets-> كشط (URI-> جديد ("http://twitter.com/miyagawa"))؛ # النتيجة تحتوي النتيجة على صفيف تغريدات مأهولة بالسكان لبلدي Tweet (@ $ res -> {tweets}}) {print "$ tweet -> {body} $ tweet -> {{}} (link: $ tweet -> {link })\ن"؛ } متطلبات: perl.
الويب :: مكشطة برامج ذات صلة