الخدوش

إطار للزحف واختطاف مواقع الويب متعددة الصفحات
التحميل الان

الخدوش الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • Freeware
  • السعر:
  • FREE
  • اسم الناشر:
  • Peter Jones
  • موقع ويب الناشر:
  • http://rubyforge.org/users/pjones/
  • أنظمة التشغيل:
  • Mac OS X
  • حجم الملف:
  • 38 KB

الخدوش العلامات


الخدوش وصف

إطار للزحف واختطاف مواقع الويب متعددة الصفحات على عكس أطر كشط أخرى، تم تصميم إطار اللقطات لتتمكن من العمل مع مواقع الويب "القذرة". وهذا هو، مواقع الويب التي لم تكن مصممة للحصول على بياناتها المستخرجة programmatical.scrapes تتضمن ميزات لكل من التطوير الأولي للمكتشف، ومستمر صيانة تلك الكشفية. يتم تطوير مكشطة ومرخصة بموجب شروط MIT / رخصة Consortium x. فيما يلي بعض الملامح الرئيسية ل "الخدوش": التحديد القائم على القاعدة واستخراج البيانات التي يمكن استخدام محددات CSS أو التعبيرات الزائفة XPath نظام التخزين المؤقت بحيث لا يتعين عليك تنزيل الصفحات التي تعمل باستمرار من خادم الويب أثناء تجربة المحددين والمتسارعين نظام التحقق من الصحة يساعد على اكتشاف تغييرات موقع الويب التي ستبذل خلاف ذلك قواعد الاستخراج الخاصة بك دعم لبدء جلسة مع خادم الويب، وإصدار ملفات تعريف الارتباط في الجلسة إلى خادم الويب عندما يفشل كل شيء آخر، يمكنك تشغيل صفحة ويب من خلال معالج XSLTPROC XSLT لإنشاء مستند XML يمكن تشغيله بعد ذلك من خلال المحلل المحلل القائم على القاعدة مجموعة مفيدة من طرق ما بعد المعالجة مثل Normalize_name ما الجديد في هذا الإصدار: أول إصدار عام.


الخدوش برامج ذات صلة

ons.

الموارد الرقمية مشاكل الاستخدام طويل الأجل محلول مستودع ...

156 23.6 MB

تحميل