www :: spyder.

www :: spyder هو وحدة بيرل تعمل مثل العنكبوت على شبكة الإنترنت.
التحميل الان

www :: spyder. الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • Perl Artistic License
  • السعر:
  • FREE
  • اسم الناشر:
  • Ashley Pond V.
  • موقع ويب الناشر:
  • http://search.cpan.org/~ashley/WWW-Spyder-0.18/Spyder.pm

www :: spyder. العلامات


www :: spyder. وصف

www :: Spyder هو وحدة بيرل تعمل مثل العنكبوت على شبكة الإنترنت. www :: Spyder هو وحدة بيرل تعمل مثل شبكة العنكبوت ويب على شبكة الإنترنت التي ترجع نص عادي، HTML، وغيرها من المعلومات لكل صفحة زحفت ويمكنها تحديد الصفحات التي يجب الحصول عليها وتحليلها بناء على مصطلحات مقدمة مقارنة بالنص في الروابط بالإضافة إلى محتوى الصفحة. Methods $ spyder-> جديد () بناء كائن سبايدر جديد. بدون مجموعة من البذور على الأقل، أو GO_TO_SEED () قيد التشغيل، فإن Spyder غير جاهز للزحف. $ spyder = www :: spyder-> جديد (shift || يموت "اعطني عنوان URL! N")؛ # ... أو ... $ spyder = www :: spyder-> جديد (خيارات)؛ خيارات تشمل: sleep_base (بالثواني)، exit_on (التجزئة الأساليب والإعدادات). أمثلة أدناه. $ Spyder-> SEED (URL URL $) يضيف عنوان URL (أو عناوين URL) إلى أعلى قوائم الانتظار للزحف. إذا تم إنشاء Spyder مع حجة فرعية واحدة، فإنه يعتبر seed_url. $ spyder-> الجرس () سيقوم هذا بطباعة جرس ("a") إلى Stderr على كل صفحة زحف بنجاح. قد يبدو الأمر مزعجا ولكنه وسيلة ممتازة لمعرفة أن Spyder الخاص بك يتصرف بالعمل والعمل. قيمة حقيقية تحولها. الآن لا يمكن إيقاف تشغيله. $ spyder-> spyder_time () إرجاع الثواني الخام نظرا لأن spyder تم إنشاؤها إذا أعطيت قيمة منطقية، وإرجاع خلاف ذلك "D DAY (S) HH :: MM: SS." $ شروط Spyder-> () والمزيد من الشروط، كلما زاد فهم Spyder. إذا أعطت قائمة مستقيمة من السلاسل، فسيتم تحويلها إلى Regexes مفتوحة للغاية. E.G: "الملك" سيتطابق "الكبرى" و "Kinglet" ولكن ليس "الملك". انها حساسة لحالة الأحرف الآن. إذا كنت تريد مطابقة أكثر تحديدا أو سلوكا مختلفا، فقم بتمرير Regexes الخاص بك بدلا من السلاسل. $ spyder-> الشروط (QR / BKINGINGS؟ B / I، QR / BOCEENS؟ B / I)؛ المصطلحات () غير قابلة للاستثمار مرة واحدة فقط، ثم هي صفقة تم القيام بها. $ spyder-> spyder_data () رقم تنسيق الفاصلة كيلوبايت تم استرجاعها حتى الآن. لا تعطيه حجة. انها مجموعة / الحصول على روتين. $ spyder-> ينام () إرجاع العدد الإجمالي للثواني نمت spyder أثناء التشغيل. مفيد للحصول على تعداد صفحة دقيقة / زمنية دقيقة (أداء Spyder)، خصم NAPS المجاملة المضافة. $ spyder-> UA -> ... LWP :: UserAgent. يمكنك إعادة ضبطها، وأعتقد، عن طريق الاتصال بطرق UA. فيما يلي القيم المهنية التي قد ترغب في تعديلها (انظر LWP :: UserAgent للحصول على مزيد من المعلومات): $ Spyder-> UA-> مهلة (30)؛ $ spyder-> UA-> max_size (250_000)؛ $ spyder-> ua-> الوكيل ('mozilla / 5.0')؛ تغيير اسم الوكيل يمكن أن تؤذي spyder b / c بعض الخوادم لن يرجع المحتوى إلا إذا طلب منه "المتصفح" الذي يتعرفون عليه. ربما يجب عليك إضافة الخاص بك البريد الإلكتروني مع من () كذلك. $ spyder-> ua-> من ('bluefintuna@fish.net ')؛ $ spyder-> cookie_file () يعيشون في $ env {home} / spydercookie افتراضيا ولكن يمكنك تعيين الملف الخاص بك إذا كنت تفضل أو ترغب في حفظ ملفات تعريف الارتباط المختلفة لمختلف Spyders.Requirements: بيرل


www :: spyder. برامج ذات صلة

Biblio :: داعش

Biblio :: ISIS هو وحدة بيرل لقراءة قاعدة بيانات الأقراص المدمجة / ISIS و WinISIS و ISISMARC. ...

9,635

تحميل