HTMLList.

استخراج البيانات من صفحات HTML التي لديها نوع من نمط متكرر
التحميل الان

HTMLList. الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • BSD License
  • السعر:
  • FREE
  • اسم الناشر:
  • Erez Bibi
  • موقع ويب الناشر:
  • http://frontiernet.net

HTMLList. العلامات


HTMLList. وصف

استخراج البيانات من صفحات HTML التي تحتوي على نوع من نمط متكرر HTMLList هي أداة مكتوبة في Python تحاول إيجاد نمط متكرر في صفحة HTML تحتوي على نوع من القائمة (مثل Digest Page). يستخرج النص الفرعي HTML الذي يخلق النمط، وحاول استخراج معلومات مفيدة منه. الفكرة هي أنه في صفحة بيانات HTML نموذجية تحتوي على قائمة بالعناصر، سيكون هناك نمط متكرر للعين البشرية ( تنسيق الصفحة). إذا كان هذا النمط هو الأكثر انتشارا في الصفحة (سيكون هذا هو الحال في معظم الصفحات) سنكون قادرين على التعرف عليه و "كشط" البيانات ذات الصلة. متطلبات: بيثون


HTMLList. برامج ذات صلة

Tubaina.

Tubaina هو مولد كتاب مدرسي يستخدم بناء جملة بسيطة ومخرجات إما مستندات HTML أو Latex. ...

168

تحميل