جيرشو هتمل المحللون

محلل HTML HTML المجاني والمفتوح لنظام التشغيل Mac
التحميل الان

جيرشو هتمل المحللون الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • GPL
  • السعر:
  • FREE
  • اسم الناشر:
  • M Jericho
  • موقع ويب الناشر:
  • http://jericho.htmlparser.net/doc/index.html
  • أنظمة التشغيل:
  • Mac OS X
  • حجم الملف:
  • 1.7 MB

جيرشو هتمل المحللون العلامات


جيرشو هتمل المحللون وصف

مصدر HTML مجاني ومفتوح Jericho HTML Parser هي مكتبة Java مفتوحة المصدر مما يسمح بتحليل وتلاعب أجزاء من مستند HTML، بما في ذلك علامات Server-Side، أثناء استنساخ حرف HTML غير صالح أو غير معروف. يوفر Jericho HTML Parser أيضا وظائف تلبيدات HTML عالية المستوى. فيما يلي بعض الملامح الرئيسية "Jericho HTML Parser": وجود HTML منسق بشدة لا يتداخل مع تحليل بقية المستند، مما يجعل المكتبة مثالية للاستخدام مع HTML "العالم الحقيقي" الذي يخنق المحللين الآخرين. PHP، JSP، ASP، PSP و PSP و Mason Server معترف بها صراحة من قبل المحلل المحلل. هذا يعني أن HTML العادي لا يزال محرما بشكل صحيح حتى لو كانت هناك علامات الخادم داخلها، وهو أمر شائع على سبيل المثال عند ضبط سمات العنصر بشكل حيوي. لا يوجد حدث أو محلل محلل يعمل بالشجرة، بل يستخدم مزيجا من البحث النصي البسيط والتعرف على العلامات الفعالة وذاكرة التخزين المؤقت موضع العلامة. يتم أولا تحميل نص المستند المصدر بأكمله في الذاكرة، ثم يتم البحث عن القطاعات ذات الصلة فقط للحصول على الأحرف ذات الصلة من كل عملية بحث. مقارنة بمحفز الأشجار القائم على الأشجار مثل DOM، يمكن أن تكون متطلبات الذاكرة والموارد أفضل بكثير في حالة تحليل الأقسام الصغيرة فقط من المستند أو تعديلها. يمكن بسهولة تجاهل HTML HTML غير صحيح أو غير مؤهل، على عكس المحللين المستندة إلى الأشجار التي يجب أن تحدد كل عقدة في المستند من أعلى إلى أسفل. مقارنة بمحلل محلل تستند إلى الأحداث مثل SAX، فإن الواجهة على مستوى أعلى بكثير وأكثر بديهية، ويتم إنشاء تمثيل شجرة التسلسل الهرمي لعنصر المستند بسهولة إذا لزم الأمر. يمكن الوصول إلى وظائف البدء والنهاية في المستند المصدر لجميع القطاعات المحددة، مما يسمح بتعديل قطاعات مختارة فقط من المستند دون الحاجة إلى إعادة بناء المستند بأكمله من شجرة. يتم بسهولة الوصول إلى الصف وعمود كل موضع في المستند المصدر بسهولة. يوفر واجهة بسيطة ولكنها شاملة لتحليل ومعالجة عناصر التحكم في نموذج HTML، بما في ذلك استخراج وسكان القيم الأولية، والتحويل إلى أوضاع عرض للقراءة فقط أو بيانات العرض. يسمح تحليل عناصر التحكم في النموذج أيضا البيانات المستلمة من النموذج الذي سيتم تخزينه وعرضه بطريقة مناسبة. أنواع العلامات المخصصة يمكن تعريفها بسهولة وتسجيلا للتعرف عليها بواسطة المحلل. وظيفة مدمجة لاستخراج جميع النص من علامات HTML، ومناسبة للتغذية في محرك بحث نصي مثل Apache Lucene. وظيفة مدمجة في تقديم ترميز HTML مع تنسيق نص بسيط. الوظائف المدمجة لتنسيق شفرة المصدر HTML أن عناصر المسافات البادئة وفقا لتعميمها في التسلسل الهرمي لعنصر المستند. الوظيفة المدمجة في شفرة مصدر HTML مدمجة عن طريق إزالة جميع المساحات البيضاء غير الضرورية.


جيرشو هتمل المحللون برامج ذات صلة

الغضب WebDesign.

إنشاء صفحات ويب، واختبارها على جميع المتصفحات ونشرها مع هذا البرنامج المدهش ...

608 17.4 MB

تحميل

enkoder

enkoder - يخفي عناوين البريد الإلكتروني المنشورة على المواقع من حصادات البريد العشوائي ...

166 147 KB

تحميل