محلل أتش تي أم ألHTML Parser هي مكتبة Java تستخدم لتحليل HTML إما بطريقة خطية أو متداخلة. | |
التحميل الان |
محلل أتش تي أم أل الترتيب والملخص
الإعلانات
محلل أتش تي أم أل العلامات
محلل أتش تي أم أل وصف
HTML Parser هي مكتبة Java تستخدم لتحليل HTML إما بطريقة خطية أو متداخلة. HTMLPARSER هو محلل فائق السرعة في الوقت الحقيقي ل HTML في العالم الحقيقي. ما الذي جذب معظم المطورين إلى HTMLParser كانت بساطيتها في التصميم والسرعة والقدرة على التعامل مع دفق العالم الحقيقي HTML.The اثنين من حالات الاستخدام الأساسي التي يتم التعامل معها بواسطة المحلل المحلل هي الاستخراج والتحول (حالة استخدام المزامنة، حيث HTML يتم إنشاء الصفحات من نقطة الصفر، من الأفضل التعامل معها بواسطة أدوات أخرى أقرب إلى مصدر البيانات). في حين أن الإصدارات السابقة التي تركز على استخراج البيانات من صفحات الويب، فإن الإصدار 1.4 من htmlparser لديه تحسينات كبيرة في مجال تحويل صفحات الويب، مع إنشاء العلامات المبسطة والتحرير، وإخراج الأسلوب Verbatim Tohtml (). في الترتيب لاستخدام htmlparser ستحتاج لتكون قادرة على كتابة التعليمات البرمجية في لغة برمجة Java. على الرغم من أن بعض البرامج مثال يتم تزويدها والتي قد تكون مفيدة لأنها تقف، إلا أنها أكثر من المرجح أنك ستحتاج (أو تريد) إنشاء برامجك الخاصة أو تعديل تلك المقدمة لمطابقة التطبيق المقصود. لاستخدام المكتبة، ستحتاج إلى ذلك إضافة إما HTMLLEXER.JAR أو HTMLPARSER.JAR إلى ClassPath عند تجميع وتشغيله. يوفر HTMLLEXER.JAR إمكانية الوصول إلى مستوى منخفض إلى سلسلة عامة وملاحظة وعقد العلامة على الصفحة بطريقة خطية مسطحة ومتسلسلة. يوفر htmlparser.jar، الذي يتضمن الفصول الموجودة في HTMLLEXER.JAR، الوصول إلى صفحة كسلسلة من العلامات المتمايزة المتداخلة التي تحتوي على سلسلة، ملاحظة وعقد العلامات الأخرى. لذلك حيث قد يكون الإخراج من المكالمات إلى طريقة Lexer Nextnode ():
محلل أتش تي أم أل برامج ذات صلة