| اباتشي تيكا مجموعة أدوات تحليل محتوى محتوى مجانية ومفتوح موزعة بواسطة مؤسسة Apache |
التحميل الان |
اباتشي تيكا الترتيب والملخص
- اسم الناشر:
- The Apache Software Foundation
اباتشي تيكا العلامات
اباتشي تيكا وصف
Apache Tika عبارة عن مجموعة أدوات مفتوحة المصدر مصممة للكشف عن البيانات الوصفية واستخراجها، بالإضافة إلى محتوى نصي منظم من عدة مستندات، باستخدام أي شيء سوى مكتبات المحلل المحللين الموجودين. تدعم Apache Tika تنسيقات المستندات التالية: لغة ترميز النص التشعبي (HTTP)، XML وتنسيقات مستندات مشتقة، تنسيقات مستندات Microsoft Office، تنسيق OpenDocument (ODF)، تنسيق المستندات المحمولة (PDF)، تنسيق المنشور الإلكتروني (EPF)، تنسيق النص الغني (RTF) )، تنسيقات الضغط والتغليف، تنسيقات النص / الصوت / الصورة / الفيديو، تنسيق MBOX، وملفات Java Class Archives. في السابق، كان Apache Tika مشروع فرعي لمكتبة برامج Apache Lucene. الآن يتم توزيعها كحزمة مستقلة من قبل مؤسسة Apache Software.
اباتشي تيكا برامج ذات صلة