مشروع Lemur

تطبيق نماذج اللغة واسترجاع المعلومات
التحميل الان

مشروع Lemur الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • Freeware
  • السعر:
  • FREE
  • اسم الناشر:
  • The Lemur Team
  • موقع ويب الناشر:
  • http://www.lemurproject.org/
  • أنظمة التشغيل:
  • Mac OS X
  • حجم الملف:
  • 63.6 MB

مشروع Lemur العلامات


مشروع Lemur وصف

تطبيق نماذج اللغة واسترجاع المعلومات Toolkit Lemur هو تطبيق مجاني ومفتوح المصدر مصمم لتسهيل البحث في النمذجة اللغوية واسترجاع المعلومات. تشمل مجموعة أدوات Lemur تقنيات مثل المخصصات والاسترجاع الموزع، الأشعة تحت الحمراء عبر اللغة والتلخيص والتصفية والتصنيف. فيما يلي بعض الملامح الرئيسية "مشروع Lemur": لغات الاستعلام المهيكلة المتطورة (باستخدام الاستفساء و Indri) دعم XML واسترجاع المستندات المهيكلة تستخدم عادة مع مجموعة واسعة من مجموعات اختبار البحث (على سبيل المثال، TREC CDS 1-5، WT10G، RCV1، GOV2، GOV2) فهرسة صفحات الويب الخاصة بك مع قدرات البحث في موقع "خارج الصندوق" واجهات تفاعلية لنظام التشغيل Windows، Linux، و Web تطبيقات استرجاع المعلومات والوثائق الموزعة عبر منصة، رمز سريع وحديث مكتوب في C ++ C ++، Java و C # Apis برامج مجانية ومفتوحة المصدر قيد الاستخدام لأكثر من 6 سنوات من قبل مجتمع مستخدم كبير ومتنامي الفهرسة: طرق فهرسة متعددة لمجموعات صغيرة ومتوسطة ومساحة واسعة النطاق (TERABYTE) دعم مدمج للغة الإنجليزية والصينية والعربية الحمال و krovetz كلمة فهرسة تدريجية دعم الفهرسة خارج الصندوق لنص TREC، TREC Web، نص عادي، HTML، XML، PDF، MBOX، Microsoft Word، و Microsoft PowerPoint الفهارس المضمنة والتعويض التعليقات التوضيحية (E.G.، جزء من الكلام والكيانات المسماة) سمات وثيقة مؤشرات استرجاع: يدعم أساليب النمذجة اللغوية الرئيسية مثل إندري و KL- الاختلاف، وكذلك مساحة المتجهات، TF.idf، Okapi والاستفسرية الملاءمة- ملاحظات الملاءمة الزائفة توسيع مصطلح البدل (باستخدام إندري) استرجاع عنصر المرور و XML استرجاع عبر اللغات تجانس عبر برايورز ديريشيت سلاسل ماركوف يدعم PRIORS المستند التعسفي (على سبيل المثال، رتبة الصفحة، عمق URL) ما الجديد في هذا الإصدار: 2799440 Terminfo عاد من قبل IndRiterminfolist لا يوجد لديه مواقع 2794361 Harvestlinks فشل في إنشاء أدلة حصاد 2788507 KrovetzstemMertransformation يمكن أن تفيض المخزن المؤقت 2788504 anchortextannotator يمكن أن تفيض المخزن المؤقت 2787935 Pagerank مقالب الأساسية إذا كان مسار الروابط سيئة 2784994 مقال خاطئ 27836665 TextTokenize ينتهي قبل الأوان قبل سمات العلامة 2782954 إندري :: تحليل :: HTMLPARSER :: Handletag يمكن أن تفيض المخزن المؤقت 2772914 IREVALGUI.JAR يعطي نتائج مجنونة 2772846 بن / IREVAL.JAR هو ملف .jar غير صالح (Lemur V48) 2770916 وثيقة الفساد المخزن المؤقت 2747981 Warcdocumentiterator يغيب عن المستندات في ملف Warc 2747707 TextTokenizer لا يتعرف على بعض سمات العلامة المقتبسة


مشروع Lemur برامج ذات صلة

opennlp.

تنسيق العديد من المشاريع التي تقترب من معالجة اللغة الطبيعية ...

181 2 MB

تحميل

DBSA.

أداة تطوير مفتوحة المصدر لمقارنة لقطات مخطط قاعدة البيانات ...

169 209 KB

تحميل