Xapian وأوميغا

التحميل الان

Xapian وأوميغا الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • GPL
  • السعر:
  • FREE
  • اسم الناشر:
  • Xapian Team
  • موقع ويب الناشر:
  • http://www.xapian.org/

Xapian وأوميغا العلامات


Xapian وأوميغا وصف

Xapian عبارة عن مكتبة استرجاع معلومات مستقيمة مفتوحة المصدر، والتي تم إصدارها تحت GPL. Xapian عبارة عن مكتبة استرجاع معلومات مستقيمة مفتوحة المصدر، والتي تم إصدارها تحت GPL. XAPIAN ISS مكتوبة في ج، مع الارتباطات للسماح بالاستخدام من لغات أخرى (PERL، Java، Python، PHP، و TCL مدعومة حاليا؛ يتم تشغيل Guile and C # على). تم تصميم exapian لتكون مجموعة أدوات قابلة للتكيف للغاية للسماح للمطورين لإضافة مرافق الفهرسة والبحث المتقدمة بسهولة إلى التطبيقات الخاصة بهم. إذا كنت بعد محرك بحث معبأ لموقع الويب الخاص بك، يجب عليك إلقاء نظرة على أوميغا، وهو تطبيق نورده على Xapian. ولكن على عكس معظم حلول البحث عن مواقع الويب الأخرى، تتيح لك براعة XAPIAN أن تمتد أوميغا لتلبية احتياجاتك أثناء تنموها. فيما يلي بعض الملامح الرئيسية "Xapian and Omega": البرمجيات الحرة / المصدر المفتوح - مرخصة تحت GPL. المحمولة للغاية - يعمل على العديد من Linux، MacOS X، العديد من منصات UNIX الأخرى، و Microsoft Windows. مكتوب في ج. تتوفر ارتباطات بيرل في البحث عن الوحدة :: Xapian على CPAN. يتم تضمين ارتباطات Java Jni في وحدة ربط Xapian-Bindings. نحن نؤيد أيضا SWIJ والتي يمكن أن تولد ارتباطات لمدة 13 لغة. في الوقت الحالي أولئك من أجل Python و PHP4 و TCL يعملون. يتم تشغيل Guile و C # على. البحث في المرتبة المهمة - الكلمات المهمة تحصل على وزن أكبر من الكلمات غير المهمة، وبالتالي فإن أكثر الوثائق ذات صلة من المرجح أن تأتي بالقرب من أعلى قائمة النتائج. ملاحظات الملالمة - بالنظر إلى الوثائق أو أكثر، يمكن أن تشير Xapian إلى شروط المؤشر الأكثر صلة لتوسيع استفسار، اقترح المستندات ذات الصلة، تصنيف المستندات، إلخ. العبارة والبحث القرب - يمكن للمستخدمين البحث عن الكلمات التي تحدث في عبارة محددة أو ضمن عدد محدد من الكلمات، إما في ترتيب محدد، أو بأي ترتيب. مجموعة كاملة من مشغلي البحث منطقية منظم ("الأسهم ليس السوق"، إلخ). يتم تصنيف نتائج البحث المنطقي من قبل الأوزان المحولية. يمكن أيضا تطبيق مرشحات المنطقية على تقييد البحث الاحتمالي. يدعم من شروط البحث عن مصطلحات البحث (على سبيل المثال، البحث عن "كرة القدم" من شأنه أن يطابق الوثائق التي تذكر "كرة القدم" أو "لاعب كرة القدم"). هذا يساعد في العثور على المستندات ذات الصلة التي قد تفوتها خلاف ذلك. يتم تضمين Stemmers حاليا للدنية والهولندية والإنجليزية والفنلندية والفرنسية والألمانية والإيطالية والنرويجية والبرتغالية والروسية والإسبانية والسويدية. يدعم ملفات قاعدة البيانات> 2GB - ضروري للتوسع إلى مجموعات المستندات الكبيرة. منصة تنسيقات البيانات المستقلة - يمكنك إنشاء قاعدة بيانات على جهاز واحد والبحث عنها على آخر. يسمح التحديث في وقت واحد والبحث. وثائق جديدة تصبح قابلة للبحث على الفور. بالإضافة إلى المكتبة، نحن نقدم عددا من البرامج المثالية الصغيرة، وتطبيق أكبر - تطبيق فهرسة ومقره CGI يسمى أوميغا: يمكن لمفهرس المرفأ يمكن فهرس HTML و PHP و PDF و PostScript والنص العادي. إضافة دعم لفهرسة التنسيقات الأخرى سهلة حيث تتوفر مرشحات التحويل (E.G. Microsoft Word). يعمل هذا المفهرس باستخدام نظام الإيداع، لكننا نقدم أيضا سيناريوا للسماح بإدخال مجنزه Web HTDIG، مما يسمح بتفتيش المواقع البعيدة باستخدام OMEGA. يمكنك أيضا فهرس البيانات من أي SQL أو RDBMS الأخرى التي يدعمها الوحدة النمطية PERL DBI. التي تشمل MySQL، Postgresql، SQLite، Sybase، MS SQL، LDAP، و ODBC. CGI البحث الأمامي المقدمة مع مظهر قابل للتخصيص للغاية. يمكن أيضا تخصيص ذلك لإخراج النتائج في XML أو CSV، وهو مفيد إذا كنت تولد صفحات ديناميكيا (E.G. مع PHP أو MOD_PERL) وتريد فقط نتائج البحث الخام التي يمكنك معالجةها في رمز تخطيط الصفحات الخاص بك. ما الجديد في هذا الإصدار: API: Xapian :: المستند لم يعد يخزن قيم فارغة بشكل صريح. لم يكن هذا سلوكا متعمدا، وكيف لم يتم توثيق هذه الحالة. يتوافق السلوك المعدل مع كيفية التعامل مع بيانات التعريف المستخدم. هذا التغيير غير مريح باستخدام المستند :: Get_Value ()، ولكن يمكن ملاحظة ذلك عند التكرار مع المستند :: القيم_BEGIN ()، باستخدام المستند :: القيم_count () أو محاولة حذف القيمة مع المستند :: MEXIVE_VALUE (). حزمة اختبار: قم بإصلاح TESTCASE DEVESSWEED4 لا تفشل في X86 عند ترجمة Wo0. كانت المشكلة في رمز TESTCAST، وكان بسبب الدقة الزائدة في قيم FP الوسيطة. الاختبار التي تحقق من أن العمليات لديها السلوك المتوقع O (...) لا تحقق من وقت وحدة المعالجة المركزية بدلا من وقت الزوجية على معظم المنصات، والتي يجب أن تخلص من الفشل في بعض الأحيان بسبب تحميل المسامير من العمليات الأخرى. (تذكرة # 308) إصلاح فشل الاختبار بسبب Skip_test_for_backend ("inmemory") لا تخطي عندما يكون بسبب مقارنة سلاسل السحر مع == (على صندوق الإرجاع الذي يتم اختباره هو STD :: سلسلة بدلا من const char *). تحسين تغطية الاختبار في العديد من الحالات الزاوية. إصلاح اختبار Testcase2 ليتم تشغيله فعليا (لحسن الحظ يمر). في الاختبارات التي تم إنشاؤها، اتصل ب Get_Description () على الكائن الافتراضي الذي تم إنشاؤه لكل فصل للتأكد من أن يعمل (ولا يحاول إلغاء إلغاء الاهتمام، أو فشل بعض التأكيد، إلخ). جميع الفئات التي تم فحصها حاليا على ما يرام - وهذا هو تجنب الانحدارات المستقبلية أو مثل هذه المشاكل مع فصول جديدة. في بناء تغطية الاختبار، استخدم "-Coverage" بدلا من "Arcs -frofile-arcs - التغطية". تسخير الاختبار الآن يحتوي على الإصدار المزدوج Inmemory Backend كما يدعم بيانات التعريف المحددة من قبل المستخدم (بصرف النظر عن التكرار على مفاتيح البيانات الوصفية). مانتر: إذا كان الاستعلام يحتوي على Sacquery Matchamr عندما تخلصنا من أو أو an_maybe إلى AND، فقد أنظف الأطفال بعناية بالنسبة لأقصى قدر من الكفاءة، ولكن تم عكس الحالة لذلك كنا في الواقع جعل الأمور أسوأ. لوحظ ذلك لأنه كان ينتج عن نفس الاستعلام يعمل بشكل أسرع عند طلب المزيد من النتائج! قم فقط بإنشاء اسم المستخدم إلى Termfreq و Map Weight for First SubDatabase بدلا من إعادة بناءه لكل واحد. أيضا لا نسخ هذه الخريطة لإرجاعها. هذا يجب أن تسرع عمليات البحث قليلا، وخاصة أولئك عبر قواعد بيانات متعددة. إذا فشل النمو ولكن يخبرنا ErrorHandler متابعة بدونها، فستستخدم فقط مؤشرا فارغا للوقوف بدلا من تخصيص كائن حامل مميز خاص. إزالة andpostlist، لصالح multiandpostlist. تم استخدام AndPostlist فقط كمنتج Decay (بواسطة andmaybeBostlist و Orpostlist)، ولا يبدو أنه أسرع. إزالة أنه يقلل من ضغط CPU ذاكرة التخزين المؤقت، وهو أقل رمز للحفاظ عليه. التحقق من الاتصال () بدلا من skip_to () على الفرع الاختياري من and_maybe. Flint backend: إصلاح خطأ في Termiterator :: SKIP_TO () على مفاتيح البيانات الوصفية. الخلفية عن بعد: إصلاح خيار XAPIAN-TCPSRV - Finterface للعمل على MacOS X (تذكرة رقم 373). إصلاح الخطأ المطبعي الذي تسبب لنا في إعادة الوكالة بدلا من الحد الأقصى للوزن المستند من تطابق بعيد يمكن أن يعود! قد يؤدي ذلك إلى نتائج خاطئة عند البحث في قواعد بيانات متعددة مع الخلفية عن بعد، ولكن ربما لا يهم عادة ما يكون مع BM25، تكون الأوزان صغيرة عموما (في كثير من الأحيان <1) في حين أن الأوكيدات حتما> = 1. inmemory backend: Inmemory Backend لا يدعم التكرار على مفاتيح البيانات الوصفية. في محاولة للقيام بذلك تستخدم لإعطاء تكرار فارغ، ولكن تم إصلاحه الآن لرمي UnimplumentedError (وقد تم توثيق هذا القيد الآن). بناء النظام: قم بإزالة الكثير من الادراج غير المستخدمة ورمز غير المستخدمة الذي يجب أن يجعل البناء أسرع وأصغر قليلا. قم بإصلاحه لتجميعه تحت - الصلصال الخلفي - الخلفية -Diend-backend-backend-backend-inmemory. لا تقم بإزالة أي مصادر مبنية في "جعل نظيفة" حتى أسفل وضع السير الذاتي كما ينكسر تبديل شجرة بعيدا عن وضع المشرف مع: اجعل المسافة؛ ./ configure تكوين: قم بتمكين المزيد من التحذيرات من دول مجلس التعاون الخليجي - "- الافتراضي - الظاهري" لجميع الإصدارات، "- Null-Sentinel Null-Sentinel" لمدة 4.0+، "-Wlogical-OP-AreaSations" ل 4.3+. لا سيما "- الإعلانات -إعلانات" القبض على أن الاتساق 2 لم يتم تشغيله. داخليا، قم بإصلاح الأماكن القليلة حيث نمر STD :: String حسب القيمة لتمريرها من خلال Const المرجع بدلا من ذلك (باستثناء حيث نحتاج إلى نسخ قابل للتعديل على أي حال) كما يعرض مرجع مرجع أسرع قليلا ويولد رمز أقل مع مرجع مجلس التعاون الخليجي :: تنفيذ السلسلة - مع التنفيذ غير المرجع غير المرجعي، يجب أن يكون إشارة الاتصال أسرع بكثير. (تذكرة رقم 140) توثيق: تثبيت: لم نعد اختبار بانتظام بناء مع دول مجلس التعاون الخليجي 2.95.4 ونحن نرفع الحد الأدنى من نسخة دول مجلس التعاون الخليجي المطلوب إلى 3.1 ل Xapian 1.1.x. وثيقة ما يمر Maxitems = 0 للاستفسار :: get_mset () يفعل. مستندات / QueryParser.html: إضافة أمثلة لاستخدام بادئة على عبارة أو فرعية. تصحيح تعليقات Doxygen لوظائف Metadata User: قاعدة البيانات :: Get_metadata () رمي UnimplementedError ولكن Writabledatabase :: SET_METADATA () يمكن. وثيقة قاعدة البيانات :: metadata_keys_begin () إرجاع ماتذ نهاية إذا كانت الخلفية لا تدعم البيانات الوصفية. اختراق: تحديث قائمة حزم دبيان / أوبونتو اللازمة لبيئة تطوير. رمز التصحيح: إصلاح بناء مع تصحيح الأخطاء. وأضاف بعض التأكيدات.


Xapian وأوميغا برامج ذات صلة

Wandora.

إدارة المعرفة والأغراض العامة، واستخراج بيئة النشر على أساس خرائط الموضوع. ...

301

تحميل

agilian.

Agilian هي بيئة نمذجة كاملة مصممة لتطبيق النمذجة رشيقة. ...

88

تحميل