لوسين

لوسين هو API بيرل إلى ميناء C محرك البحث Lucene.
التحميل الان

لوسين الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • Perl Artistic License
  • السعر:
  • FREE
  • اسم الناشر:
  • Thomas Busch
  • موقع ويب الناشر:
  • http://search.cpan.org/~tbusch/Lucene-0.13/lib/Lucene.pm

لوسين العلامات


لوسين وصف

Lucene هي API Perl إلى ميناء C محرك البحث Lucene. Lucene هي API Perl إلى ميناء C محرك البحث Lucene.syopsinitialize / الفارغة مؤشر Lucene Lucene بلدي محلل = جديد لوسين :: تحليل :: Standard :: StandardAlalyzer ()؛ بلدي $ Store = Lucene :: Store :: fsdirectory-> gettirectory (/ home / lucene "، 1)؛ بلدي $ TMP_Writer = New Lucene :: Index :: Indexwriter (D $ Store، $ محلل، 1)؛ $ TMP_Writer-> إغلاق؛ UNDEF $ TMP_Writer؛ اختر محللك (Totkenizer String) # Linkses النص ويقسمه بأحرف غير حرفي لي محلل $ = جديد لوسين :: تحليل :: Simpleanalyzer ()؛ # نفس الشيء كما كان من قبل وأزيل الكلمات توقف بلدي محلل $ = جديد لوسين :: تحليل :: stopanalyzer ()؛ # كما كان من قبل ولكنك تقدم كلمات التوقف الخاصة بك محلل بلدي $ = جديد لوسين :: تحليل :: stopanalyzer ()؛ # تقسيم النص في أحرف Whitespace بلدي محلل $ = جديد لوسين :: تحليل :: Whitespaceanalyzer ()؛ # Linkses Text، وأمزيدها بناء على قائر # يترك السلطات المسماة سلطات سليمة (رسائل البريد الإلكتروني وأسماء الشركة، وأسماء HostNames # IP، إلخ) وإزالة الكلمات، وإيقاف الكلمات الخاصة بي محلل $ = جديد لوسين :: تحليل :: قياسي: : standardanalyzer ()؛ # نفس الشيء كما كان من قبل ولكنك توفر كلمات التوقف الخاصة بك محلل $ الخاص بي = جديد لوسين :: تحليل :: قياسي :: StandardAnalyzer ()؛ # يأخذ السلسلة كما هو (فقط عند استخدام clucene-0.9.17 أو أعلى) بلدي محلل $ = جديد لوسين :: تحليل :: keywordanalyzer () إنشاء حزمة محلل مخصص myanalyzer؛ استخدام قاعدة "لوسين :: تحليل :: محلل"؛ # يجب أن تسمى Super :: جديد إذا قمت بتطبيق جديد () فرعي جديد {My $ Class = Shift؛ بلدي $ النفس = $ class-> super :: جديد ()؛ # ... العودة $ } Sub Tokenstream {My ($ الذاتي، حقل $ $، $ قارئ) =_؛ My $ Ret = New Lucene :: Analysis :: StandardTokenizer ($ قارئ)؛ إذا ($ حقل EQ "MyKeyWordfield") {Return $ Ret؛ } $ Ret = جديد لوسين :: تحليل :: LowerCaseFilter ($ Ret)؛ $ Ret = New Lucene :: Analysis :: Stopfilter ($ Ret، )؛ العودة $ Ret؛ } حزمة الرئيسية؛ بلدي محلل $ = MyAnalyzer الجديد؛ اختر المتجر الخاص بك (محرك التخزين) # التخزين في ذاكرة بلدي $ Store = New Lucene :: Store :: Ramdirectory ()؛ # التخزين المستندة إلى القرص بلدي $ Store = Lucene :: Store :: fsdirectory-> getDirectory ("/ home / lucene"، 0)؛ فتح وتكوين موقع فهرسيتي كاتبة = New Lucene :: Index :: Indexwriter ($ Store ، محلل $، 0)؛ # إعدادات اختيارية لمستخدمي الطاقة $ Writer-> SetMReghactor (100)؛ كاتب $-> setusecompoundfile (0)؛ كاتب $-> setmaxfieldlength (255)؛ كاتب $-> setminmergedocs (10)؛ كاتب $ -> setmaxmergedocs (100)؛ إنشاء المستندات وإضافة الحقول بلدي Doc $ = New Lucene :: Document؛ # يحصل تحليل الحقل، مفهرسة وتخزين $ Doc-> إضافة (لوسين :: المستند :: Field-> النص ("المحتوى"، المحتوى $))؛ # الحقل يحصل مفهرسة وتخزين $ Doc-> إضافة (لوسين :: المستند :: Field-> الكلمة الرئيسية ("ISBN"، $ ISBN))؛ # الحقل يحصل تخزين فقط $ Doc-> إضافة (Lucene :: Document :: Field-> Unindexed ("Sales_Rank"، $ sales_rank))؛ # الحقل يحصل على تحليل وفهرس $ Doc-> إضافة (لوسين :: المستند :: Field-> غير مدرج ("فئات"، فئات $))؛ متطلبات: perl.


لوسين برامج ذات صلة