النص :: بلوم

التحميل الان

النص :: بلوم الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • Perl Artistic License
  • السعر:
  • FREE
  • اسم الناشر:
  • Andrea Spinelli and Walter Vannini
  • موقع ويب الناشر:
  • http://search.cpan.org/~aspinelli/Text-Document-1.07/Bloom.pod

النص :: بلوم العلامات


النص :: بلوم وصف

النص :: Bloom يمكن تقييم توقيع بلوم لمجموعة من المصطلحات. النص :: Bloom يمكن تقييم توقيع Bloom من مجموعة من المصطلحات .synopsis My $ B = نص :: Bloom-> جديد ()؛ $ B-> حساب (QW (Foo Bar Baz))؛ بلدي $ sig = $ b-> writetostosting ()؛ $ b-> writetofile ('afile.sig')؛ بلدي $ B2 = نص :: Bloom :: NewFromFile ('AFILE.SIG')؛ بلدي B3 $ = النص :: Bloom-> جديد ()؛ $ B3-> حساب (QW (Foo Bar Barbaz))؛ بلدي SIM = $ B-> التشابه ($ B2)؛ بلدي $ B4 = نص :: Bloom :: NewFromString ($ SIG)؛ النص :: Bloom ينطبق تقنية تصفية Bloom للتحليل الإحصائي للمستندات. يتم قياس المصطلحات في المستند باستخدام تمثيل Base-36 Radix؛ يتوافق كل مصطلح مع عدد صحيح في النطاق 0..P-1، حيث P هو رئيسي، تعيين حاليا إلى أعظم رئيسي أقل من 2 ^ 32. قم بتخصيص القيمة الكمي المعين إلى الأعداد الصحيحة D في النطاق 0.. -1، حيث حجم عدد صحيح أقل من P، حاليا 2 ^ 17، باستخدام عائلة من وظائف التجزئة، تم حسابها من قبل وظيفة Hashv.Ask القيمة الخزانية تستخدم كمؤشر في متجه بت كبير. تم تعيين البتات المقابلة للشروط الموجودة في المستند إلى 1؛ يتم تعيين جميع البتات الأخرى إلى 0.OF، قد تسبب التصادمات نفس الشيء المرتين، حسب شروط مختلفة. يتبع ذلك، إذا كانت الوثيقة تحتوي على شروط مميزة، في ناقلات النسغة الناتجة، يتم تعيين بت أكثر من 1. سلسلة البتات الناتجة هي تمثيل مدمج للغاية لوجود / عدم وجود المصطلحات في المستند، وهو لذلك تتميز بالتوقيع. علاوة على ذلك، لا يعتمد على قاموس مسبق للمصطلحات. يمكن استخدام التوقيع من أجل: اختبار ما إذا كانت مجموعة معينة من المصطلحات موجودة في المستند، والحوسبة التي تكون جزء من المصطلحات شائعة إلى وثيقتين. قد تمثيل البت أن تكون مكتوبة وقراءة من ملف. النص :: Bloom يعض رأسه إلى دفق البت المناسب؛ وعلاوة على ذلك، كلما ضغط الحزمة :: ZLIB متاحا، يتم ضغط ناقلات بت، بحيث يتم تقليل متطلبات مساحة القرص بشكل كبير، خاصة بالنسبة للوثائق الصغيرة. من الواضح أن وظيفة التجزئة من الواضح عن مكون حاسم في المرشح؛ يستخدم التنفيذ المرجعي تمثيل راديكس للأسلوتات. لذلك يجب أن يطابق كل مصطلح مع التعبير العادي / Budap 0-9A-Z عند أكثر من البدائل القابلة للتطبيق، والتي يمكن متابعتها من قبل الفئات الفئة الفرعية وإعادة تعريف الأسلوب QuantizeV.Requirements: متطلبات بيرل: perl.


النص :: بلوم برامج ذات صلة