النص :: مسح

البحث السريع عن أعداد كبيرة جدا من المفاتيح في نص نص.
التحميل الان

النص :: مسح الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • Perl Artistic License
  • السعر:
  • FREE
  • اسم الناشر:
  • Ira Woodhead
  • موقع ويب الناشر:
  • http://search.cpan.org/~tbusch/

النص :: مسح العلامات


النص :: مسح وصف

البحث السريع عن أعداد كبيرة جدا من المفاتيح في نص النص. النص :: المسح الضوئي هو وحدة بيرل التي تقدم بحث سريع لأعداد كبيرة جدا من المفاتيح في مجموعة من النص. استخدم النصوص :: Scan؛ $ dict = نص جديد :: مسح؛ شروط = (الكلب => 'Canine'، Bear => 'Ursine'، Pig => 'porcine')؛ # قم بتحميل القاموس مع مفاتيح وقيم # (يمكن أن تكون القيم أي عرقلة، يجب أن تكون المفاتيح سلاسل) أثناء ((مفتاح $، $ Val) = كل شروط) {$ dict-> إدراج (مفتاح $، $ val)؛ } # مسح مستند للمطابقات $ المستند = "كل الكلب أكل الدب لكن الكلب حصل على عسر الهضم"؛ تم العثور على = $ dict-> مسح (وثيقة $)؛ # الآن وجدت هو (الكلب => الكلاب، الدب => Ursine) # أو، إذا كنت بحاجة إلى حساب عدد من تكرارات أي مفتاح معين، استخدم صفيف. هذا سوف يمنحك قائمة مسطحة عديمة مسطحة # من المفتاح => أزواج القيمة. pound = $ dict-> مسح (وثيقة $)؛ # Nowfoundfoundfound (dog => canine، bear => Ursine، dog => canine) التحقق من العضوية ($ val صحيح) $ val = $ dict-> لديه ('pig')؛ # استرجاع القيمة لمفتاح معين. إرجاع UNDIF إذا لم يتم العثور على أي مفتاح. $ val = $ dict-> val (مفتاح $)؛ # استرجاع جميع المفاتيح. يؤدي هذا إلى إرجاع جميع المفاتيح المدرجة بالترتيب # الإدراج Cyes = $ Dict-> مفاتيح ()؛ #KEYS (الكلب، الدب، الخنزير) # استرجاع جميع القيم (بنفس الترتيب مثل المفاتيح المقابلة) # (جديد في v0.10) vals = $ dict-> القيم ()؛ # @ vals هو (الكلاب، أورسين، الخنزير) # استعادة كل ما أدخله كل شيء = $ dict-> تفريغ ()؛ # "Mindex" # مثل فهرس بيرل () ولكن مع أنماط متعددة (جديد في V0.07) # يمكنك المسح الضوئي لمراكز البداية من المصطلحات. تضمين التغريدة ردا على ذلك DICT #indices (Dog => 4، Bear => 16، Dog => 29) # يعطي سياق التجزئة موضع الحوادث الأخيرة # من كل كلمة Word = $ dict-> mindex (d $ document)؛ # المؤشرات هي (الكلب => 26، Bear => 16) # multiscan () multiscan (> = v0.23) يسترجع كل شيء المسح الضوئي () و mindex () يفعل، في شكل مجموعة من المراجع. كل إشارة مرجعية إلى قائمة عدد (المفتاح، الفهرس، القيمة) Result = $ dict-> multiscan (وثيقة $)؛ # @ result هو (، ، ) # قم بتشغيل المسح البدل. (> = v0.09) # هذا يمكن القيام به في أي وقت. يعمل للمسح () و mindex (). أحرف البدل # تشمل أي عدد من الأحرف غير المساواة بدون الفضاء. $ dict-> usewild ()؛ # حفظ القاموس، ثم استعادته. (تسلسل واستعادة جديد في V0.14) # هذا رائع ولكن حذار، سيتم تحويل جميع القيم إلى السلاسل. # ملاحظة استعادة () أسرع بكثير من الإدراج الأصلي من المفتاح / القيم #. هذه العودة 0 على النجاح، errno على الفشل. $ dict-> تسلسل ("dict_name")؛ $ dict-> استعادة ("dict_name")؛ # ضع فئة سحرية عالمية حيز التنفيذ. هذا يطابق جميع هذه الأحرف كما لو كانت هي نفسها. (v0.17) $ dict-> charclass (".:؛،؟")؛ $ dict-> إدراج ("ماذا؟"، "ماذا؟")؛ found = $ dict-> الفحص ("خطأ ... ماذا، شيء خاطئ؟")؛ # الآنFoundFound ("ماذا،" => "ماذا؟")؛ # مسح الحافلة الحساسية. يجب أن يتم استدعاء هذا قبل أي إدراج. $ dict-> ignorecase ()؛ # تعيين فئة من الأحرف ليكون حدود أي مباراة، # بحيث يجب أن تكون السحر مباشرة قبل البداية وبعد # إنهاء المباراة في هذه الفئة. الافتراضي هو مساحة واحدة #. (بداية وإنهاء السلسلة تحسب دائما كحل) # يمكن استدعاء ذلك في أي وقت، ويستخدم أي مكالمات سابقة. $ dict-> الحدود (".؟")؛ # تجاهل بعض الأحرف. يمكنك تحديد فئة من الأحرف التي يجب أن تتظاهر بها القاموس غير موجودة. يجب عليك الاتصال بهذا قبل # أي الإدراج. $ dict-> تجاهل (" (). الطريقة إلا أن الحدود الفعلية هي # النظر في الحدوث فقط قبل حرف الحدود. هذا مفيد # عندما تحتاج حرف الحدود نفسها إلى مطابقتها عند بداية المباراة. # على سبيل المثال من أجل البحث عن "-Foo" في "Bar-Foo"، يجب ضبط الفئة التالية من DICT-> شامل ("- ')؛ توفر هذه الوحدة مرافق للبحث السريع عن سلاسل مع العديد من مفاتيح البحث. يتصرف الكائن الأساسي إلى حد ما مثل Perl Hash إلا أنه يمكنك استرداد استنادا إلى مزيج من أي مفاتيح مخزنة. ما عليك سوى مسح سلسلة كما هو موضح أعلاه وسوف تعود إلى Perl Hash (أو قائمة) من جميع المفاتيح الموجودة في السلسلة (جنبا إلى جنب مع القيم و / أو المواقع المرتبطة بها) . يتم إرجاع جميع المفاتيح الموجودة في النص. هناك عدة طرق للتأثير على سلوك المباراة، ج من خلال استخدام عدة أنواع من فئات الأحرف العالمية. هذه مختلفة عن دروس سحر التعبير العادية، حيث أنها تنطبق على النص بأكمله ولجميع المفاتيح. تتكون هذه من فئة "تجاهل"، فئة "الحدود"، الفئة "الشاملة"، وأي فئات محددة من قبل المستخدم. تم استخدام أحرف "تجاهل" التي يمكن أن يكون لديك المسح الضوئي يتظاهر بشار في النص ببساطة غير موجود. هذا مفيد إذا كنت ترغب في تجنب تصوير النص الخاص بك. لذلك على سبيل المثال، إذا كانت الفترة ". في فئتك "تجاهل" الخاص بك، سيتم التعامل مع النص تماما كما لو تم حذف جميع الفترات. لتحديد الأحرف التي قد تعتمد كمسؤول عن أي تطابق (مساحة واحدة افتراضيا)، يمكنك استخدام فئة "الحدود". على سبيل المثال بهذه الطريقة، يمكنك حساب علامات الترقيم كحدود، وسوف تتطابق العبارات المحددة في النهاية عن طريق علامات الترقيم. هل يمكن استخدام فئات الأحرف المعرفة من قبل المستخدم لحساب الأحرف المختلفة كما هو نفسه. على سبيل المثال، يتم استخدام ذلك داخليا لتنفيذ مطابقة غير حساسة للحالة الأحرف. النص :: Acts Scan Acts في مستوى Octet لذلك ليس على علم بأي شيء حول سلاسل Unicode / UTF8 المشفرة. إذا تعاملت مع هذه السلاسل، فمن المستحسن إعطاء الأطباق سلاسل النصوص :: المسح الضوئي باستخدام الترفيح :: Encode_utf8 (). النص :: المسح الضوئي سيعطيك ثم عودة الأكبرات، UTF8 تم ترميز المفاتيح الموجودة. متطلبات: جيتون


النص :: مسح برامج ذات صلة

SVG.

امتداد بيرل لتوليد مستندات رسومات ناقلات قابلة للتحجيم (SVG) ...

239

تحميل