النص :: سجل :: deduper

منفصلة كاملة، جزئية وقابلة للتكرار
التحميل الان

النص :: سجل :: deduper الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • Perl Artistic License
  • السعر:
  • FREE
  • اسم الناشر:
  • Kim Ryan
  • موقع ويب الناشر:
  • http://search.cpan.org/~kimryan/Locale-SubCountry-1.37/lib/Locale/SubCountry.pm

النص :: سجل :: deduper العلامات


النص :: سجل :: deduper وصف

منفصلة كاملة، جزئية و بالقرب من السجلات النصية المكررة النص :: Record :: DEDUAPER هو وحدة من PERL مع سجل نصي منفصل وجزئي و بالقرب من النصوص النصية. بلدي deduper $ = نص جديد :: سجل :: deduper؛ # العثور على وإزالة الخطوط بأكملها التي تكررت $ deduper-> dedupe_file ("oric.txt")؛ # DEDUPE مفصولة الفاصلة السجلات، وتكرارات محددة من قبل العديد من الحقول $ deduper-> field_separator ('،')؛ $ deduper-> add_key (field_number => 1، ignore_case => 1)؛ $ deduper-> add_key (field_number => 2، ignore_whitespace => 1)؛ # سجلات فريدة تذهب إلى ملف names_uniqs.csv، dupes إلى names_dupes.csv $ deduper-> dedupe_file ('names.csv')؛ # ابحث عن "بالقرب من" الدوب عن طريق السماح باسم الاسم المستعار الخاص بي Nick_names = (Bob => 'Robert' و Rob => 'Robert')؛ بلدي $ near_deduper = نص جديد :: سجل :: deduper ()؛ $ near_deduper-> add_key (field_number => 2، الاسم المستعار => \ nick_names) أو يموت؛ $ near_deduper-> dedupe_file ('names.txt')؛ # إنشاء تقرير نصي، أسماء report.txt لتحديد جميع التكرارات $ neep_deduper-> report_file ('names.txt'، all_records => 1)؛ # ابحث عن "قرب" Dupes في مجموعة من السجلات، المراجع العائدة # إلى صفيف فريد ومكرر بلدي ($ UNIQS، $ Dupes) = $ near_deduper-> dedupe_array (some_records)؛ هذه الوحدة تسمح لك باتخاذ ملف نصي من السجلات وتقسيمها في ملف فريد من نوعها وملف من سجلات مكررة. يتم تعريف Records كمجموعة من الحقول. قد يتم فصل الحقول عن طريق المسافات أو الفواصل أو علامات التبويب أو أي محدد آخر. يتم فصل السجلات بخط جديد. إذا لم يتم تحديد أي خيارات، فسيتم إنشاء مكررة فقط عند تكرار جميع الحقول الموجودة في سجل (السطر بأكمله). محددة الخيارات التي يتم تحديدها من خلال الحقول أو الحقول الجزئية عليها لا تحدث أكثر من مرة لكل سجل. هناك أيضا خيارات لتجاهل حساسية الحالة، ويمكن تعريف المساحات البيضاء الرائدة والزائدة. يتم ذلك عن طريق إنشاء أسماء مستعارة، مثل Bob => Robert.This وحدة مفيدة لإيجاد التكرارات التي تم إنشاؤها بواسطة إدخال بيانات متعددة، أو دمج السجلات المماثلة. متطلبات: perl.


النص :: سجل :: deduper برامج ذات صلة