مجموعة أدوات اللغة الطبيعية

التحميل الان

مجموعة أدوات اللغة الطبيعية الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • GPL
  • السعر:
  • FREE
  • اسم الناشر:
  • Steven Bird
  • موقع ويب الناشر:

مجموعة أدوات اللغة الطبيعية العلامات


مجموعة أدوات اللغة الطبيعية وصف

مجموعة أدوات اللغة الطبيعية هي مجموعة من مكتبات وبرامج Python لمعالجة اللغة الطبيعية الرمزية والإحصائية. مجموعة أدوات اللغة الطبيعية هي مجموعة من مكتبات وبرامج Python لمعالجة اللغة الطبيعية الرمزية والإحصائية. يشتمل NLTK على مظاهرات رسومية وبيانات البيانات. يرافقه وثائق واسعة النطاق، بما في ذلك البرامج التعليمية التي تفسر المفاهيم الأساسية وراء مهام معالجة اللغة التي تدعمها الأدوات التي تدعمها مجموعة الأدوات. الصفحة: على وجه الخصوص، تحتوي الصفحة الرئيسية NLTK الرئيسية على ثلاثة أنواع من الوثائق: دروس تعليم الطلاب كيفية استخدام مجموعة الأدوات، في سياق إجراء مهام محددة. إنها مناسبة لأي شخص يرغب في معرفة كيفية استخدام مجموعة الأدوات. وصف الوثائق المرجعية ل Plankit كل وحدة نمطية وواجهة، فئة، طريقة، وظيفة، ومتغير في مجموعة الأدوات. يجب أن تكون هذه الوثائق مفيدة لكل من المستخدمين والمطورين. عدد من التقارير الفنية المتاحة. تشرح هذه التقارير وتبرير تصميم الأدوات والتنفيذ. يتم استخدامها من قبل مطوري مجموعة الأدوات لتوجيه وتوثيق بناء الأدوات. يمكن للطلاب استشارة هذه التقارير إذا كانوا يرغبون في مزيد من المعلومات حول كيفية تصميم مجموعة الأدوات ولماذا تم تصميمه بهذه الطريقة. ما الجديد في هذا الإصدار: NLTK: - حزمة دلالات موسعة منطق الدرس الأول، المنطق الخطي، دلالات الغراء، DRT، LFG (DAN Garrette) - فئة New Workense في Wordnet .syset الدعم الوصول إلى التناغمات من مفاتيح المعنى والوصول إلى تحسس الشعور (JOEL NOTHMAN) - واجهة لتنفيذ CRF السلسلة الخطي بالسلطة (NLTK.TAG.CRF) - متفرقات Bugfixes بما في ذلك Punkt، SypeSets، Maxent- تحسين الدعم للمخطوزي بما في ذلك القارئ، الجديد نوع القاعدة: ChunkRulewithContext- GUI New for NLTK.DRAW.POCONDANCE- واجهة المستخدم الرسومية الجديدة لنظام Regoxp Chunkers NLTK.DRAW.RECHUNKPARSER - إضافة طرق bio_sents () و bio_words () إلى conllchunkcorpusreader في conll.py للسماح قراءة (Word، علامة، Chunk_typ) Tines of Conll-2000 Corpus. أيضا تعديل conllchunkcorpusview لدعم هذه التغييرات .- هياكل هياكل الدعم مع أساليب التوحيد المخصصة - علم جديد حول قراءة الأشكال الموسومة على استخدام الأشكال المبسطة - حزمة جديدة لنمذجة لغة النجرام مع Katz Backoff NLTK.Model - الفئات المضافة للألوان الواحدة والمتعددة الأشجار الفارة التي تحافظ تلقائيا على المؤشرات الأصلية (NLTK.TREE.PARESEDREE و NLTK.TREE.MULTIPRESETREE) - متصفح Wordnet الجديد واجهة المستخدم الرسومية (Jussi Salmela، Paul Bone) - تحسين الدعم للتسلسلات الكسولة - إضافة طريقة لتوزيع الاحتمالات - المزيد محلل مرن لتحويل الأوتار بين قوسين إلى إصلاحات للأشجار إلى DocStrings لتحسين الوثائق API (العمل قيد التقدم) - حزمة NLG الجديدة، FUF / SIRGE (Petro Verkhogliad) - حزمة محلل التبعية الجديدة (جايسون ناراد) - حزمة Comeference الجديدة، بما في ذلك الدعم بالنسبة إلى ACE-2، MUC-6 و MUC-7 Corpora (Joseph Frazee) - CCG Parser (GRAEME GANGE) - دقة الطلبات الأولى Theorem Prover (Dan Garrette) بيانات: - NNW NPS Chat Corpus A ND Corpus Reader (NLTK.CORPUS.NPS_CHAT) - يمكن الآن استخدام ConlllcorpusReader لقراءة Conll 2004 و 2005 Corpora. يتم فحص إصدارات مخللة من هذه الكائنات في البيانات / Tagers و Data / Chunkers.book: - تصحيحات متفرقات استجابة لردود الفعل من القراء ما الجديد في هذا الإصدار: ينطوع هذا الإصدار في واجهة برمجة تطبيقات NLTK قبل إصدار 2.0 ونشر كتاب NLTK. كانت هناك عشرات من التحسينات البسيطة والوجود. العديد من أسماء النموذج NLTK.FOO.BAR متاحة الآن باسم NLTK.BAR. يتم توسيع وظائف في شجرة القرار والترفيه وحدات Toolbox. تمت إضافة لعبة ترجمة جديدة nltk.misc.babelfish. وحدة جديدة NLTK.HELP تمنح الوصول إلى وثائق التغليف. الواردات الثابتة حتى يتم بناء NLTK وتثبيتها دون Tkinter (للعمل على الخوادم). تتضمن بيانات جديدة نموذجا كحد أقصى للإنتروبوي والجواد الجوية المحدثة. يتضمن NLTK Contrib تحديثات لحزمة COMELION (JOSEPP FRAZEE) و The Isri Arabic Stemmer (Hosam Algasaier). لقد خضع الكتاب تصحيحات تحريرية كبيرة قبل النشر النهائي.


مجموعة أدوات اللغة الطبيعية برامج ذات صلة

libnoise.

مكتبة محمولة ومصدر مفتوحة ومفزئة للضوضاء ل C ++ ...

191

تحميل