كليرتك

مجموعة أدوات لتطوير مكونات معالجة اللغة الطبيعية الإحصائية في جافا
التحميل الان

كليرتك الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • BSD
  • السعر:
  • FREE
  • اسم الناشر:
  • ClearTK Team
  • موقع ويب الناشر:
  • http://code.google.com/p/cleartk/
  • أنظمة التشغيل:
  • Mac OS X
  • حجم الملف:
  • 435 KB

كليرتك العلامات


كليرتك وصف

مجموعة أدوات لتطوير مكونات معالجة اللغة الطبيعية الإحصائية في جافا يعتمد مجموعة أدوات ClearTK على إطار Apache Uima لتحليل النص. Cleartk هو مشروع تم تطويره في مركز أبحاث اللغة الحسابية والتعليم (CLEAR) في جامعة كولورادو في بولدر. باختصار، يوفر ClearTK إطارا لتطوير مكونات معالجة اللغة الطبيعية الإحصائية (NLP) في Java ويوفر مكتبتين: ClearTK-Framework و ClearTK-Toolkit الذي يتم تلخيصه لفترة وجيزة أدناه. Framework Framework: يوفر إطار ClearTK البنية التحتية لتطوير UIMA محركات التحليل التي تستخدم التعلم الإحصائي كأساس لصناعة القرار وإنشاء الشرح. يوفر Frame Framework ClearTK ما يلي: مكتبة استخراج ميزة غنية واجهة وشائعة ومغلفة لمكتبات تعلم الآلات الشعبية تعتمد على نماذج مثل أقصى قدر من أجهزة الإنتروبية، وآلات ناقلات الدعم والحقول العشوائية الشرطية. يدعم حاليا LIBSVM، Opennlp Maxent، Malet Cashifiers، حقول عشوائية مشروطة، SVMlight. يسمح نهج المطورين للمرء استخدام نهج أفضل من سلطات السلالة من خلال السماح لأحد المبادلات بمكتبة تعليمية واحدة لآخر بطريقة بحيث لا يجب تغيير التعليمات البرمجية التي تقوم بتنفيذ المنطق الأساسي لمحرك التحليل. يوفر التطبيق نهجا غير مرجح للنظام. لا يعتمد إطار ClearTK على أو تقديم أي نظام معين نوع معين. يهدف الكود المقدم من الإطار إلى استخدام كأساس لإنشاء محركات تحليل جديدة في بيئتك بحيث يمكنك إنشاء مكونات محددة لاحتياجاتك ونوع النظام. يمكن تنزيل الإطار من صفحة التنزيلات، التي تم تسجيلها من مستودع التخريب كشروع Eclipse، أو إضافته كإعالة مافن إذا كنت تستخدم Maven لإنشاء مشروعك (انظر أدناه). Toolkit Toolkit: توفر مجموعة أدوات ClearTK مكونات UIMA و / أو البنية التحتية لمعالجة مهام محددة. توفر مجموعة الأدوات التالية: جمع القراء لشركة Corpora الشائعة الاستخدام (مثل Conll، ACE، Penntreebank، Genia، Timeml) البنية التحتية لإنشاء مكونات NLP لمهام محددة مثل علامة جزء من الكلام والقطع الحيوي على الطريقة الحيوية، كيان اسمه الاعتراف، التظليل النحوي، وضع العلامات الدلالية، الدقة الزمنية، إلخ. مغلفة مكونات NLP المشتركة مثل Snowball Stemmer ومكونات Opennlp. توفر مجموعة أدوات ClearTK نظام نوع النوع والعديد من المكونات (واختبارات الوحدات) تعتمد على نظام هذا النوع. ومع ذلك، فقد عملنا بجد لإجراء الكثير من التعليمات البرمجية في نظام مجموعة أدوات مجموعة الأدوات عن طريق مكونات المعلمات حسب أنواعها أو عن طريق إنشاء مكونات قابلة للتوسيع عبر الكتابة العامة. توفر مجموعة الأدوات حاليا فقط كشروع Eclispe الذي يمكن التحقق منه من متطلبات مستودع التخريب: جاوة


كليرتك برامج ذات صلة

ميداس

خادم نظام التعليق التوضيحي في جافا (DAS) مع واجهة برمجة تطبيقات بسيطة لتطوير مصادر البيانات ...

144 400 KB

تحميل

Jriaffe.

إطار Java الذي يجعل من السهل إنشاء تطبيقات تمكين الإنترنت الغنية ...

149 8.6 MB

تحميل