تخمين اللغة

تخمين اللغة الطبيعية للنص
التحميل الان

تخمين اللغة الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • LGPL
  • اسم الناشر:
  • Kent Johnson
  • موقع ويب الناشر:
  • http://code.google.com/u/kent3737/

تخمين اللغة العلامات


تخمين اللغة وصف

تخمين اللغة الطبيعية للنص تخمين محاولات اللغة لتحديد اللغة الطبيعية لمجموعة مختارة من نص Unicode (UTF-8). Based على Gresslanguage.cpp بواسطة Jacob R Ridout ل KDE والتي تعتمد نفسها على اللغة :: Guess by Maciej Ceglowski.Deects أكثر من 60 لغة - تستخدم جميع اللغات المدرجة في دليل Trigrams بالإضافة إلى اليابانية والصينية والكورية واليونانية. Guess_Languess_Languess_Language تستخدم الاسلكية بناء على مجموعة الأحرف والغرام في نص عينة للكشف عن اللغة. إنه يعمل بشكل أفضل مع عينات أطول وسيتم الخلط بينه إذا كان نص العينة يتضمن علامات مثل Tags HTML.USAGETHEE نقاط الإدخال الرئيسية كلها سلسلة واحدة كمدخل وإرجاع معرف اللغة. يجب أن تكون السلسلة نص Unicode أو UTF-8. يمكن أن يكون معرف اللغة هو اسم اللغة باللغة الإنجليزية، رمز لغة IANA في اللغة الإنجليزية أو ثلاثة أحرف أو معرف لغة أو Tuple يحتوي على جميع الرموز الثلاثة. نقاط الإدخال الأساسي وقيم الإرجاع، هي كما يلي: GuessLanguage (TXT . بيثون


تخمين اللغة برامج ذات صلة