gamera

إطار برمجة التعرف على المستندات.
التحميل الان

gamera الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • GPL
  • السعر:
  • FREE
  • اسم الناشر:
  • Michael Droettboom
  • موقع ويب الناشر:
  • http://ldp.library.jhu.edu/projects/gamera/

gamera العلامات


gamera وصف

إطار برمجة التعرف على المستندات. مشروع Gamera هو إطار لإنشاء تطبيقات تحليل المستندات المهيكلة من قبل خبراء المجال. خبراء المجال هم الأفراد الذين لديهم معرفة قوية بالوثائق في المجموعة، ولكن قد لا يكون لديهم خلفية فنية رسمية. الهدف هو إنشاء أداة تستفيد معرفتها بالوثائق المستهدفة لإنشاء تطبيقات مخصصة بدلا من محاولة تلبية متنوعة متطلبات مع تطبيق متجانسة.هذه الورقة تقدم نظرة عامة على العمارة ومبادئ تصميم Gamera.developing أنظمة التعرف على المستندات التاريخية الصعبة تتطلب التجربة لأن الحل غالبا ما يكون واضحا. لذلك، الهدف الأساسي في Gamera هو دعم دورة التنمية الفعالة من الاختبار والتحسين. كل التفاصيل التنفيذ مدفوعة بهذا الهدف. على سبيل المثال، تم اختيار Python كصباغة أساسية بسبب قدرات الاستبطان، والطباعة الديناميكية وسهولة الاستخدام. تم استخدامه ككلغة برمجة أول مع نجاح كبير يستخدم .c ++ يستخدم لكتابة الإضافات حيث يكون أداء وقت التشغيل يمثل أولوية، ولكن حتى في هذه الحالة، تم تصميم نظام Gamera Plugin لجعل امتدادات الكتابة سهلا قدر الإمكان. يتضمن Gamera واجهة مستخدم رسومية كاملة توفر عددا من الاختصارات للتدريب، بالإضافة إلى تفتيش نتائج الخوارزميات في كل خطوة - تحسين سهولة التجربة، نأمل أن نضع القدرة على تطوير أنظمة الاعتراف مع تلك من يفهم الوثائق الأفضل. نتوقع أن يعمل نوعان على الأقل من المطورين مع النظام: أولئك الذين لديهم خلفية تقنية تضيف خوارزميات للنظام، وتلك التي تعمل على التجميع الأعلى على المستوى الأعلى لهذه القطع. من المهم ملاحظة هذا التمييز، نظرا لأن هذه المجموعات تمثل مجموعات ومتطلبات مختلفة مختلفة. بالإضافة إلى دعمها لتطوير الاختبار والتطوير، لدى Gamera أيضا العديد من المزايا الأخرى التي تعتبر مهمة لمشاريع الرقمنة على نطاق واسع بشكل عام. هذه هي: برمز المصدر المفتوح والمعايير الامتثال بحيث يمكن للبرنامج التفاعل بشكل جيد مع أجزاء أخرى من إطار الرقص استقلال المنصة، يعمل على مجموعة متنوعة من أنظمة التشغيل بما في ذلك Linux و Microsoft Windows و Mac OS-X نظام سير العمل للجمع بين المهام الرفيعة المستوى معالجة الدفعات إطار اختبار الوحدة لضمان صحة وتجنب الانحدار مكونات واجهة المستخدم لتطوير وتدريب المصنف إخراج الثقة الاعتراف بحيث يمكن لمديرو التحصيل مستهدفين المستهدف بسهولة المستندات التي تحتاج إلى تصحيح أو استراتيجيات التعرف المختلفة. Gamera لديه بنية مساعدية وحدات. عادة ما تؤدي هذه الوحدات النمطية واحدة من خمس مهام التعرف على المستندات الخمسة: 1. قبل المعالجة 2. تجزئة الوثائق والتحليل 3. تجزئة الرمز والتصنيف 4. التحليل النحوي أو الهيكلية 5. يمكن أن يكون إخراج هذه المهام معقدا بشكل تعسفي، وإشراك استراتيجيات أو وحدات متعددة، أو تتم إزالتها بالكامل وفقا لمشكلة الاعتراف المحددة في متناول اليد. يتم التحكم في الخطوات الفعلية التي تشكل نظام الاعتراف الكامل بالكامل من قبل المستخدم. تتضمن المعالجة المعالجة القياسية عمليات معالجة الصور مثل إزالة الضوضاء، وضوح، وإزالة النظافة، وضبط التباين، والحاجة، والتبريد، والمورفولوجيا. الاهتمام الوثيق لتحسين هذه الخطوات مهم بشكل خاص عند العمل مع الوثائق التاريخية المتدهورة. ما الجديد في هذا الإصدار: الإضافات to_numpy و from_numpy أضيفت لدعم Numpy؛ تم استبدال الوحدات الرقمية والرقم الرقمية المنهقة ب Numpy تسليط الضوء على أعمال أيضا مع صور Greyscale و Onetit تم تصحيح تغيير حجم وظيفة في Vigra يمكن الآن إرجاع مصنف KNN تدابير ثقة مختلفة للمعرف الرئيسي الذي يتم اختياره من قبل المستخدم. راجع وثائق API المصنف للحصول على التفاصيل. يعمل CNN المصنف الآن كما هو متوقع عند K> 1؛ حتى الآن، تم فرز ID_NAME عن طريق الثقة، مما يعني أنه كان دائما أبعد أقصى من بين KEEPER KEEVERE الآن يجمع الآن مع بيثون 2.6 (بفضل برابات سوريافول)


gamera برامج ذات صلة

التقاط البيانات

DataTacapture هي حزمة TCL / TK للحصول على البيانات خارج المؤامرات العلمية (أو من أي مؤامرة أخرى لهذه المسألة). ...

197

تحميل