ncbix :: bigfetch.

استرجاع مجموعات نتيجة NCBI كبيرة جدا على أساس عمليات البحث عن الكلمات الرئيسية باستخدام NCBI Eutils
التحميل الان

ncbix :: bigfetch. الترتيب والملخص

الإعلانات

  • Rating:
  • رخصة:
  • Perl Artistic License
  • السعر:
  • FREE
  • اسم الناشر:
  • Roger A Hall
  • موقع ويب الناشر:
  • http://search.cpan.org/~rogerhall/

ncbix :: bigfetch. العلامات


ncbix :: bigfetch. وصف

استرجاع مجموعات ناتجية NCBI كبيرة للغاية بناء على عمليات البحث عن الكلمات الرئيسية باستخدام NCBI Eutils NCBix :: BigFetch هي وحدة بيرل مفيدة لتنزيل مجموعات نتيجة كبيرة جدا من التسلسلات من NCBI بالنظر إلى استعلام نصي. كان أول استخدام لها أكثر من 11،000،000 سلسلة نتيجة للبحث عن الكلمات الرئيسية واحدة. يستخدم YAML لإنشاء ملف تكوين للحفاظ على حالة المشروع في حالة شبكة أو مشكلات الخادم تقاطع التنفيذ، وفي هذه الحالة قد يتم إعادة تشغيله بسهولة بعد الدفعة الأخيرة. يتم تنظيم البيانات Adloaded بواسطة "معرف المشروع" و "الدليل الأساسي" وحفظه في الملفات النصية. يتضمن كل ملف معرف المشروع باسمه. مفاتيح Project_ID و Base_dir هي المفاتيح المطلوبة الوحيدة، على الرغم من أنك ستحصل على نفس البحث عن "ApopTosis" في كل مرة إلا إذا قمت أيضا بتعيين مفتاح "الاستعلام". في أي حال، بمجرد بدء تشغيل المشروع، فإنه يحتاج فقط إلى إعادة تحميل المعلمات فقط .besides ملفات البيانات، يتم حفظ ملفين آخرين: 1) نتيجة البحث الأولي، والتي تتضمن مفتاح WebEnv، و 2) ملف التكوين ، والتي توفر البيانات المحيطة بها وتستخدم لالتقاط التنزيل واستعادة دفعات أو تسلسل مفقود. يتم إعادة اختراق Results على دفعات اعتمادا على مفتاح "Return_Max". بشكل افتراضي، يبدأ "الفهرس" عند 1 وتنزيل التنزيلات حتى يتجاوز الفهرس "عدد الأخطاء. composuccascasionally تحدث دفعات كاملة. في هذه الحالة، يتم إضافة "الفهرس" إلى القائمة "المفقودة". يتم حفظ هذه القائمة في ملف التكوين. يجب تنزيل الدفعات المفقودة كل يوم، ولا يتم حفظها حتى يتم تضمين نهاية التشغيل الكامل. يتم تضمين البرامج النصية الكاملة في دليل البرنامج النصي: Fetch-ALL.PP Fetch-Missing.psp-Unavailable.ppphe سير العمل الموصى به هو: 1. انسخ البرامج النصية وتحريرها لمشروع معين. استخدم رقم جديد كمعرف المشروع. 2. ابدأ في التنزيل عن طريق تشغيل Fetch-ALL.PP، والذي سيقوم أولا بإرسال استفسار وحفظ مفتاح WebEnv الناتج في ملف تكوين محدد للمشروع (باستخدام YAML). 3. في صباح اليوم التالي، اقتل عملية Fetch-ALL.PP وتشغيل fetch-missing.pp حتى يكمل. 4. إعادة تشغيل fetch-all.pp. إذا كنت ترغب في إعادة تنزيل التسلسلات "غير متوفرة"، فقد تقوم بتشغيل Fetch-Unavailable.pp. ومع ذلك، سيتم تنزيلها في نهاية Fetch-ALL.PP إذا كان يكمل بشكل طبيعي. إذا كانت مجموعة نتائج الاستعلام الخاصة بك كبيرة جدا بحيث لا يتم تشغيل أوقات WebEnv الخاصة بك، ما عليك سوى بدء مشروع جديد مع هذا الفهرس الأخير للمشروع السابق، وهو سوف تلتقط النتيجة من هناك (مع WebEnv جديد). (ترقية مخطط لها ستبدأ بحث تلقائي آخر.) تحذير: قد تفقد أسئلة قليلة (جدا) إذا تمتد التنزيل عبر مشاريع متعددة. ومع ذلك، يوضح اختبارنا أن الدفعات التي تم إنشاؤها بنفس الاستفسار في غضون أيام قليلة من بعضها البعض متطابقة إلى حد كبير. استخدام NCBix :: BigFetch؛ # المعلمات بلدي Params $ Params = {project_id => "1"، base_dir => "/ الصفحة الرئيسية / المستخدم / البيانات"، DB => "البروتين"، الاستعلام => "ApopTosis"، Return_Max => "500"}؛ # بداية المشروع بلدي مشروع $ = NCBix :: BigFetch-> جديد (Params $)؛ # أحب واحد كنت مع طباعة المؤلفين: ". مشروع $ -> المؤلفون (). "\ن"؛ # محاولة جميع دفعات من التسلسلات أثناء ($ المشروع-> النتائج_ ينتظر ()) {$ project-> get_next_batch ()؛ } # # الحصول على دفعات مفقودة أثناء ($ المشروع-> مفقود_إبزات ()) {$ project-> get_missing_batch ()؛ } # العثور على معرفات غير متوفرة لي $ ids = $ project-> غير متوفر_يدس ()؛ # استرجاع معرفات غير متوفرة foreach معرف $ (@ $ IDS) {$ project-> get_dance ($ معرف)؛ } متطلبات: perl.


ncbix :: bigfetch. برامج ذات صلة