بنك الجينات
قاعدة تسلسل البيانات بنك الجينات عبارة عن مجموعة مفتوحة الوصول لجميع تسلسلات النيوكليوتيد المتاحة للجمهور وترجمات البروتين. يتم إنتاج قاعدة البيانات هذه وصيانتها من قِبل المركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI)، وهو جزء من المعاهد الوطنية للصحة في الولايات المتحدة) كجزء من التعاون الدولي لقواعد بيانات تسلسل النوكليوتيدات (INSDC).
المحتويات | |
---|---|
الوصف | تسلسل النوكليوتيدات لأكثر من 300000 كائن حي مع دعم الشرح الببليوغرافي والبيولوجي. |
نوع البيانات | قالب:تسلسل النيوكليوتيدات |
الكائنات | الكل |
العناوين | |
مركز الأبحاث | NCBI |
الاستشهاد الأولى | 21071399 |
تاريخ الإطلاق | قالب:تاريخ البدء والعمر |
الوصول | |
صيغة الملف |
|
الموقع | NCBI |
رابط التحميل | ncbi ftp |
خدمة ويب URL | |
الأدوات | |
ويب | بلاست |
برمجية | BLAST |
متنوعات | |
الرخصة | Unclear[1] |
يتلقى بنك الجينات والمتعاونون معه تسلسل منتج في المختبرات في جميع أنحاء العالم من أكثر من 100000 كائن مختلف. بدأت قاعدة البيانات في عام 1982 من قبل والتر جواد ومختبر لوس ألاموس الوطني. أصبح بنك الجينات قاعدة بيانات مهمة للبحوث في المجالات البيولوجية والتي نمت في السنوات الأخيرة بمعدل كبير من خلال مضاعفته كل 18 شهرًا تقريبًا.[2][3]
يحتوي الإصدار 194، الذي أنتج في شباط 2013 أكثر من 150 مليار من قواعد النيوكليوتيد بأكثر من 162 مليون تسلسل.[4] تم بناء بنك الجينات من خلال التقديمات المباشرة من المختبرات الفردية، وكذلك من التقديمات الضخمة من مراكز التسلسل واسعة النطاق.
المقدمة
عدليمكن تقديم التسلسلات الأصلية فقط إلى بنك الجينات. يتم إرسال التقديمات المباشرة إلى بنك الجينات باستخدام BankIt، وهو نموذج قائم على الإنترنت، أو برنامج التقديم القائم بذاته، Sequin. عند استلام التقديم التسلسلي، يقوم موظفو بنك الجينات بفحص أصالة البيانات ويعيين رقم وصول إلى التسلسل وإجراء اختبارات لضمان الجودة. ثم يتم تحرير التقديمات إلى قاعدة البيانات العامة، حيث يمكن استرجاع المدخلات بواسطة Entrez أو يمكن تنزيلها بواسطة FTP. يتم تقديم الجزء الأكبر لعلامة التسلسل المعبر عنها (EST)، موقع تسلسل الملحقات (STS)، تسلسل مسح الجينوم (GSS)، وتسلسل الإنتاجية العالية للجينوم (HTGS) وغالبا ما قدمت بيانات من خلال مراكز التسلسل على نطاق واسع. تقوم مجموعة التقديمات المباشرة من بنك الجينات أيضا بمعالجة تسلسل الجينوم الكامل للميكروبات.
التاريخ
عدلأنشأ والتر جواد من مجموعة البيولوجيا النظرية والفيزياء الحيوية في مختبر لوس ألاموس الوطني وآخرين قاعدة بيانات التسلسل لوس ألاموس (LANL) في عام 1979، والتي بلغت ذروتها في عام 1982 مع إنشاء بنك الجينات العام.[5] تم تقديم التمويل من قبل المعاهد الوطنية للصحة، والمؤسسة الوطنية للعلوم، ووزارة الطاقة، ووزارة الدفاع. تعاونت LANL على بنك الجينات مع شركة Bolt وBeranek وNewman، ذلك وبحلول نهاية عام 1983 تم تخزين أكثر من 2000 تسلسل فيه.
في منتصف الثمانينيات من القرن الماضي، أدارت شركة Intelligenetics للمعلوماتية الحيوية بجامعة ستانفورد مشروع بنك الجينات بالتعاون مع LANL.[6] كأحد أقدم مشاريع مجتمع المعلوماتية الحيوية على الإنترنت، بدأ مشروع بنك الجينات مجموعات BIOSCI / Bionet الإخبارية لتشجيع الاتصالات المفتوحة الوصول بين علماء الأحياء. خلال الفترة من 1989 إلى 1992، انتقل مشروع بنك الجينات إلى المركز الوطني لمعلومات التكنولوجيا الحيوية الذي تم إنشاؤه حديثًا.[7]
التطور
عدلتشير ملاحظات بنك الجينات للإصدار 162.0 (أكتوبر 2007) إلى أنه «من 1982 إلى الوقت الحاضر، تتضاعف عدد القواعد في بنك الجينات كل 18 شهرًا تقريبًا».[4][8] اعتبارًا من 15 يونيو 2019[تحديث]، يحتوي بنك الجينات الإصدار 232.0 على 213,383,758 loci، 329,835,282,7070 من القواعد، من 213,383,758 تسلسل تم الإبلاغ عنه.[4]
تتضمن قاعدة بيانات بنك الجينات مجموعات بيانات إضافية يتم إنشاؤها آليًا من مجموعة بيانات التسلسل الرئيسية، وبالتالي يتم استبعادها من هذا العدد.
كائن حي | قاعده ازواج |
---|---|
الانسان العاقل | 16٬310٬774٬187 |
عضلات الفـأر | 9٬974٬977٬889 |
الجرذ النرويجي | 6٬521٬253٬272 |
الثور | 5٬386٬258٬455 |
زيا ميس | 5٬062٬731٬057 |
سوس scrofa | 4٬887٬861٬860 |
دانيو ريريو | 3٬120٬857٬462 |
Strongylocentrotus purpuratus | 1٬435٬236٬534 |
ماكاكا مولاتا | 1٬256٬203٬101 |
Oryza sativa Japonica Group | 1٬255٬686٬573 |
نيكوتيانا تاباكوم | 1٬197٬357٬811 |
Xenopus (Silurana) الاستوائية | 1٬249٬938٬611 |
ذبابة الفاكهة سوداء البطن | 1٬119٬965٬220 |
سكنة الكهوف القومية | 1٬008٬323٬292 |
نبات الأرابيدوبسيس thaliana | 1٬144٬226٬616 |
احد افراد اسرة الكلب، ذئب | 951٬238٬343 |
كرمة العنب الأوروبي | 999٬010٬073 |
جالوس جالوس | 899٬631٬338 |
جليكاين ماكس | 906٬638٬854 |
قمح | 898٬689٬329 |
تعريفات غير كاملة
عدلتفتقر قواعد البيانات العامة التي يمكن البحث فيها باستخدام أداة البحث عن الموائمة المحلية الأساسية للمركز الوطني للمعلومات المتعلقة بالتكنولوجيا الحيوية (NCBI BLAST)، إلى استعراض التسلسل من قِبل النظراء لسلالات الأنواع وتسلسل السلالات غير النوعية. من ناحية أخرى، في حين أن قواعد البيانات التجارية يحتمل أن تحتوي على بيانات مصفاة متسلسلة عالية الجودة، إلا أن هناك عددًا محدودًا من المتسلسلات كمرجع.
قامت ورقة صدرت في مجلة علم الأحياء الدقيقة السريرية[10] بتقييم نتائج تسلسل الجينات لـ 16S rRNA التي تم تحليلها مع بنك الجينات بالاقتران مع قواعد البيانات العامة الأخرى المتاحة مجانًا والتي تتحكم في الجودة على شبكة الإنترنت، مثل EzTaxon -e (http: // eztaxon-e.ezbiocloud.net/) وقواعد بيانات BIBI (http://pbil.univ-lyon1.fr/bibi/). أظهرت النتائج أن التحليلات التي أجريت باستخدام بنك الجينات مع EzTaxon -e (kappa = 0.79) كانت أكثر تمييزًا من استخدام بنك الجينات (kappa = 0.66) أو قواعد البيانات الأخرى وحدها.
انظر أيضا
عدل- Ensembl
- قاعدة بيانات البروتين البشري (HPRD)
- تحليل التسلسل
- يونيبروت
- قائمة الجينوم حقيقية النواة المتسلسلة
- قائمة الجينومات الأثرية المتسلسلة
- RefSeq — قاعدة بيانات التسلسل المرجعي
- Geneious — يتضمن أداة تقديم GenBank
- فتح البيانات العلمية
المراجع
عدل- ^ The download page at UCSC says "NCBI places no restrictions on the use or distribution of the GenBank data. However, some submitters may claim براءات الاختراع البيولوجية, copyright, or other intellectual property rights in all or a portion of the data they have submitted. NCBI is not in a position to assess the validity of such claims, and therefore cannot provide comment or unrestricted permission concerning the use, copying, or distribution of the information contained in GenBank." نسخة محفوظة 10 أبريل 2019 على موقع واي باك مشين.
- ^ Benson D؛ Karsch-Mizrachi، I.؛ Lipman، D. J.؛ Ostell، J.؛ Wheeler، D. L.؛ وآخرون (2008). "GenBank". Nucleic Acids Research. ج. 36 ع. Database: D25–D30. DOI:10.1093/nar/gkm929. PMC:2238942. PMID:18073190.
- ^ Benson D؛ Karsch-Mizrachi، I.؛ Lipman، D. J.؛ Ostell، J.؛ Sayers، E. W.؛ وآخرون (2009). "GenBank". Nucleic Acids Research. ج. 37 ع. Database: D26–D31. DOI:10.1093/nar/gkn723. PMC:2686462. PMID:18940867.
- ^ ا ب ج "GenBank release notes". NCBI. مؤرشف من الأصل في 2018-04-01.
- ^ Hanson، Todd (21 نوفمبر 2000). "Walter Goad, GenBank founder, dies". Newsbulletin: obituary. Los Alamos National Laboratory. مؤرشف من الأصل في 2008-11-07.
- ^ LANL GenBank History نسخة محفوظة 3 مارس 2016 على موقع واي باك مشين.
- ^ Benton D (1990). "Recent changes in the GenBank On-line Service". Nucleic Acids Research. ج. 18 ع. 6: 1517–1520. DOI:10.1093/nar/18.6.1517. PMC:330520. PMID:2326192.
- ^ Benson، D. A.؛ Cavanaugh، M.؛ Clark، K.؛ Karsch-Mizrachi، I.؛ Lipman، D. J.؛ Ostell، J.؛ Sayers، E. W. (2012). "GenBank". Nucleic Acids Research. ج. 41 ع. Database issue: D36–D42. DOI:10.1093/nar/gks1195. PMC:3531190. PMID:23193287.
- ^ "GenBank". Nucleic Acids Res. ج. 39 ع. Database issue: D32–37. يناير 2011. DOI:10.1093/nar/gkq1079. PMC:3013681. PMID:21071399.
- ^ Kyung Sun Parka, Chang-Seok Kia, Cheol-In Kangb, Yae-Jean Kimc, Doo Ryeon Chungb, Kyong Ran Peckb, Jae-Hoon Songb and Nam Yong Lee (مايو 2012). "Evaluation of the GenBank, EzTaxon, and BIBI Services for Molecular Identification of Clinical Blood Culture Isolates That Were Unidentifiable or Misidentified by Conventional Methods". J. Clin. Microbiol. ج. 50 ع. 5: 1792–1795. DOI:10.1128/JCM.00081-12. PMC:3347139. PMID:22403421.
{{استشهاد بدورية محكمة}}
: صيانة الاستشهاد: أسماء متعددة: قائمة المؤلفين (link)
روابط خارجية
عدل- بنك الجينات
- مثال على سجل تسلسل، للبيتا الهيموغلوبين
- BankIt
- Sequin — أداة برمجية مستقلة تم تطويرها بواسطة NCBI لتقديم وتحديث الإدخالات إلى قاعدة بيانات تسلسل GenBank.
- EMBOSS — البرمجيات الحرة مفتوحة المصدر للبيولوجيا الجزيئية
- GenBank وRefSeq وTPA وUniProt: ماذا يوجد في الاسم؟