تأثير باتش

الاختلاف غير الحيوي في نتائج التجارب الحيوية

في علم الأحياء الجزيئي، يحدث تأثير باتش (بالانجليزية:Batch effect) عندما تسبب العوامل غير البيولوجية في التجربة تغييرات في البيانات التي تنتجها التجربة.  يمكن أن تؤدي هذه التأثيرات إلى استنتاجات غير دقيقة عندما ترتبط أسبابها بواحدة أو أكثر من النتائج المهمة في التجربة.  وهي شائعة في العديد من أنواع تجارب التسلسل عالية الإنتاجية، بما في ذلك تلك التي تتضمن المصفوفات الدقيقة (microarrays)، ومقاييس الطيف الكتلي،[1] وبيانات تسلسل الحمض النووي الريبي أحادية الخلية.[2] تتم مناقشتها بشكل شائع في سياق علم الجينوم وأبحاث التسلسل عالية الإنتاجية، ولكنها موجودة في مجالات أخرى من العلوم أيضًا.[1]

تعريفات

عدل

تم اقتراح تعريفات متعددة لمصطلح "تأثر باتش" في علم الادب والتأليف. لازار (Lazar) وآخرون (2013) لاحظ أن "تقديم تعريف كامل لا لبس فيه لما يسمى بتأثير باتش يعد مهمة صعبة، لا سيما لأن أصولها والطريقة التي تظهر بها في البيانات غير معروفة تمامًا أو غير مسجلة."  بالتركيز على تجارب المصفوفة الدقيقة، اقترحوا تعريفًا جديدًا يعتمد على العديد من التجارب السابقة: "[T] يمثل تأثير باتش الاختلافات التقنية المنهجية عند معالجة العينات وقياسها على دفعات مختلفة والتي لا علاقة لها بأي تباين بيولوجي تم تسجيله خلال تجربة [MAGE [microarray gene expression.[3]

الأسباب

عدل

تم تحديد العديد من العوامل المتغيرة المحتملة كأسباب لتأثيرات باتش، بما في ذلك ما يلي:

  • ظروف المختبر.[1]
  • اختيار دفعة أو دفعة الكاشف.[1][4]
  • الفروق في الموظفين.[1]
  • الوقت من اليوم الذي أجريت فيه التجربة.[4]
  • مستويات الأوزون في الغلاف الجوي.[4]
  • الأدوات المستخدمة لإجراء التجربة.

تصحيح

عدل

تم تطوير تقنيات إحصائية مختلفة لمحاولة تصحيح تأثيرات باتش في التجارب عالية الإنتاجية. هذه التقنيات مخصصة للاستخدام خلال مراحل التصميم التجريبي وتحليل البيانات. لقد ركزوا تاريخيًا في الغالب على تجارب الجينوم، ولم يبدأوا إلا مؤخرًا في التوسع في مجالات علمية أخرى مثل البروتينات.[5] إحدى المشكلات المرتبطة بهذه التقنيات هي أنها قد تزيل عن غير قصد التنوع البيولوجي الفعلي.[6]  تتضمن بعض التقنيات التي تم استخدامها لاكتشاف و/أو تصحيح تأثيرات الدُفعات ما يلي:

بالنسبة لبيانات المصفوفة الدقيقة (microarrays) تم استخدام نماذج مختلطة خطية، مع تضمين عوامل التباس (confounding) في اعتراضات عشوائية.[7]

  • في عام 2007 ، جونسون ( Johnson) وآخرون اقترح تقنية empirical Bayesian التجريبية لتصحيح تأثيرات باتش.  يمثل هذا النهج تحسنًا مقارنة بالطرق السابقة من حيث أنه يمكن استخدامه بشكل فعال مع أحجام دفعات صغيرة.[4]
  • في عام 2012 ، تم تقديم حزمة برامج sva،  يتضمن وظائف متعددة لضبط تأثيرات الباتش، بما في ذلك استخدام تقدير متغير بديل والذي سبق أن ثبت أنه يحسن التكاثر ويقلل الاعتماد في التجارب عالية الإنتاجية.
  • Haghverdi اقترح (2018) تقنية مصممة لبيانات تسلسل الحمض النووي الريبي أحادية الخلية، بناءً على اكتشاف أقرب الجيران المتبادلين في البيانات.[2]
  • بابيز (Papiez) وآخرون (2019) اقترح خوارزمية برمجة ديناميكية لتحديد تأثيرات الدُفعات ذات القيمة غير المعروفة في البيانات عالية الإنتاجية.[8]

المراجع

عدل
  1. ^ ا ب ج د ه Leek, Jeffrey T.; Scharpf, Robert B.; Bravo, Héctor Corrada; Simcha, David; Langmead, Benjamin; Johnson, W. Evan; Geman, Donald; Baggerly, Keith; Irizarry, Rafael A. (Oct 2010). "Tackling the widespread and critical impact of batch effects in high-throughput data". Nature Reviews Genetics (بالإنجليزية). 11 (10): 733–739. DOI:10.1038/nrg2825. ISSN:1471-0056. PMC:3880143. PMID:20838408.
  2. ^ ا ب Haghverdi, Laleh; Lun, Aaron T L; Morgan, Michael D; Marioni, John C (May 2018). "Batch effects in single-cell RNA-sequencing data are corrected by matching mutual nearest neighbors". Nature Biotechnology (بالإنجليزية). 36 (5): 421–427. DOI:10.1038/nbt.4091. ISSN:1087-0156. PMC:6152897. PMID:29608177.
  3. ^ Leek, Jeffrey T.; Johnson, W. Evan; Parker, Hilary S.; Jaffe, Andrew E.; Storey, John D. (15 Mar 2012). "The sva package for removing batch effects and other unwanted variation in high-throughput experiments". Bioinformatics (بالإنجليزية). 28 (6): 882–883. DOI:10.1093/bioinformatics/bts034. ISSN:1460-2059. PMC:3307112. PMID:22257669.
  4. ^ ا ب ج د Johnson, W. Evan; Li, Cheng; Rabinovic, Ariel (1 Jan 2007). "Adjusting batch effects in microarray expression data using empirical Bayes methods". Biostatistics (بالإنجليزية). 8 (1): 118–127. DOI:10.1093/biostatistics/kxj037. ISSN:1468-4357. PMID:16632515.
  5. ^ Čuklina، Jelena؛ Pedrioli، Patrick G. A.؛ Aebersold، Ruedi (2020). Review of Batch Effects Prevention, Diagnostics, and Correction Approaches. Methods in Molecular Biology. ج. 2051. ص. 373–387. DOI:10.1007/978-1-4939-9744-2_16. ISBN:978-1-4939-9743-5. ISSN:1940-6029. PMID:31552638.
  6. ^ Goh, Wilson Wen Bin; Wang, Wei; Wong, Limsoon (Jun 2017). "Why Batch Effects Matter in Omics Data, and How to Avoid Them". Trends in Biotechnology (بالإنجليزية). 35 (6): 498–507. DOI:10.1016/j.tibtech.2017.02.012. PMID:28351613.
  7. ^ Espín-Pérez, Almudena; Portier, Chris; Chadeau-Hyam, Marc; van Veldhoven, Karin; Kleinjans, Jos C. S.; de Kok, Theo M. C. M. (30 Aug 2018). Krishnan, Viswanathan V. (ed.). "Comparison of statistical methods and the use of quality control samples for batch effect correction in human transcriptome data". PLOS ONE (بالإنجليزية). 13 (8): e0202947. Bibcode:2018PLoSO..1302947E. DOI:10.1371/journal.pone.0202947. ISSN:1932-6203. PMC:6117018. PMID:30161168.
  8. ^ Papiez, Anna; Marczyk, Michal; Polanska, Joanna; Polanski, Andrzej (1 Jun 2019). Berger, Bonnie (ed.). "BatchI: Batch effect Identification in high-throughput screening data using a dynamic programming algorithm". Bioinformatics (بالإنجليزية). 35 (11): 1885–1892. DOI:10.1093/bioinformatics/bty900. ISSN:1367-4803. PMC:6546123. PMID:30357412.