اكتشاف قائم على الأدبيات

شكل من أشكال استخراج المعرفة وتوليد الفرضيات تلقائيًا باستخدام الأوراق والمنشورات الأكاديمية الأخرى لإيجاد علاقات جديدة بين المعرفة المو

الاكتشاف القائم على الأدبيات أو الاكتشاف المبني على الأدبيات (LBD) هو أحد أشكال استخراج المعرفة وتوليد الفرضيات بطريقة آلية أو شبه آلية[1] بناءً على الأوراق والمنشورات الأكاديمية ("الأدبيات") لإيجاد علاقات جديدة بين المعرفة الموجودة ("الاكتشاف"). يهدف الاكتشاف القائم على الأدبيات إلى اكتشاف المعرفة الجديدة من خلال ربط المعلومات التي تم ذكرها صراحةً في الأدبيات العلمية لاستنتاج الروابط التي لم يتم ذكرها صراحةً.[2]

اكتشاف قائم على الأدبيات
صنف فرعي من

يمكن أن يساعد الاكتشاف القائم على الأدبيات الباحثين على اكتشاف واستكشاف الفرضيات بسرعة بالإضافة إلى اكتساب معلومات حول التطورات ذات الصلة داخل وخارج مجالاتهم وزيادة تبادل المعلومات بين التخصصات.

مخطط تفصيلي لربط سوانسون، باستخدام نموذج ABC

يُطلق على النوع الأكثر أساسية وانتشارًا من الاكتشافات القائمة على الأدبيات اسم نموذج ABC لأنه يركز على ثلاثة مفاهيم تسمى A وB و C.[3][4] وينص على أنه إذا كان هناك ارتباط بين A و B وواحد بين B و C، فهناك ارتباط بين A و C، والذي إذا لم يتم ذكره صراحةً، لم يتم استكشافه بعد.[2]

الاكتشاف المرتبط بالأدبيات (LRD) هو مصطلح مشابه يُستخدم أحياناً بشكل مترادف ولكنه يتكون من عنصرين: الأول هو الاكتشاف القائم على الأدبيات (LBD) الذي يولد اكتشافًا محتملًا من خلال تحليل الأدبيات لوحدها، والثاني الاكتشاف بمساعدة الأدبيات (LAD) والذي يولد اكتشافًا محتملًا من خلال مزيج من تحليل الأدبيات والتفاعلات بين مؤلفي الأدبيات المختارين. هناك نوعان من كل من الاكتشاف القائم على الأدبيات (LBD) والاكتشاف بمساعدة الأدبيات(LAD): الأول هو أنظمة الاكتشاف المفتوح (ODS)، حيث يبدأ المرء بمشكلة ويصل إلى حل، والثاني هو أنظمة الاكتشاف المغلقة (CDS)، حيث يبدأ المرء بمشكلة وحل، ثم يحدد الآلية (الآليات) التي تربط بينهما.[5]

التاريخ

عدل

راد عالم الحاسوب والفيزيائي دون ر. سوانسون تقنية الاكتشاف القائم على الأدبيات في الثمانينيات.[6] افترض أنه في حال وجود ارتباط بين نتيجتين هما A و B وارتباط آخر بين B و C في بحثين منفصلين منشورين، فهناك ارتباط غير معروف أو غير مستكشف بين A و C. استخدم هذا النهج لاقتراح زيت السمك علاجاً لمتلازمة رينو بسبب علاقتهما المشتركة بلزوجة الدم.[7] وقد ثبت لاحقًا أن هذه الفرضية لها قيمة في دراسة مستقبلية، واقترح متابعة اكتشافات أخرى باستخدام طرق مماثلة.[8][9][10]

ربط سوانسون

عدل

ربط سوانسون هو مصطلح اِقتُرح في عام 2003 [11] يشير إلى ربط قطعتين من المعرفة كان يُعتقد سابقًا أنهما غير مرتبطتين.[12] على سبيل المثال، قد يكون من المعروف أن المرض أ ناتج عن مادة كيميائية ب، ومن المعروف أن الدواء ج يقلل من كمية المادة الكيميائية ب في الجسم. ومع ذلك، نظرًا لأن المقالات المعنية نُشرت بشكل منفصل عن بعضها البعض (تسمى "بيانات منفصلة")، فقد تكون العلاقة بين المرض أ والدواء ج غير معروفة. يهدف ربط سوانسون إلى إيجاد هذه العلاقات والإبلاغ عنها.

على الرغم من استخدام نموذج ABC على نطاق واسع، فقد زعم منتقدو النظام أن الكثير من العلوم لا يتم التقاطها على أساس تأكيدات بسيطة بل يتم بناؤها بدلاً من ذلك من القياسات والصور على مستوى أعلى من التجريد.[13]

الأنظمة

عدل
 
نظام الاكتشاف القائم على الأدبيات Anni 2.0، والذي يستخدم سير عمل مماثل لأنظمة الاكتشافات القائمة على الأدبيات الأخرى.[14]

الاكتشاف القائم على الأدبيات له عمومًا نوعين: الاكتشاف المفتوح والاكتشاف المغلق. في الاكتشاف المفتوح، يتم إعطاء A فقط. يجد النهج Bs ويستخدمها لإرجاع Cs المثيرة للاهتمام المحتملة للمستخدم، وبالتالي توليد فرضيات من A. في الاكتشاف المغلق، يتم إعطاء A و C للنهج الذي يسعى إلى العثور على Bs التي يمكن أن تربط بين الاثنين، وبالتالي اختبار فرضية حول A و C.

تم تطوير عدد من الأنظمة لأداء الاكتشاف القائم على الأدبيات على مر السنين، مما أدى إلى توسيع الفكرة الأصلية لدون سوانسون، وتقييم جودة مثل هذه الأنظمة هو مجال بحث نشط.[15] تتضمن بعض الأنظمة إصدارات ويب لزيادة سهولة الاستخدام.[16] النهج الشائع للعديد من الأنظمة هو استخدام مصطلحات MeSH لتمثيل المقالات العلمية. يستخدم هذا من قبل أنظمة Manjal وBITOLA وLitLinker.[17][18]

يُطلق على أحد الأنظمة المعروفة في هذا المجال اسم Arrowsmith وهو مصمم للعثور على اتصالات بين مجموعتين منفصلتين من المقالات، وهو النهج المسمى "بحث العقدتين".[19]

يستخدم نظام آخر معروف، LION LBD[20] PubTator [21] لشرح المقالات العلمية في PubMed بمفاهيم مثل المواد الكيميائية والجينات/البروتينات والطفرات والأمراض والأنواع؛ بالإضافة إلى شرح على مستوى الجملة لعلامات السرطان التي تصف العمليات والسلوكيات الأساسية للسرطان.[22]تستخدم مقاييس التواجد المشترك لتصنيف العلاقات بين المفاهيم وتقوم بالاكتشاف المفتوح والمغلق.

في حين تعتمد أنظمة الاكتشاف القائم على الأدبيات على الأساليب الإحصائية التقليدية، تستفيد أنظمة أخرى من أساليب التعلم الآلي المتطورة، مثل الشبكات العصبية. تمثل بعض هذه الأنظمة العلاقة بين المفاهيم كرسم بياني للمعرفة، وبالتالي تستخدم تقنيات نظرية الرسم البياني.[23]كما أن التمثيل القائم على الرسم البياني هو الأساس لأنظمة الاكتشاف القائم على الأدبيات التي تستخدم قواعد بيانات الرسم البياني مثل Neo4J، مما يتيح الاكتشاف عبر لغات استعلام الرسم البياني مثل Cypher.[24]

تمثل هذه الأنظمة القائمة على الرسم البياني العلاقات بين المفاهيم باستخدام أنواع مختلفة من العلاقات، مثل تلك الموجودة في شبكة نظم اللغة الطبية الموحدة UMLS الدلالية.[25]تذهب بعض الأساليب إلى أبعد من ذلك وتحاول تطبيق العلاقات السياقية،[26]وهو النهج الذي يستخدمه أيضًا علم الوجود الجيني في نمذجة النشاط السببي (GO-CAM).[27]

استخدام قواعد البيانات

عدل

بالإضافة إلى استخراج المعلومات من مجموعة المقالات العلمية، غالبًا ما تستخدم أنظمة الاكتشاف القائم على الأدبيات المعرفة المنظمة من الموارد البيولوجية المنظمة، مثل الوراثة المندلية البشرية عبر الإنترنت (OMIM).[28]

فيما يلي أنظمة الاكتشافات القائمة على الأدبيات المنشورة، مرتبة حسب تاريخ النشر:[29]

1986 - Arrowsmith [7]

2000 - BITOLA V1 [30]

2001 - DAD [31]

2003 - LitLinker [32]

2004 - ACS [33]

2004 - Manjal [34]

2004 - IRIDESCENT [35]

2005 - BITOLA V2 [28]

2006 - LitLinker V2 [17]

2007 - Arrowsmith V2 [36]

2008 - Anni 2.0 [37]

2008 - CoPub Discovery [38]

2009 - RajoLink [39]

2010 - Sem-BT [39]

2015 - Obvio [23]

2016 - Spark [40]

2017 -Mine the gap [41]

2019 - LION LBD [20]

التصنيف الدلالي

عدل

تتمثل إحدى المهام الشائعة في الاكتشاف القائم على الأدب في تعيين الكلمات/المفاهيم لأنواع دلالية مختلفة. قد يتم تصنيف المفهوم تحت نوع واحد أو أنواع متعددة. على سبيل المثال، في نظام اللغة الطبية الموحدة (UMLS)، يتم تصنيف مصطلح الصداع النصفي تحت نوع المرض والمتلازمة، بينما يتم تصنيف مصطلح المغنيسيوم تحت نوعين: المادة النشطة بيولوجيًا والعنصر أو الأيون أو النظير.[17]تعمل تصنيف المفاهيم على صقل اكتشاف الروابط بين فئات معينة من المفاهيم، أي الأمراض-الجينات أو الأمراض-الأدوية.[17]

تقييم النظام

عدل

يعد تقييم الاكتشافات القائمة على الأدبيات أمرًا صعبًا، ويشمل كلًا من الأساليب التجريبية والمحاكاة الحاسوبية.[42] تحاول الأساليب تحديد كمية المعرفة التي تولدها الأنظمة، والتي يجب توفيرها بكمية وثراء مفيد للعلماء.[43]

التقييم صعب في الاكتشافات القائمة على الأدبيات لعدة أسباب: الخلاف حول دور أنظمة الاكتشافات القائمة على الأدبيات في البحث وبالتالي ما يجعل البحث ناجحًا؛ صعوبة تحديد مدى فائدة أو إثارة اهتمام أو قابلية الاكتشاف للتنفيذ؛ وصعوبة تحديد "الاكتشاف" بشكل موضوعي، مما يعيق إنشاء مجموعة تقييم قياسية تحدد متى تم تكرار الاكتشاف أو العثور عليه.[2]

الطريقة الشائعة المستخدمة في الاكتشاف القائم على الأدبيات هي تكرار الاكتشافات السابقة.[44][45][31]هذه عادةً ما تكون اكتشافات تعتمد على LBD لأنها سهلة القياس نسبيًا مقارنة بالاكتشافات الأخرى. لا يوجد سوى عدد قليل من هذه الاكتشافات والأساليب التي تم ضبطها لأداء جيد على هذه الاكتشافات قد لا تكون عامة. في هذا النوع من التقييم، يتم استخدام الأدبيات قبل الاكتشاف المراد تكراره لإنشاء قائمة مرتبة من مرشحي الاكتشاف كمصطلحات مستهدفة أو مرتبطة. يتم قياس النجاح من خلال الإبلاغ عن مرتبة المصطلح (المصطلحات) محل الاهتمام؛ فكلما ارتفعت المرتبة، كان النهج أفضل.

تتضمن عملية تقسيم الأدبيات أو تقسيم الوقت تقسيم الأدبيات الموجودة عند نقطة زمنية. ثم يتم عرض نظام LBD على الأدبيات قبل الانقسام ويتم تقييمه من خلال عدد الاكتشافات التي يمكنه اكتشافها في الفترة اللاحقة. استخدمت أنظمة الاكتشاف القائم على الأدبيات التزامن المصطلحي،[30]والعلاقات من الموارد الطبية الحيوية الخارجية (مثل SemMedDB)[46]والعلاقات الدلالية[25]لتوليد المعايير الذهبية. إن النهج عالي الدقة هو الحصول على رأي الخبراء لتوليد المعيار الذهبي،[15]ولكن هذا يستغرق وقتًا طويلاً ومكلفًا ويميل إلى إنتاج معدلات تذكر منخفضة.[2]

تتمثل ميزة تقسيم الوقت مقارنة بتكرار الاكتشافات السابقة في التقييم على عدد كبير من حالات الاختبار. وهذا يثير الحاجة إلى مقاييس التقييم التي يمكنها قياس الأداء على قوائم كبيرة ومرتبة.[2] استخدمت أعمال الاكتشاف القائم على الأدبيات مقاييس شائعة في استرجاع المعلومات [47] والتي تشمل الدقة والتذكر والمساحة تحت المنحنى (AUC) والدقة عند k ومتوسط الدقة المتوسط (MAP) وغيرها.[2]

يتجاوز نهج اقتراح اكتشافات أو علاجات جديدة تكرار الاكتشافات السابقة أو التنبؤ بحالات مقطعة زمنياً لعلاقة معينة ويظهر أن النظام قادر على الاستخدام في مواقف واقعية.[48] [45][49][50]وعادة ما يكون هذا مصحوبًا بنشر تمت مراجعته من قبل الأقران في المجال أو فحص من قبل خبير في المجال.

تعدين النص

عدل

تعتمد أتمتة الاكتشاف القائم على الأدبيات بشكل كبير على التنقيب في النصوص.[51] غالبًا ما تتضمن اللغة في المقالات العلمية غموضًا، وخطوة مهمة للتحليل المتماسك للأدبيات هي استخراج معنى كل مصطلح في السياق الذي يستخدم فيه، وهي مهمة تسمى فك التباس دلالة الكلمة (WSD).[52] على سبيل المثال، يمكن الخلط بين مصطلحات الجينات مثل CT (PCYT1A) وMR (NR3C2) مع اختصارات التصوير المقطعي المحوسب والرنين المغناطيسي، مما يتطلب أنظمة إزالة غموض (فك التباس) متطورة.[53] غالبًا ما يتم التوفيق بين المصطلحات والأنطولوجيات أو مصادر أخرى للمعرفات الفريدة، مثل نظام اللغة الطبية الموحدة (UMLS).[54] تسمى عملية تعيين العديد من العبارات المختلفة إلى اسم أو معرف واحد بالتطبيع.[55]

 
تطبيع اسم الجين، خطوة مهمة في الاكتشاف القائم على الأدبيات عند التعامل مع الجينات.[56]

الاستخدام

عدل

علوم الحياة

عدل

لقد تم استخدام الاكتشافات القائمة على الأدبيات بالفعل بطرق مختلفة لتحديد اتصالات جديدة بين الكيانات الطبية الحيوية والجينات المرشحة الجديدة وعلاجات الأمراض.[57]

اكتشاف الأدوية

عدل

استُخدمت الاكتشافات القائمة على الأدبيات في تطوير الأدوية وإعادة استخدامها[48][58] بالإضافة إلى التنبؤ بالتفاعلات الدوائية الضارة.[59][60]

استُخدمت طريقة الاكتشاف المستند إلى الأدبيات للبحث عن علاجات لعدد من الأمراض البشرية، بما في ذلك:

اعتلال الشبكية السكري.[61]

اعتلال عضلة القلب التوسعي[54]

مرض باركنسون[62]

سرطان البروستاتا[58]

سرطان المعدة[63]

التصلب المتعدد[64]

اكتشاف وظائف الجينات والبروتينات

عدل

تم استخدام النهج أيضًا لاقتراح علاقات الجينات بأمراض معينة،[65] مثل سرطان الثدي.[66]

في سياق علم اللقاحات، تم استخدامه لتحديد البروتينات المرتبطة بالإنترفيرون جاما والتي تلعب دورًا في الاستجابة للقاحات.[55] كما تم استخدامه لاقتراح آليات للأدوية المستخدمة حاليًا.[57]

اكتشاف الواسمات الحيوية

عدل

تم استكشاف الاكتشافات القائمة على الأدبيات كأداة لتحديد الواسمات الحيوية للتشخيص والتنبؤ بالأمراض، على سبيل المثال لخطر الإصابة بمرض السكري من النوع 2.[67]

استخدامات أخرى

عدل

بالإضافة إلى تقديم فرضيات علمية حول العالم، تم استخدامها أيضًا لتحسين تحليل البيانات، من خلال التعرف التلقائي على أي تأثيرات مخالطة باستخدام الأدبيات الطبية.[68]

كما تم استخدامه لفهم مسببات الأمراض بشكل أفضل وعلاقة الأمراض المختلفة، على سبيل المثال البحث عن الجينات التي تربط بين احتشاء العضلة القلبية والاكتئاب، [69] والارتباطات بين الأمراض النفسية والجسدية.[70]

مجالات خارج علوم الحياة

عدل

نُشرت الاكتشافات القائمة على الأدبيات في الغالب في المجال الطبي الحيوي، ولكنه استخدم أيضًا في مجالات أخرى، إذ طُبّق على الأبحاث في تطوير أنظمة تنقية المياه، وتسريع تنمية البلدان النامية وتحديد التعاونات البحثية الواعدة.[71][72][73]

المراجع

عدل
  1. ^ Henry، Sam؛ McInnes، Bridget T. (1 أكتوبر 2017). "Literature Based Discovery: Models, methods, and trends". Journal of Biomedical Informatics. ج. 74: 20–32. DOI:10.1016/j.jbi.2017.08.011. ISSN:1532-0464. مؤرشف من الأصل في 2022-12-09.
  2. ^ ا ب ج د ه و Crichton، Gamal؛ Baker، Simon؛ Guo، Yufan؛ Korhonen، Anna (15 مايو 2020). "Neural networks for open and closed Literature-based Discovery". PLOS ONE. ج. 15 ع. 5: e0232891. DOI:10.1371/journal.pone.0232891. ISSN:1932-6203.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  3. ^ Smalheiser، Neil R؛ Swanson، Don R (1998-11). "Using ARROWSMITH: a computer-assisted approach to formulating and assessing scientific hypotheses". Computer Methods and Programs in Biomedicine. ج. 57 ع. 3: 149–153. DOI:10.1016/s0169-2607(98)00033-9. ISSN:0169-2607. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  4. ^ Gordon، Michael D.؛ Lindsay، Robert K. (1996-02). <116::aid-asi3>3.3.co;2-p "Toward discovery support systems: A replication, re‐examination, and extension of Swanson's work on literature‐based discovery of a connection between Raynaud's and fish oil". Journal of the American Society for Information Science. ج. 47 ع. 2: 116–128. DOI:10.1002/(sici)1097-4571(199602)47:2<116::aid-asi3>3.3.co;2-p. ISSN:0002-8231. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  5. ^ Kostoff، Ronald N.؛ Briggs، Michael B.؛ Solka، Jeffrey L.؛ Rushenberg، Robert L. (1 فبراير 2008). "Literature-related discovery (LRD): Methodology". Technological Forecasting and Social Change. Literature-Related Discovery. ج. 75 ع. 2: 186–202. DOI:10.1016/j.techfore.2007.11.010. ISSN:0040-1625. مؤرشف من الأصل في 2024-04-26.
  6. ^ Smalheiser، Neil R. (1 ديسمبر 2017). "Rediscovering Don Swanson:The Past, Present and Future of Literature-based Discovery". Journal of Data and Information Science. ج. 2 ع. 4: 43–64. DOI:10.1515/jdis-2017-0019. ISSN:2543-683X.
  7. ^ ا ب Swanson، Don R. (1986-09). "Fish Oil, Raynaud's Syndrome, and Undiscovered Public Knowledge". Perspectives in Biology and Medicine. ج. 30 ع. 1: 7–18. DOI:10.1353/pbm.1986.0087. ISSN:1529-8795. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  8. ^ Swanson، Don R. (1988-06). "Migraine and Magnesium: Eleven Neglected Connections". Perspectives in Biology and Medicine. ج. 31 ع. 4: 526–557. DOI:10.1353/pbm.1988.0009. ISSN:1529-8795. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  9. ^ Smalheiser، Neil R.؛ Swanson، Don R. (1996-09). "Linking estrogen to Alzheimer's disease". Neurology. ج. 47 ع. 3: 809–810. DOI:10.1212/wnl.47.3.809. ISSN:0028-3878. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  10. ^ Swanson، Don R. (1990-12). "Somatomedin C and Arginine: Implicit Connections between Mutually Isolated Literatures". Perspectives in Biology and Medicine. ج. 33 ع. 2: 157–186. DOI:10.1353/pbm.1990.0031. ISSN:1529-8795. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  11. ^ Stegmann, Johannes; Grohmann, Guenter (2003). "Hypothesis generation guided by co-word clustering". Scientometrics (بالإنجليزية). 56 (1): 111–135. DOI:10.1023/a:1021954808804. ISSN:0138-9130. Retrieved 2024-10-24.
  12. ^ Bekhuis، Tanja (3 أبريل 2006). "Conceptual biology, hypothesis discovery, and text mining: Swanson's legacy". Biomedical Digital Libraries. ج. 3 ع. 1. DOI:10.1186/1742-5581-3-2. ISSN:1742-5581.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  13. ^ Smalheiser، Neil R. (26 يوليو 2011). "Literature‐based discovery: Beyond the ABCs". Journal of the American Society for Information Science and Technology. ج. 63 ع. 2: 218–224. DOI:10.1002/asi.21599. ISSN:1532-2882.
  14. ^ اكتب عنوان المرجع بين علامتي الفتح <ref> والإغلاق </ref> للمرجع :4
  15. ^ ا ب Yetisgen-Yildiz، Meliha؛ Pratt، Wanda (2009-08). "A new evaluation methodology for literature-based discovery systems". Journal of Biomedical Informatics. ج. 42 ع. 4: 633–643. DOI:10.1016/j.jbi.2008.12.001. ISSN:1532-0464. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  16. ^ Hur، Junguk؛ Schuyler، Adam D.؛ States، David J.؛ Feldman، Eva L. (2 فبراير 2009). "SciMiner: web-based literature mining tool for target identification and functional enrichment analysis". Bioinformatics. ج. 25 ع. 6: 838–840. DOI:10.1093/bioinformatics/btp049. ISSN:1367-4811.
  17. ^ ا ب ج د Yetisgen-Yildiz، Meliha؛ Pratt، Wanda (2006-12). "Using statistical and knowledge-based approaches for literature-based discovery". Journal of Biomedical Informatics. ج. 39 ع. 6: 600–611. DOI:10.1016/j.jbi.2005.11.010. ISSN:1532-0464. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  18. ^ Arrowsmith، Nathan (15 يوليو 2019). "Nathan Arrowsmith". Authors group. اطلع عليه بتاريخ 2024-11-01.
  19. ^ Smalheiser، Neil R.؛ Torvik، Vetle I. (2008). The Place of Literature-Based Discovery in Contemporary Scientific Practice. Berlin, Heidelberg: Springer Berlin Heidelberg. ص. 13–22. ISBN:978-3-540-68685-9.
  20. ^ ا ب Pyysalo، Sampo؛ Baker، Simon؛ Ali، Imran؛ Haselwimmer، Stefan؛ Shah، Tejas؛ Young، Andrew؛ Guo، Yufan؛ Högberg، Johan؛ Stenius، Ulla (9 أكتوبر 2018). "LION LBD: a literature-based discovery system for cancer biology". Bioinformatics. ج. 35 ع. 9: 1553–1561. DOI:10.1093/bioinformatics/bty845. ISSN:1367-4803.
  21. ^ Wei، Chih-Hsuan؛ Kao، Hung-Yu؛ Lu، Zhiyong (22 مايو 2013). "PubTator: a web-based text mining tool for assisting biocuration". Nucleic Acids Research. ج. 41 ع. W1: W518–W522. DOI:10.1093/nar/gkt441. ISSN:1362-4962.
  22. ^ Baker، Simon؛ Ali، Imran؛ Silins، Ilona؛ Pyysalo، Sampo؛ Guo، Yufan؛ Högberg، Johan؛ Stenius، Ulla؛ Korhonen، Anna (14 يوليو 2017). "Cancer Hallmarks Analytics Tool (CHAT): a text mining approach to organize and evaluate scientific literature on cancer". Bioinformatics. ج. 33 ع. 24: 3973–3981. DOI:10.1093/bioinformatics/btx454. ISSN:1367-4803.
  23. ^ ا ب Cameron، Delroy؛ Kavuluru، Ramakanth؛ Rindflesch، Thomas C.؛ Sheth، Amit P.؛ Thirunarayan، Krishnaprasad؛ Bodenreider، Olivier (2015-04). "Context-driven automatic subgraph creation for literature-based discovery". Journal of Biomedical Informatics. ج. 54: 141–157. DOI:10.1016/j.jbi.2015.01.014. ISSN:1532-0464. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  24. ^ Hristovski، Dimitar؛ Dinevski، Dejan؛ Kastrin، Andrej؛ Rindflesch، Thomas C (16 يناير 2015). "Biomedical question answering using semantic relations". BMC Bioinformatics. ج. 16 ع. 1. DOI:10.1186/s12859-014-0365-3. ISSN:1471-2105.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  25. ^ ا ب Preiss، Judita؛ Stevenson، Mark؛ Gaizauskas، Robert (12 مايو 2015). "Exploring relation types for literature-based discovery". Journal of the American Medical Informatics Association. ج. 22 ع. 5: 987–992. DOI:10.1093/jamia/ocv002. ISSN:1527-974X.
  26. ^ Kim، Yong Hwan؛ Song، Min (24 أبريل 2019). "A context-based ABC model for literature-based discovery". PLOS ONE. ج. 14 ع. 4: e0215313. DOI:10.1371/journal.pone.0215313. ISSN:1932-6203.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  27. ^ Thomas، Paul D.؛ Hill، David P.؛ Mi، Huaiyu؛ Osumi-Sutherland، David؛ Van Auken، Kimberly؛ Carbon، Seth؛ Balhoff، James P.؛ Albou، Laurent-Philippe؛ Good، Benjamin (23 سبتمبر 2019). "Gene Ontology Causal Activity Modeling (GO-CAM) moves beyond GO annotations to structured descriptions of biological functions and systems". Nature Genetics. ج. 51 ع. 10: 1429–1433. DOI:10.1038/s41588-019-0500-1. ISSN:1061-4036.
  28. ^ ا ب Hristovski، Dimitar؛ Peterlin، Borut؛ Mitchell، Joyce A.؛ Humphrey، Susanne M. (2005-03). "Using literature-based discovery to identify disease candidate genes". International Journal of Medical Informatics. ج. 74 ع. 2–4: 289–298. DOI:10.1016/j.ijmedinf.2004.04.024. ISSN:1386-5056. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  29. ^ Gopalakrishnan، Vishrawas؛ Jha، Kishlay؛ Jin، Wei؛ Zhang، Aidong (2019-05). "A survey on literature based discovery approaches in biomedical domain". Journal of Biomedical Informatics. ج. 93: 103141. DOI:10.1016/j.jbi.2019.103141. ISSN:1532-0464. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  30. ^ ا ب Hristovski، Dimitar؛ Džeroski، Sašo؛ Peterlin، Borut؛ Rožić، Anamajirja (2000). Supporting Discovery in Medicine by Association Rule Mining of Bibliographic Databases. Berlin, Heidelberg: Springer Berlin Heidelberg. ص. 446–451. ISBN:978-3-540-41066-9.
  31. ^ ا ب Weeber، Marc؛ Klein، Henny؛ de Jong‐van den Berg، Lolkje T.W.؛ Vos، Rein (2001). "Using concepts in literature‐based discovery: Simulating Swanson's Raynaud–fish oil and migraine–magnesium discoveries". Journal of the American Society for Information Science and Technology. ج. 52 ع. 7: 548–557. DOI:10.1002/asi.1104.abs. ISSN:1532-2882.
  32. ^ Pratt، Wanda؛ Yetisgen-Yildiz، Meliha (23 أكتوبر 2003). "LitLinker". Proceedings of the 2nd international conference on Knowledge capture. New York, NY, USA: ACM: 105–112. DOI:10.1145/945645.945662.
  33. ^ van der Eijk، C. Christiaan؛ van Mulligen، Erik M.؛ Kors، Jan A.؛ Mons، Barend؛ van den Berg، Jan (20 يناير 2004). "Constructing an associative concept space for literature‐based discovery". Journal of the American Society for Information Science and Technology. ج. 55 ع. 5: 436–444. DOI:10.1002/asi.10392. ISSN:1532-2882.
  34. ^ Srinivasan، Padmini؛ Libbus، Bisharah (4 أغسطس 2004). "Mining MEDLINE for implicit links between dietary substances and diseases". Bioinformatics. ج. 20 ع. suppl_1: i290–i296. DOI:10.1093/bioinformatics/bth914. ISSN:1367-4811.
  35. ^ Wren، Jonathan D (7 أكتوبر 2004). "Extending the mutual information measure to rank inferred literature relationships". BMC Bioinformatics. ج. 5 ع. 1. DOI:10.1186/1471-2105-5-145. ISSN:1471-2105.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  36. ^ Torvik، Vetle I.؛ Smalheiser، Neil R. (26 أبريل 2007). "A quantitative model for linking two disparate sets of articles in MEDLINE". Bioinformatics. ج. 23 ع. 13: 1658–1665. DOI:10.1093/bioinformatics/btm161. ISSN:1367-4811.
  37. ^ Jelier، Rob؛ Schuemie، Martijn J؛ Veldhoven، Antoine؛ Dorssers، Lambert CJ؛ Jenster، Guido؛ Kors، Jan A (12 يونيو 2008). "Anni 2.0: a multipurpose text-mining tool for the life sciences". Genome Biology. ج. 9 ع. 6. DOI:10.1186/gb-2008-9-6-r96. ISSN:1474-760X.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  38. ^ Frijters، R.؛ Heupers، B.؛ van Beek، P.؛ Bouwhuis، M.؛ van Schaik، R.؛ de Vlieg، J.؛ Polman، J.؛ Alkema، W. (19 مايو 2008). "CoPub: a literature-based keyword enrichment tool for microarray data analysis". Nucleic Acids Research. ج. 36 ع. Web Server: W406–W410. DOI:10.1093/nar/gkn215. ISSN:0305-1048.
  39. ^ ا ب Petriĕ، Ingrid؛ Urbanĕiĕ، Tanja؛ Cestnik، Bojan؛ Macedoni-Lukšiĕ، Marta (2009-04). "Literature mining method RaJoLink for uncovering relations between biomedical concepts". Journal of Biomedical Informatics. ج. 42 ع. 2: 219–227. DOI:10.1016/j.jbi.2008.08.004. ISSN:1532-0464. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  40. ^ Workman، T. Elizabeth؛ Fiszman، Marcelo؛ Cairelli، Michael J.؛ Nahl، Diane؛ Rindflesch، Thomas C. (2016-04). "Spark, an application based on Serendipitous Knowledge Discovery". Journal of Biomedical Informatics. ج. 60: 23–37. DOI:10.1016/j.jbi.2015.12.014. ISSN:1532-0464. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  41. ^ Peng، Yufang؛ Bonifield، Gary؛ Smalheiser، Neil R. (22 مايو 2017). "Gaps within the Biomedical Literature: Initial Characterization and Assessment of Strategies for Discovery". Frontiers in Research Metrics and Analytics. ج. 2. DOI:10.3389/frma.2017.00003. ISSN:2504-0537.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  42. ^ Henry، Sam؛ McInnes، Bridget T. (2017-10). "Literature Based Discovery: Models, methods, and trends". Journal of Biomedical Informatics. ج. 74: 20–32. DOI:10.1016/j.jbi.2017.08.011. ISSN:1532-0464. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  43. ^ Preiss، Judita؛ Stevenson، Mark (2017-05). "Quantifying and filtering knowledge generated by literature based discovery". BMC Bioinformatics. ج. 18 ع. S7. DOI:10.1186/s12859-017-1641-9. ISSN:1471-2105. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)صيانة الاستشهاد: دوي مجاني غير معلم (link)
  44. ^ Cohen، Trevor؛ Schvaneveldt، Roger؛ Widdows، Dominic (2010-04). "Reflective Random Indexing and indirect inference: A scalable method for discovery of implicit connections". Journal of Biomedical Informatics. ج. 43 ع. 2: 240–256. DOI:10.1016/j.jbi.2009.09.003. ISSN:1532-0464. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  45. ^ ا ب Swanson، Don R.؛ Smalheiser، Neil R. (1997-04). "An interactive system for finding complementary literatures: a stimulus to scientific discovery". Artificial Intelligence. ج. 91 ع. 2: 183–203. DOI:10.1016/s0004-3702(97)00008-8. ISSN:0004-3702. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  46. ^ Eronen، Lauri؛ Hintsanen، Petteri؛ Toivonen، Hannu (2012). Biomine: A Network-Structured Resource of Biological Entities for Link Prediction. Berlin, Heidelberg: Springer Berlin Heidelberg. ص. 364–378. ISBN:978-3-642-31829-0.
  47. ^ Yetisgen-Yildiz، M.؛ Pratt، W. (2008). Evaluation of Literature-Based Discovery Systems. Berlin, Heidelberg: Springer Berlin Heidelberg. ص. 101–113. ISBN:978-3-540-68685-9.
  48. ^ ا ب Hristovski، Dimitar؛ Kastrin، Andrej؛ Peterlin، Borut؛ Rindflesch، Thomas C. (2010). Combining Semantic Relations and DNA Microarray Data for Novel Hypotheses Generation. Berlin, Heidelberg: Springer Berlin Heidelberg. ص. 53–61. ISBN:978-3-642-13130-1.
  49. ^ Stegmann, Johannes; Grohmann, Guenter (2003). "Hypothesis generation guided by co-word clustering". Scientometrics (بالإنجليزية). 56 (1): 111–135. DOI:10.1023/a:1021954808804. ISSN:0138-9130. Retrieved 2024-11-01.
  50. ^ Wren، Jonathan D.؛ Bekeredjian، Raffi؛ Stewart، Jelena A.؛ Shohet، Ralph V.؛ Garner، Harold R. (22 يناير 2004). "Knowledge discovery by automated identification and ranking of implicit relationships". Bioinformatics. ج. 20 ع. 3: 389–398. DOI:10.1093/bioinformatics/btg421. ISSN:1367-4811.
  51. ^ Korhonen، Anna؛ Guo، Yufan؛ Baker، Simon؛ Yetisgen-Yildiz، Meliha؛ Stenius، Ulla؛ Narita، Masashi؛ Liò، Pietro (2015). Improving Literature-Based Discovery with Advanced Text Mining. Cham: Springer International Publishing. ص. 89–98. ISBN:978-3-319-24461-7.
  52. ^ Preiss، Judita؛ Stevenson، Mark (2016-07). "The effect of word sense disambiguation accuracy on literature based discovery". BMC Medical Informatics and Decision Making. ج. 16 ع. S1. DOI:10.1186/s12911-016-0296-1. ISSN:1472-6947. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)صيانة الاستشهاد: دوي مجاني غير معلم (link)
  53. ^ Hristovski، Dimitar؛ Kastrin، Andrej؛ Dinevski، Dejan؛ Burgun، Anita؛ Žiberna، Lovro؛ Rindflesch، Thomas C. (18 يونيو 2016). "Using Literature-Based Discovery to Explain Adverse Drug Effects". Journal of Medical Systems. ج. 40 ع. 8. DOI:10.1007/s10916-016-0544-z. ISSN:0148-5598.
  54. ^ ا ب Gabetta، Matteo؛ Milani، Giuseppe؛ Larizza، Cristiana؛ Favalli، Valentina؛ Arbustini، Eloisa؛ Bellazzi، Riccardo (9 نوفمبر 2012). "A semantic collaborative system for the management of translational research projects". EMBnet.journal. ج. 18 ع. B: 26. DOI:10.14806/ej.18.b.539. ISSN:2226-6089.
  55. ^ ا ب Özgür، Arzucan؛ Xiang، Zuoshuang؛ Radev، Dragomir R؛ He، Yongqun (17 مايو 2011). "Mining of vaccine-associated IFN-γ gene interaction networks using the Vaccine Ontology". Journal of Biomedical Semantics. ج. 2 ع. S2. DOI:10.1186/2041-1480-2-s2-s8. ISSN:2041-1480.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  56. ^ Ozgür، Arzucan؛ Xiang، Zuoshuang؛ Radev، Dragomir R.؛ He، Yongqun (3 يونيو 2010). "Literature-based discovery of IFN-gamma and vaccine-mediated gene interaction networks". Journal of Biomedicine and Biotechnology. ج. 2010: 426479. DOI:10.1155/2010/426479. PMC:2896678. PMID:20625487.
  57. ^ ا ب Hristovski، Dimitar؛ Rindflesch، Thomas؛ Peterlin، Borut (1 يناير 2013). "Using Literature-based Discovery to Identify Novel Therapeutic Approaches". Cardiovascular & Hematological Agents in Medicinal Chemistry. ج. 11 ع. 1: 14–24. DOI:10.2174/1871525711311010005. ISSN:1871-5257.
  58. ^ ا ب Zhang، Rui؛ Cairelli، Michael J.؛ Fiszman، Marcelo؛ Kilicoglu، Halil؛ Rindflesch، Thomas C.؛ Pakhomov، Serguei V.؛ Melton، Genevieve B. (2014-01). "Exploiting Literature-derived Knowledge and Semantics to Identify Potential Prostate Cancer Drugs". Cancer Informatics. ج. 13s1: CIN.S13889. DOI:10.4137/cin.s13889. ISSN:1176-9351. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  59. ^ Benzschawel، Eric (2016-08). He، He؛ Lei، Tao؛ Roberts، Will (المحررون). "Identifying Potential Adverse Drug Events in Tweets Using Bootstrapped Lexicons". Proceedings of the ACL 2016 Student Research Workshop. Berlin, Germany: Association for Computational Linguistics: 15–21. DOI:10.18653/v1/P16-3003. مؤرشف من الأصل في 2024-05-06. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  60. ^ Shang، Ning؛ Xu، Hua؛ Rindflesch، Thomas C.؛ Cohen، Trevor (2014-12). "Identifying plausible adverse drug reactions using knowledge extracted from the literature". Journal of Biomedical Informatics. ج. 52: 293–310. DOI:10.1016/j.jbi.2014.07.011. ISSN:1532-0464. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  61. ^ Maver، Ales؛ Hristovski، Dimitar؛ Rindflesch، Thomas C.؛ Peterlin، Borut (2013). "Integration of Data from Omic Studies with the Literature-Based Discovery towards Identification of Novel Treatments for Neovascularization in Diabetic Retinopathy". BioMed Research International. ج. 2013: 1–7. DOI:10.1155/2013/848952. ISSN:2314-6133.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  62. ^ Kostoff، Ronald N.؛ Briggs، Michael B. (2008-02). "Literature-Related Discovery (LRD): Potential treatments for Parkinson's Disease". Technological Forecasting and Social Change. ج. 75 ع. 2: 226–238. DOI:10.1016/j.techfore.2007.11.007. ISSN:0040-1625. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  63. ^ Dong، Weiwei؛ Liu، Yixuan؛ Zhu، Weijie؛ Mou، Quan؛ Wang، Jinliang؛ Hu، Yi (20 يونيو 2014). "Simulation of Swanson's Literature-Based Discovery: Anandamide Treatment Inhibits Growth of Gastric Cancer Cells In Vitro and In Silico". PLoS ONE. ج. 9 ع. 6: e100436. DOI:10.1371/journal.pone.0100436. ISSN:1932-6203.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  64. ^ Kostoff، Ronald N.؛ Briggs، Michael B.؛ Lyons، Terence J. (2008-02). "Literature-related discovery (LRD): Potential treatments for Multiple Sclerosis". Technological Forecasting and Social Change. ج. 75 ع. 2: 239–255. DOI:10.1016/j.techfore.2007.11.002. ISSN:0040-1625. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  65. ^ Hristovski، Dimitar؛ Peterlin، Borut؛ Džeroski، Sašo؛ Stare، Janez. Literature Based Discovery Support System and Its Application to Disease Gene Identification. Berlin, Heidelberg: Springer Berlin Heidelberg. ص. 307–326. ISBN:978-3-540-73919-7.
  66. ^ Ramanan، Vivek؛ Sarkar، Indra Neil (8 أبريل 2024). "Augmenting Bacterial Similarity Measures Using a Graph-Based Genome Representation". dx.doi.org. اطلع عليه بتاريخ 2024-10-23.
  67. ^ Srinivasan، Mythily؛ Blackburn، Corinne؛ Mohamed، Mohamed؛ Sivagami، A.V.؛ Blum، Janice (2015-01). "Literature–Based Discovery of Salivary Biomarkers for Type 2 Diabetes Mellitus". Biomarker Insights. ج. 10: BMI.S22177. DOI:10.4137/bmi.s22177. ISSN:1177-2719. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  68. ^ Malec، Scott A.؛ Bernstam، Elmer V.؛ Wei، Peng؛ Boyce، Richard D.؛ Cohen، Trevor (10 يوليو 2020). "Using computable knowledge mined from the literature to elucidate confounders for EHR-based pharmacovigilance". dx.doi.org. اطلع عليه بتاريخ 2024-10-23.
  69. ^ Dai، Zhenguo؛ Li، Qian؛ Yang، Guang؛ Wang، Yini؛ Liu، Yang؛ Zheng، Zhilei؛ Tu، Yingfeng؛ Yang، Shuang؛ Yu، Bo (11 يونيو 2019). "Using literature-based discovery to identify candidate genes for the interaction between myocardial infarction and depression". BMC Medical Genetics. ج. 20 ع. 1. DOI:10.1186/s12881-019-0841-8. ISSN:1471-2350.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  70. ^ Vos، Rein؛ Aarts، Sil؛ van Mulligen، Erik؛ Metsemakers، Job؛ van Boxtel، Martin P؛ Verhey، Frans؛ van den Akker، Marjan (2014-01). "Finding potentially new multimorbidity patterns of psychiatric and somatic diseases: exploring the use of literature-based discovery in primary care research". Journal of the American Medical Informatics Association. ج. 21 ع. 1: 139–145. DOI:10.1136/amiajnl-2012-001448. ISSN:1067-5027. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  71. ^ Kostoff، Ronald N.؛ Solka، Jeffrey L.؛ Rushenberg، Robert L.؛ Wyatt، Jeffrey A. (2008-02). "Literature-related discovery (LRD): Water purification". Technological Forecasting and Social Change. ج. 75 ع. 2: 256–275. DOI:10.1016/j.techfore.2007.11.009. ISSN:0040-1625. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)
  72. ^ Gordon، M. D.؛ Awad، N. F. (2008). The Tip of the Iceberg: The Quest for Innovation at the Base of the Pyramid. Berlin, Heidelberg: Springer Berlin Heidelberg. ص. 23–37. ISBN:978-3-540-68685-9.
  73. ^ Hristovski، Dimitar؛ Kastrin، Andrej؛ Rindflesch، Thomas C. (25 أغسطس 2015). "Semantics-Based Cross-domain Collaboration Recommendation in the Life Sciences". Proceedings of the 2015 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining 2015. New York, NY, USA: ACM: 805–806. DOI:10.1145/2808797.2809300.