أباتشي سي تيكس
أباتشي cTAKES: نظام تحليل النص الإكلينيكي واستخراج المعرفة هو نظام مفتوح المصدر لمعالجة اللغات الطبيعية (NLP) يستخرج المعلومات الإكلينيكية أو الطبية من النص غير المنظم للسجلات الصحية الإلكترونية. يقوم بمعالجة الملاحظات الإكلينيكية، وتحديد أنواع الكيانات الطبية المسماة مثل الأدوية، الأمراض/الاضطرابات ، العلامات /الأعراض، الأجزاء التشريحية والإجراءات الطبية. يحتوي كل كيان مسمى على بعض السمات مثل رمز للربط ببعض الأنتولوجي الطبية المعروفة، سياق الكيان (تاريخ العائلة؟ ، حالي؟ ، غير مرتبط بالمريض؟) ، وما إذا كان الكيان منفي/غير منفي. [3]
نوع | |
---|---|
نظام التشغيل | |
النموذج المصدري | |
المطورون | |
موقع الويب |
لغة البرمجة | |
---|---|
الإصدار الأول |
20 مارس 2013 [1] |
الإصدار الأخير |
4.0.0 |
المستودع | |
الرخصة |
تم بناء cTAKES باستخدام إطار عمل UIMA لإدارة المعلومات غير المهيكلة ومجموعة أدوات معالجة اللغات الطبيعية OpenNLP . [4]
المكونات
عدلتم تدريب مكونات cTAKES خصيصًا للمجال الطبي، وإنشاء تعليقات لغوية ودلالية غنية يمكن استخدامها في أنظمة دعم القرارات والبحوث الطبية. [5]
تشمل هذه العناصر:
- محدد الأقسام المسماة
- كاشف حدود الجُمل
- مجزئ الرموز القائم على القواعد
- محدد القوائم
- مُطَبِّع
- مجزئ الرموز المعتمد على السياق
- معلم أجزاء الكلام
- مجزئ العبارات
- المعلق المعتمد على القاموس
- معلق السياق
- كاشف النفي
- كاشف عدم اليقين
- كاشف الموضوع
- محلل التبعية
- محدد حالة تدخين المريض
- معلق الأدوية
التاريخ
عدلبدأ تطوير cTAKES في مايو كلينك في عام 2006. ضم فريق التطوير، بقيادة الدكتورة غيرجانا سافوفا والدكتور كريستوفر شوت، أطباء وعلماء كمبيوتر ومهندسي برمجيات. بعد نشره، أصبح cTAKES جزءًا لا يتجزأ من البنية التحتية لإدارة البيانات الطبية في مايو كلينك، حيث قام بمعالجة أكثر من 80 مليون ملاحظة طبية. [6]
عندما انتقلت الدكتورة سافوفا إلى مستشفى بوسطن للأطفال في أوائل عام 2010، نما فريق التطوير الأساسي ليشمل أعضاء من المستشفى. كما وتشمل أوجه التعاون الخارجية الإضافية: [6]
وقد أدى هذا التعاون إلى توسيع قدرات cTAKES في مجالات أخرى مثل التفكير الزمني، الإجابة على الأسئلة الطبية، وحل الإشارات للمجال الطبي. [6]
في عام 2010، تم اعتماد cTAKES بواسطة برنامج i2b2. بالإضافة إلى ذلك، يعتبر البرنامج مكون مركزي في SHARP Area 4 . [6]
في عام 2013 ، أصدرت cTAKES أول إصدار لها كمشروع حاضنة أباتشي: cTAKES 3.0 .
في مارس 2013، أصبح cTAKES مشروع عالي المستوى لأباتشي (TLP). [6]
انظر أيضًا
عدل- OpenNLP
- UIMA
- السجل الصحي الإلكتروني
- نظام اللغة الطبية الموحد
المراجع
عدل- ^ ا ب وصلة مرجع: https://projects.apache.org/json/projects/ctakes.json. الوصول: 8 أبريل 2020.
- ^ "Release 6.0.0". 16 سبتمبر 2024. اطلع عليه بتاريخ 2024-09-17.
- ^ Denecke، Kerstin (31 أغسطس 2015). "Tools and Resources for Information Extraction". Health Web Science: Social Media Data for Healthcare. Springer. ص. 67. ISBN:978-3-319-20582-3 – عبر Google Books.
- ^ Khalifa، Abdulrahman؛ Meystre، Stéphane (1 ديسمبر 2015). "Adapting existing natural language processing resources for cardiovascular risk factors identification in clinical notes". Journal of Biomedical Informatics. Proceedings of the 2014 i2b2/UTHealth Shared-Tasks and Workshop on Challenges in Natural Language Processing for Clinical Data. ج. 58 ع. Supplement: S128–S132. DOI:10.1016/j.jbi.2015.08.002. PMC:4983192. PMID:26318122.
- ^ Savova، Guergana K؛ Masanz، James J؛ Ogren، Philip V؛ Zheng، Jiaping؛ Sohn، Sunghwan؛ Kipper-Schuler، Karin C؛ Chute، Christopher G (2010). "Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES): architecture, component evaluation and applications". Journal of the American Medical Informatics Association. ج. 17 ع. 5: 507–513. DOI:10.1136/jamia.2009.001560. ISSN:1067-5027. PMC:2995668. PMID:20819853.
- ^ ا ب ج د ه "History". Apache cTAKES™ - clinical Text Analysis Knowledge Extraction System. 22 يونيو 2015. مؤرشف من الأصل في 2020-05-06. اطلع عليه بتاريخ 2018-01-11.
روابط خارجية
عدل- cTAKES الموقع الرسمي
- Apache cTAKES صفحة معلومات المشروع من ASF
- الملخص (جاميا)
- اتحاد معالجة اللغة الطبيعية للصحة المفتوحة (OHNLP)
- برنامج مشاريع البحوث الاستراتيجية الصحية المتقدمة لتكنولوجيا المعلومات (SHARP)
- منطقة SHARP 4 - الاستخدام الثانوي لبيانات السجلات الصحية الإلكترونية
- وحدة تحكم الاسترداد الآلي (ARC)
- تم تطوير استخراج نص المعلومات الصحية (HITEx) ) كجزء من مشروع i2b2. وهو عبارة عن برنامج متسلسل لمعالجة اللغات الطبيعية قائم على القواعد يعتمد على إطار عمل GATE الذي طورته Informatics لدمج علم الأحياء وجانب السرير.
- تم تطوير مجموعة أدوات البحث في اللغة الحاسوبية والتعليم (cleartk) ( لم يعد يتم الاحتفاظ بها) في جامعة كولورادو في بولدر، وتوفر إطارًا لتطوير مكونات معالجة اللغات الطبيعية الإحصائية في Java. إنه مبني على Apache UIMA كأساس.
- NegEx - هي أداة تم تطويرها في جامعة بيتسبرغ لاكتشاف المصطلحات المنفية في النص الطبي. يستخدم النظام مصطلحات التشغيل كطريقة لتحديد سيناريوهات النفي المحتملة في الجملة.
- ConText: امتداد لـ NegEx، وتم تطويره أيضًا من قبل جامعة بيتسبرغ. ConText ليس فقط لاكتشاف المفاهيم المنفية، ولكن أيضًا للعثور على السيناريوهات الزمنية (السيناريوهات الحديثة أو التاريخية أو الافتراضية) ومن هو الموضوع (الخبرة) (المريض أو غيره).
- MetaMap (من قبل المكتبة الوطنية الأمريكية للطب): هو نظام شامل لوضع العلامات على المفاهيم، مبني على أسس نظام اللغة الطبية الموحد. يتطلب اتفاقية ترخيص UMLS Metathesaurus نشطة (وحساب) للاستخدام.
- MedEx - أداة لاستخراج معلومات الأدوية من النصوص الطبية. تعالج MedEx النصوص الحرة للسجلات الطبية للتعرف على أسماء الأدوية ومعلومات التوقيع، مثل جرعة الدواء، تكرار العلاج، المسار، والمدة. الاستخدام مجاني مع ترخيص UMLS. إنه تطبيق مستقل لنظامي لينكس ومايكروسوفت ويندوز.
- SecTag (معلم تسلسل الأقسام): يتعرف على عنواين أقسام الملاحظات باستخدام تقنيات معالجة اللغات الطبيعية، وبايزن، والتصحيح الإملائي، وتقنيات النقاط. الاستخدام مجاني مع ترخيص UMLS أو LOINC.
- معرف الكيانات المسماة الخاص بستانفورد (Stanford's NER): هو نموذج تسلسل الحقل العشوائي المشروط مع الميزات للتعرف على الكيانات المسماة باللغتين الإنجليزية والألمانية.
- (ستانفورد CoreNLP) هو مجموعة متكاملة من أدوات معالجة اللغة الطبيعية للإنجليزية مكتوب بلغة الجافا، بما في ذلك تجزيء المفردات، تعليم أجزاء الكلام، التعرف على الكيانات المسماة، التحليل، والإشارات.