نظرية التحكم الأمثل والتي تعتبر امتداد لحسابات التفاضل والتكامل هي عبارة عن طرق لأمثلة رياضية لأستنتاج أساليب وطرق للتحكم لاختيار العنصر الأمثل من بين مجموعة بدائل متاحة.[1][2] وتعود هذه الطريقة لعمل العالم الرياضي ليف بونترياغين والذي كان يعمل في الاتحاد السوفيتي وكذلك العالم الرياضي Lev Richard Bellman في الولايات المتحدة الأمريكية.

معيار مشكلة التحكم الأمثل (Luus) مع الهدف المتكامل، وعدم المساواة، والقيود التفاضلية.

الطريقة العامة

عدل

يعتبر التحكم الأمثل طريقة رياضية لايجاد قيم لمتغيرات نظام ما بحيث تقود هذه القيم النظام لتتبع مسار أو منحى امثل يحقق القيم القصوى أو الدنيا لخاصية أو دالة الكلفة والتي تكون (القيم ) قابلة للقياس والمراقبة. وتحتوى المسألة الرياضية المعطاة على دالة الكلفة Cost function [الإنجليزية] وهي عبارة عن دالة لمتغيرات الحالة ومتغيرات التحكم. والتحكم الأمثل هو عبارة عن مجموعة من المعادلات التفاضلية لوصف مسارات متغيرات التحكم والتي تهدف لتصغير دالة الكلفة. ويمكن استنتاج التحكم الأمثل باستخدام قاعدة Pontryagin's maximum كشرط ضرورى ولازم شرط ضروري وشرط كاف للتحكم الأمثل أو باستخدام قانون Hamilton–Jacobi–Bellman كشرط كافى sufficient condition للتحكم. وللتوضيح يمكننا أخذ مثال بسيط كبداية لتوضيح التحكم الأمثل فاذا كان هناك سيارة تسير على طريق جبلى في خط مستقيم. وتعتبر معادلة التحكم الأمثل في هذا المثال هي كيف يمكن لسائق السيارة التحكم في دواسة السرعة بحيث يمكنه تصغيروقت القيادة على قدر الإمكان . سنلاحظ ان هذا النظام يتكون من السيارة والطريق الذي تسير عليه وكذلك معيار _الأمثل في هذا المثال وهو تصغير وقت القيادة. وحيث أن مسائل التحكم دائما ما تحتوى على قيود ثانوية أو مساعدة لحل المسألة ففى مثال السيارة نجد أن كمية الوقود المتاحة محدودة وكذلك سرعة السيارة محدودة وكذلك لايمكن الضغط على دواسة البنزين في أي وقت. وتعتبر دالة الكلفة في هذا المثال هي عبارة عن معادلة رياضية للتعبير عن وقت القيادة كدالة في سرعة السيارة والاعتبارات الهندسية وكذلك الشروط الابتدائية للمسألة. وتعتبر المسألة في هذه الحالة هي الحالة التي تكون فيها القيود قابلة للتبديل والتعويض مع دالة الكلفة. ويمكننا أخذ مثال آخر للتوضيح وهو نفس المسألة ولكن من ناحية أخرى وهي محاولة إيجاد أفضل طريق للسيارة للسير لتصغير كمية الوقود المستهلكة ؛ بحيث أنه معطى في المسألة ان هذه السيارة عليها إكمال دورة معينة بشرط عدم تجاوز استهلاك كمية محددة من الوقود. وتقوم هذه الطريقة بشكل عام على النحو التالي وهو تصغير دالة الكلفة الاتية : J =φ [X(t_0 ) ,t_0 ,X(t_f ),t_f]+ 1/2 ∫_0^(t_f) L[X^T (t),u(t),t] dt لنفترض أن لدينا نظام على شاكلة : [X ' (t) = a [X(t) , u(t) , t معرضة لقيود المسار الاتية : b [X(t) ,u(t) ,t] ≤ 0 ومعرضة أيضا للشروط الحدودية التالية : φ [X(t_0 ) ,t_0 ,X(t_f ),t_f ]=0 حيث أن (X(t يعبر عن الحالة و (U(t يعبر عن المتحكم و t هو عبارة عن متغير مستقل وعادة ما يعبر عن الوقت و t_0 هو الوقت الابتدائي و t_f هو الوقت النهائي . ومن الملاحظ أن مسائل المتحكم الأمثل من الممكن أن يكون ليها أكثر من حل أي أنه ليس لها حل وحيد وبالتالى فأن أي حل من هذه الحلول [X*(t*) ,u*(t*) ,t*] عبارة عن تصغير محلى للدالة.

المتحكم التربيعى الخطى

عدل

هو طريقة من طرق تطويع وتسيير النظم ونوع من المتحكمات. وتعتبر هذه المتحكمات أو هذه الطريقة من نوع طرق التحكم الأمثل. المتحكم التربيعي الخطي هو متحكم بإرجاع الحالة وذلك يعني أولا أننا بحاجة إلى ملاحظ ليعطينا حالات النظام. كما أننا بحاجة إلى المتحكم. هذا المتحكم يتم الحصول عليه بطريقة سنوضحها أسفله في هذه المقالة. أما عن سبب حساب المتحكم على المتحكمات المثالية فذلك لأن المتحكم يصغر دالة تربيعية معينة سنوضحها أسفله. بما أن المتحكم خطي والدالة التي يصغرها تربيعية فإن المتحكم يسمى تربيعي خطي. لنفترض أن لدينا نظام على شاكلة :(X'(t) = A(t)X(t) + B(t)u(t مع الشروط الابتدائية :X(t_0) = t_0

نحن نريد الآن إيجاد متحكم خطي بإرجاع الحالة على شاكلة:(U(t) = - K(t) X(t

والذي يجعل النظام مستقرا وفي نفس الوقت يقوم بتصغير الدالة التربيعية the infinite horizon quadratic continuous-time cost J=1/2 ∫_0^∞[X^T(t)Q X(t)+u^T(t)Ru(t)] dt حيث يمثل الجزء الأول من الدلالة X^T Q X تقييمنا للاختلاف قيمة الحالة الحقيقية مقارنة بقيمة الحالة التي نريدها. ويمثل u^T R u تقييمنا لقيمة الطاقة التي نستعملها لجعل النظام مستقرا. حيث أن مداخل u كبيرة تعني أننا نتحصل على قيمة كبيرة للدلالة وهو ما يتضارب مع عملية تصغير الدالة التي نريدها. وبالتالى فأن المعايير التي عبرنا عنها رياضيا أعلاه في الدلالة هي أننا نريد جعل النظام مستقر بأقل جهد أو مدخل u ممكن محققة القيود الأتية :

  • إذا كانت Q مصفوفة ذات تحدد شبه موجب Positive semi definite أي أن
  • و إذا كانت R مصفوفة ذات تحدد موجب أي
  • والنظام (A,B) قابل للاستقرار

فإن المتحكم المثالي بإرجاع الحالة هو الآتي: (K(t)= R^(-1) B^T S(t) , u(t)= -K(t)X(t , حيث أن K هي عبارة عن مصفوفة كالأتى :

(K (t)= R^(-1) B^T S(t 

وال S هي عبارة عن حل المعادلة التفاضلية Riccati equation وهذه المعادلة التفاضلية معطاة بالشكل الاتى : S'(t) = - S(t) A - 〖 A〗^T S(t) + S(t) B〖 R〗^(-1) 〖 B〗^T S(t)-Q

الطرق العددية للتحكم الأمثل

عدل

إن مسائل التحكم الأمثل في الأغلب غير خطية، وبالتالي، ليس لها حلول تحليلية (على سبيل المثال، مثل التحكم الأمثل في المسائل من الدرجة الثانية). ونتيجة لذلك، فمن الضروري توظيف الطرق العددية لحل مشاكل التحكم الأمثل. في السنوات الأولى من التحكم الأمثل (حوالي1950إلى 1980) النهج المفضل لحل مشاكل التحكم الأمثل هو الطريقة الغير مباشرة Indirect methods. في الطريقة غير المباشرة، يتم فيها حساب التفاضل والتكامل للحصول على الشروط المثالية من الدرجة الأولى. هذه الشروط تؤدي في نقطتين ( أو في حالة المشاكل المركبة، ومتعددة النقط) مشكلة ذات قيمة محددة. هذه المشكلة المحددة القيمة -لديه في الواقع هيكل خاص لأنها تتكون من اتخاذ مشتق من هاملتون derivative of a Hamiltonian وهكذا، فإن النظام الديناميكي الناتج هو نظام هاميلتون على شكل:

X'=∂H⁄∂λ

λ'=-∂H⁄∂x

حيث

H=L + λ^T a - µ^T b

هو هاملتون المعزز والطريقة غير المباشرة، يتم حل المشكلة المحددة القيمة (باستخدام الشروط المناسبة من الناحية الحدود أو الناحية المستعرضة). إن الجميل في استخدام الطريقة الغير مباشرة هو الصلابة وتحديد الحالة (λ) والحل الناتج تم تحققيه ليكون المسار الأعظم. العيب في الطرق غير المباشرة هو أن مسألة القيمة المحددة غالبا ما تكون صعبة للغاية في حل (خاصة فيما يتعلق بالمشاكل التي تمتد فترات زمنية كبيرة أو مشاكل الشروط الداخلية لنقطة).ومن البرامج المعروفة التي تطبق الأساليب غير المباشرة هو[BNDSCO[4.

ان النهج الذي ارتفع إلى مكانة بارزة في التحكم الأمثل بالطرق العددية على مدى العقدين الماضيين (أي من 1980م وحتى الوقت الحاضر) هو ما يسمى الأساليب المباشرة. في الطريقة المباشرة، يتم تقريب الدالة باستخدام دالة التقريب المناسبة (على سبيل المثال، وتقريب متعدد الحدود أو البارامترات المستمر piecewise). وفي نفس الوقت يتم تقريب تكلفة الوظيفة بوصفها وظيفة من حيث التكلفة. ثم، يتم التعامل مع معاملات الدالة التقريبية كال متغيرات الأمثل، ويتم التعبير عن مشكلة التحكم الأمثل الغير خطي علي صورة:

تقليل (F(Z خاضعة للقيود الجبرية

g(Z)=0

h(Z)≤0

وهذا يتوقف على نوع من الطريقة المباشرة المستخدمة، وحجم المشكلة الأمثل اللاخطية يمكن أن تكون صغيرة جدا (على سبيل المثال، كما هو الحال في الإطلاق المباشر أو طريقة شبية الاخطاط)، معتدلة (مثل التحكم الأمثل [pseudospectral[5) أو قد تكون كبيرة جدا (على سبيل المثال، وهي طريقة التجميع المباشر[6]). في الحالة الأخيرة (أي طريقة التجميع)، قد تكون المشكلة الأمثل اللاخطية تتكون من عشرات الآلاف من المتغيرات والمعوقات.

الأزمنة المنفصلة في التحكم الأمثل

عدل

لقد أظهرت الأمثلة حتى الآن أنظمة الزمن المتواصل وحلول تحكم. في الواقع، كما يتم الآن في كثير من الأحيان تنفيذ حلول التحكم الأمثل رقميا، نظرية التحكم المعاصرة هي الآن المعنية في المقام الأول مع أنظمة الأزمنة المنفصلة والحلول. نظرية التقريب المتسقة توفر الشروط التي تعتبر بموجبها الحلول لسلسلة مشكلة التقريب باستخدام كميات منفصلة في التحكم الأمثل على نحو متزايد من الدقة تتقارب بالنسبة للحل الأصلي، مشكلة الزمن المتواصل. ليس كل أساليب التقريب باستخدام كميات منفصلة لها هذه الخاصية، حتى تلك التي تبدو واضحة. على سبيل المثال، استخدام متغيرخطوة الحجم روتين لدمج مشكلة المعادلات الديناميكية قد تولد تدرج حيث أن هذا التدرج لا يتقارب إلى الصفر (أو نقطة في الاتجاه الصحيح) كما الحل متوقع ان يقترب. وتستند الطريقة المباشرة RIOTS على نظرية التقريب المتسقة.

الأمثلة

عدل

إستراتيجية الحل الأكثر شيوعا في العديد من مشاكل التحكم الأمثل هو الحل للمضلع (التي تسمى أحيانا سعر الظل)(λ(t. يلخص طريقة المضلع في رقم واحد قيمة الهامشية للتوسيع أوالتعاقد لحاله متغير المنعطف التالي. قيمة الهامشية ليست فقط الأرباح التي تعود علي ذلك المنعطف التالي ولكن المرتبطة مع مدة البرنامج. فمن الجميل عندما (λ(t يمكن حلها من الناحية التحليلية، ولكن عادة مايكون أكثر واحد غالبية يمكن القيام به هو وصف ذلك جيدا بما يكفى أن الحدس يمكن أن يدرك فهم طبيعة الحل وحلال المعادلة يمكن أن يقوم بالحل بطريقة عددية للقيم. وبعد الحصول على (λ(t, عادة ما يمكن حل القيمة المثلى للسيطرة turn-t علي أنها المعادلة التفاضلية مشروطة بمعرفة (λ(t. مرة أخرى أنها نادرة، وخصوصا في مشاكل الزمن المتواصل، أن واحدا يحصل على قيمة السيطرة أو الحالة بشكل واضح. عادة الإستراتيجية هي القيام بالحل من أجل الحدود القصوى والمناطق التي تميز التحكم الأمثل واستخدام الحلال العددي لعزل قيم الاختيارالفعلية في الوقت المناسب.

الوقت المحدود

عدل

نظر في مشكلة صاحب المنجم الذي يجب أن يقرر في ما هو المعدل لاستخراج خام من منجم له. انه يملك الحقوق للخام من تاريخ 0 إلى تاريخ T. في تاريخ 0 يوجد خام X0 في الأرض، والمخزون الفورى من خام(x(t تراجع بمعدل مالك المنجم يستخرج ذلك. (u(t مالك الخام يستخرج خام عند تكلفة((u(t)^2)/x(t)) وتبيع خام بسعر ثابت P. انه لا قيمة للمعدن الخام المتبقي في الأرض في الوقت T (ليس هناك "قيمة للخردة"). اختار معدل الاستخراج في الوقت (u(t لتعظيم الأرباح خلال الفترة من ملكية أي وقت من الأوقات مع الخصم.

نسخة الازمنة المتصلة نسخة الازمنة المنفصلة
الإدارة التي تعظم الارباحII الإدارة التي تعظم الارباح II :
[II = ∫_0^T [Pu(t)- 〖u(t)〗^2/(X(t))]dt II = ∑_( t=0)^(T-1) 〖[Pu_t- (u_t^2)/X_t
طبقا لقانون التطور للمتغير الحالي (x(t طبقا لقانون التطور للمتغير الحالي xt
(X'(t) = -u(t) X_(t+1) – X_t = -u(t
نكون هاملتون ونأخذ المشتقة نكون هاملتون ونأخذ المشتقة
(H = Pu(t) -(u_t^2)/X_t ʎ_(t+1) u_t H = Pu(t) - (u_t^2)/X_t u(t)ʎ(t
( dH)/(du_t )=p- ʎ_(t+1)-2 u_t/X_t =0 ( dH)/du=p- ʎ-2 u(t)/X(t) =0 )
ʎ_(t+1)-ʎ_t=- dH/(dX_t )= -〖(u_t/X_t )〗^2 〖ʎ 〗^' (t)= - dH/dX= -(〖(u(t))/(X(t)))〗^2
نظرا لان صاحب المنجم لا يمتلك الخام نظرا لان صاحب المنجم لا يمتلك الخام المتبقي في الوقت T المتبقي في الوقت T
0=ʎ(T) =0 ʎ_T
باستخدام المعادلات المذكورة اعلاه، انه من السهولة حل المعادلات المشتقة لإيجاد(u(t و (ʎ(T باستخدام المعادلات المذكورة اعلاه، من السهولة الحل لإيجادxt و λt
ʎ_t= ʎ_(t+1)+ 〖(P- ʎ (t))〗^2/4 〖ʎ 〗^' (t)=- 〖(P- ʎ (t))〗^2/4
X_(t+1)=X_t (2-P+ʎ_(t+1))/2 u(t)=X(t) (P-ʎ (t))/2
و باستخدام الشروط الابتدائية وشروط T التحويلية، يمكن حل الدوال عدديا و باستخدام الشروط الابتدائية وشروط T التحويلية, يمكن إيجاد حل المتسلسلة xt مباشرة بدلالة ut

المراجع

عدل
  1. ^ "معلومات عن تحكم أمثل على موقع jstor.org". jstor.org. مؤرشف من الأصل في 2020-04-01. {{استشهاد ويب}}: |archive-date= / |archive-url= timestamp mismatch (مساعدة)
  2. ^ "معلومات عن تحكم أمثل على موقع thes.bncf.firenze.sbn.it". thes.bncf.firenze.sbn.it. مؤرشف من الأصل في 2019-12-14.
  1. L. S. Pontryagin, 1962. The Mathematical Theory of Optimal Processes.
  2. I. M. Ross, 2009. A Primer on Pontryagin's Principle in Optimal Control, Collegiate Publishers. ISBN 978-0-9843571-0-9.
  3. Kalman, Rudolf. A new approach to linear filtering and prediction problems. Transactions of the ASME, Journal of Basic Engineering, 82:34–45, 1960
  4. Oberle, H. J. and Grimm, W., "BNDSCO-A Program for the Numerical Solution of Optimal Control Problems," Institute for Flight Systems Dynamics, DLR, Oberpfaffenhofen, 1989
  5. Ross, I. M.; Karpenko, M. (2012). "A Review of Pseudospectral Optimal Control: From Theory to Flight". Annual Reviews in Control 36 (2): 182–197. doi:10.1016/j.arcontrol.2012.09.002.
  6. Betts, J. T., Practical Methods for Optimal Control Using Nonlinear Programming, SIAM Press, Philadelphia, Pennsylvania, 2001
  7. Gill, P. E., Murray, W. M., and Saunders, M. A., User's Manual for SNOPT Version 7: Software for Large-Scale Nonlinear Programming, University of California, San Diego Report, 24 April 2007
  8. von Stryk, O., User's Guide for DIRCOL (version 2.1): A Direct Collocation Method for the Numerical Solution of Optimal Control Problems, Fachgebiet Simulation und Systemoptimierung (SIM), Technische Universität Darmstadt (2000, Version of November 1999).
  9. Betts, J.T. and Huffman, W. P., Sparse Optimal Control Software, SOCS, Boeing Information and Support Services, Seattle, Washington, July 1997
  10. Hargraves, C. R. and Paris, S. W., "Direct Trajectory Optimization Using Nonlinear Programming and Collocation", Journal of Guidance, Control, and Dynamics, Vol. 10, No. 4., 1987, pp. 338–342
  11. Gath, P.F., Well, K.H., "Trajectory Optimization Using a Combination of Direct Multiple Shooting and Collocation", AIAA 2001–4047, AIAA Guidance, Navigation, and Control Conference, Montréal, Québec, Canada, 6–9 August 2001
  12. Vasile M., Bernelli-Zazzera F., Fornasari N., Masarati P., "Design of Interplanetary and Lunar Missions Combining Low-Thrust and Gravity Assists", Final Report of the ESA/ESOC Study Contract No. 14126/00/D/CS, September 2002
  13. Schwartz, Adam, Theory and Implementation of Methods based on Runge–Kutta Integration for Solving Optimal Control Problems, University of California at Berkeley, PhD Dissertation, 1996.
  14. Ross, I. M. and Fahroo, F., User's Manual for DIDO: A MATLAB Package for Dynamic Optimization, Dept. of Aeronautics and Astronautics, Naval Postgraduate School Technical Report, 2002
  15. Williams, P., User's Guide to DIRECT, Version 2.00, Melbourne, Australia, 2008
  16. Rao, A. V., Benson, D. A., Huntington, G. T., Francolin, C., Darby, C. L., and Patterson, M. A., User's Manual for GPOPS: A MATLAB Package for Dynamic Optimization Using the Gauss Pseudospectral Method, University of Florida Report, August 2008.
  17. Rutquist, P. and Edvall, M. M, PROPT – MATLAB Optimal Control Software," 1260 S.E. Bishop Blvd Ste E, Pullman, WA 99163, USA: Tomlab Optimization, Inc.
  18. E. Polak, On the use of consistent approximations in the solution of semi-infinite optimization and optimal control problems Math. Prog. 62 pp. 385–415 (1993).