Выбрать главу

X— stavový vektor systému patriaci spomínanej n-tej množine (n-tej v poradí množine)*;

Un — riadenie, vypracované v kroku n (krokové riadenie), prevádzajúce systém z jeho  možného stavu v n-tej množine do jedného zo stavov (n + 1) množiny. Pre názornú predstavu je potrebné si pozrieť obr. 4., o ktorom bude reč neskôr.

·         Štruktúra úlohy sa nesmie meniť pri zmene predpokladaného počtu krokov N.

·         Rozmer - veľkosť priestoru parametrov,  ktorými je opisovaný stav systému, sa nesmie meniť v závislosti od množstva krokov N

·         Výber riadenia na ľubovoľnom kroku (z N-krokov)* nesmie popierať - negovať voľbu  riadenia na predchádzajúcich krokoch.

Inými slovami: optimálny výber riadenia v ľubovoľnom z možných stavov musí byť určený - podmienený parametrami skúmaného stavu, a nie parametrami procesu, v priebehu ktorého systém do skúmaného stavu prišiel.

      Čisto formálne, ak jednému stavu zodpovedajú rôzne deje predchádzajúce jeho vzniku,

      vplývajúce na nasledujúci výber optimálneho riadenia, tak metóda umožňuje začleniť

      popis predchádzajúcich dejov do vektora stavu. To vedie k zväčšeniu rozmeru vektora

      stavu systému. Po tejto operácii to, čo sa do jej prebehnutia opisovalo ako jeden stav,

      sa stáva množinou stavov, odlišujúcich sa navzájom komponentami vektora stavu,

      opisujúcimi predchádzajúce deje procesu.

·         Kritérium optimálneho výberu následnosti krokových riadení Una zodpovedajúcej trajektórie v priestore formálnych parametrov má tvar:

V = V0(X0, U0) + V1(X1, U1) + + VN - 1(XN- 1, UN - 1) + VN(XN)

Kritérium V nazývame plnou výhrou[133] a ju tvoriace sčítance - krokovými výhrami. Pri úlohe je potrebné nájsť postupnosť krokových riadení Un a trajektóriu, ktorým zodpovedá maximálna z možných plných výhier.Vo svojej podstate,  plná „výhra“ V jemierou kvality riadenia celého procesu.Krokové výhry, aj keď sú súčasťou miery kvality riadenia celého procesu, však vo všeobecnosti nie sú mierami kvality riadenia na im prislúchajúcich krokoch. Metóda je totiž určená na optimalizáciu riadenia procesu ako celku, a efektívne krokové riadenia s veľkou krokovou výhrou, ale ležiace mimo optimálnej trajektórie, nie sú zaujímavé (resp. nie sú v záujme)*. Štruktúra metódy nezakazuje v nevyhnutnosti pre každý krok použiť kritérium stanovenia krokovej výhry Vn, odlišné od  kritérií, prijatých  pri iných krokoch.

S indexom n – ukazovateľom-určovateľom množstva možných vektorov stavu – v reálnych úlohách môže byť zviazaný nejaký meniaci sa parameter, napríklad: čas, dráha, sila, miera spotreby zdrojov a pod. To jest, metóda je použiteľná nie len na optimalizáciu riadenia procesov plynúcich v čase - trvalejších, ale aj na úlohy optimalizácie mnohovariantného jednorázového(momentálneho), alebočas nevnímajúceho riešenia, ak takéto „bezčasovénadčasové“, „neprocesné“ úlohy pripúšťajú ich viackrokovú interpretáciu.

Teraz sa obrátime k obrázkom 4 – 6, opakujúcim vzájomne súvisiace obr. 40, 41, 42 z kurzu teórie automatického riadenia R. P. de La Barrièra.

Na obr. 4 sú znázornené počiatočný stav systému - «0» a množiny jeho možných následných stavov - «1», «2», «3»,  a taktiež možné prechody z každého možného stavu do druhého možného stavu. To všetko spolu sa podobá na (hraciu)* mapu stolnej detskej hry, po ktorej sa premiestňujú žetóny: každému prechodu - kroku zodpovedá jeho kroková výhra, a  v  proces zavšujúcej tretej množine je každému zo stavov systému pridané jeho vyhodnotenie, umiestnené v štvorci. Principiálny rozdiel od hry je v tom, že hádanie o výbere cesty, používané v detskej hre, na základe hádzania kociek alebo točenia vĺčka (česky „káči“)* a pod., je v reálnom riadení neprípustné, lebo toto – to je odovzdanie účelového -cieľavedomého riadenia tým silám, které sú schopné riadiť (ovládať) padanie kociek, točenie sa vĺčka a pod., t.j. tým, pre ktorých v hre vybraný „generátor náhodnosti“ je dostatočne (vo vzťahu k ich cieľom)  riaditeľné zariadenie.

Ak máme vybrať optimálne riadenie na prvom kroku, tak je nevyhnutné predvídať všetky jeho dôsledky v následujúcich krokoch. Preto popis algoritmu metódy dynamického programovania často začína z popisu výberu riadenia na poslednom kroku, vedúcom do jedného z proces zavšujúcich stavov. Pritom poukazujú na „pedagogickú prax“, ktorá dokazuje, že argumentácia pri popise algoritmu od zavšujúceho stavu k počiatočnému sa ľahšie chápe. Opiera sa totiž o akoby už zloživšie sa (vzniknuvšie, existujúce) podmienky (okolnosti, situácie) k začiatku skúmaného kroku v tom čase, keď možné zavšenia procesu sú taktiež stanovené.

V súvislosti s týmto sa na obr. 5 analyzujú možné prechody do zavšujúcej - konečnej množiny stavov «3» z každého možného stavu v jej predchádzajúcej množine stavov «2», ako keby celá predchádzajúca dráha bola už prejdená a zostalo by len posledným výberom optimálného krokového riadenia zavšiť celý proces.

Pritom pre každý zo stavov v množine «2» sa určujú všetky plné výhry (splnenie krokových cieľov)*  ako súčet = „vyhodnotenie prechodu“ + „hodnota záverečního stavu“. V množine «2», zo získaných pre každý zo stavov v ňom možných plných výhier, sa určuje a zapamätáva maximálna plná výhra a jej prislúchajúci prechod (fragment trajektórie). Maximálna plná výhra pre každý zo stavov v množině «2» je umiestnená do pravouhlého rámčeka a jej zodpovedajúci prechod je označený šípkou. Takých optimálnych prechodov z jedného stavu do druhých, ktorým prináleží jedno a to isté označenie plnej výhry, môže byť aj niekoľko. V tom prípade sú všetky v metóde nerozoznateľné a navzájom ekvivalentné, v zmysle stanoveného kritéria optimálnosti výberu trajektórie v priestore parametrov, ktorými sa opisuje systém. 

Následne množinu «2», ktorá predchádza proces zavšujúcej množine «3», možno skúmať ako zavšujúcu, pretože sú známe ohodnotenia každého z jej možných stavov (maximálne plné výhry). Ďalšia optimalizácia postupnosti krokových riadení a výber optimálnej trajektórie môžu byť uskutočnené len na ešte nepreskúmaných množinách, ktoré v optimalizačnom procese predchádzajú množine «2» (t.j. na množinách «0» a «1»).

Takým spôsobom procedúra, ktorú ilustruje obr. 5, je funkčná na každom algoritmickom kroku metódy pri prechodoch z n-tej do (n–1)-tej množiny, začínajúc od zavšujúcej N-tej množiny do počiatočného stavu systému.

V dôsledku postupného párového krokovania - skúmania množín, pri prechádzaní celého ich súboru, sa určuje optimálna postupnosť súvislých - kontinuálnych krokových riadení, maximálne možná plná výhra a jej prislúchajúca trajektória.  Na obr. 6 je hrubou čiarou znázornená optimálna trajektória pre rozoberaný príklad.

V skúmanom prípade kritériom optimálnosti je súčet krokových výhier. Avšak kritérium optimálnosti môže byť konštruované aj ako vytvorenie v každom prípade nezáporných koeficientov.

Pretože výsledok (súčet, alebo súčin) sa nemení pri zmene postupnosti operácií so sčítancami, alebo sú-činiteľmi, tak algo-rytmus je funkčný aj pri krokovaní - skúmaní množín možných stavov v poradí, spätnom - opačnom  k vyššie rozoberanému, t.j. od počiatočnej k zavšujúcej množine možných stavov.