Differences

This shows you the differences between two versions of the page.

--- cogsci:ui [2009/06/18 00:29]
vlatko_dz
+++ cogsci:ui [2009/06/21 21:28]
kik
@@ Line 864: / Line 864: @@
 ==== 8. Hry: minimax a alfa beta orezávanie. ====
+Hry sú špecifickou oblasťou výskumu umelej inteligencie, odlišujú sa v niekoľkých aspektoch:
+  * poskytujú štruktúrovaný, dobre definovaný problém, v ktorom sa ľahko rozpozná úspech, či neúspech. Tento problém sa dá úplne opísať pravidlami, ktoré sú relatívne jednoduché.
+  * umožňujú absolútne presnú reprezentáciu ľubovoľnej konfigurácie sveta a takýto stav je prístupný, teda agent môže vnímať všetko, co sa dá o prostredí poznať, riešenie problému sa hľadá v priestore možných pozícií
+  * akosť ich riešenia je dobre merateľná, čo nebýva pravidlom pri iných druhoch problémov
+  * agent rieši hru z pohľadu jedného hráča, ale musí brať do úvahy aj kroky protihráča. Prítomnosť protihráča je prvkom neurčitosti
+Hry sa vo väčšine prípadov nedajú riešiť pomocou bežných prehľadávacích stratégií, najmä z dôvodu veľkej komplexity.
+  Príklad: pri šachu obsahuje strom hľadania približne 35<sup>100</sup> uzlov, stavový priestor približne 10<sup>40</sup> rôznych pozícií
+  Agent musí konať na základe predchádzajúcich skúseností a odhadovať možné dôsledky svojho konania.
+Spôsoby riešenia herných problémov:
+  * inteligentné metódy - stále nie veľmi úspešné
+  * tabuľkové metódy - použiteľné napr. na záver partie šachu, takzvané koncovky. sú charakteristické tým, že existujú bohaté znalosti, ako tieto situácie riešiť
+  * metódy hľadania - bez nich nedokáže agent hrať žiadnu náročnejšiu hru
+Ťah sa vyberá tak, že sa vyhodnocujú dosiahnuté stavy a urobí sa odhad ich výhodnosti.
+**statická vyhodnocovacia funkcia** - odhaduje, nakoľko možno o danom postavení usudzovať, že povedie z hľadiska agenta k víťazstvu.
+== Opis hry ako problému hľadania: ==
+  * máme hru pre dvoch hráčov, ktorých budeme označovať MAX a MIN, hráči sa striedajú v ťahoch kým hra neskončí
+  * výsledok hry je reprezentovaný pomocou skóre pridelenom viťazovi (resp. odobratím bodov porazenému)
+  * **počiatočný stav** - postavenie na hracej doske a príznak, ktorý hráč je na ťahu
+  * **množina operátorov** - množina povolených ťahov
+  * **množina stavov** - množina všetkých možných postavení na hracej ploche
+  * **cieľový test** určuje kedy hra končí
+  * **bodovacia funkcia** číselne oceňuje výsledok hry
+== Algoritmus MiniMax ==
+  * má určiť najlepšiu stratégiu pre hráča MAX
+  * vychádza z predpokladu, že protivník (MIN) bude vždy hrať tak, aby čo najviac uškodil svojmu MAXovi
+  * MAX sa snaží maximalizovať svoju výhodu, MIN sa svojou snahou o výhru snaží minimalizovať MAXove skóre
+Postup určenia najlepšieho ťahu pre hráča MAX:
+  * Preskúmajú sa všetky stavy, ktoré môžu možnými ťahmi vzniknúť, vygeneruje sa celý strom hľadania, podobne ako pri hľadaní do hĺbky
+  * Rozhodne sa, ktorý ťah je najlepší:
+    * na listy stromu (reprezentujú možné koncové stavy) sa aplikuje hodnotiaca funkcia
+    * postupne sa ohodnotia uzly aj na vyšších úrovniach až po koreňový uzol tak, že do vrcholov, v ktorých je na ťahu MAX sa prenáša maximum z hodnôt potomkov a do vrcholov, v ktorých je na ťahu MIN sa prenáša minimum
+  * Vykoná sa ťah, ktorý vedie do najlepšieho postavenia
+{{:cogsci:minimax-2.jpg|}}
+{{:cogsci:plminmax.gif|}}
+Opísaný algoritmus dokáže robiť efektívne rozhodnutia za predpokladu, že sú k dispozícií prostriedky k prezretiu celého stromu.
+To však nie je realistický predpoklad. Prezetanie treba //useknúť// skôr, než v cieľovom stave a listy sa hodnotia pomocou **heuristickej vyhodnocovacej funkcie**.
+Minimax sa modifikuje následovne:
+  * miesto cieľového testu sa použije usekávací test
+  * miesto bodovacej funkcie sa použije heuristická vyhodnocovacia funkcia
+== Alfa-beta orezávanie (usekávanie) ==
+Iná modifikácia minimaxu, ktorá pracuje s dvoma hraničnými hodnotami zodpovedajúcimi dvom protihráčom.
+  * hodnota "**alfa**" - dolné ohraničenie hodnoty, ktorú može nadobudnúť stav, v ktorom je MAX na ťahu
+  * hodnota "**beta**" - horné ohraničenie hodnoty, ktorú môže nadobudnúť stav, v ktorom je MIN na ťahu
+{{:cogsci:080609231536.png|}}
+  * na začiatku sú obe hodnoty +/- nekonečno
+  * alfa hodnota MAX uzla sa určí ako súčasná najväčšia minimaxová hodnota jeho následnovníkov a nikdy sa nemože zmenšiť
+  * beta hodnota MIN uzla sa určí ako súčasná najmenšia hodnota jeho následnovníkov a nikdy sa nemôže zväčšiť
+  * hľadanie sa môže useknúť pod každým MAX uzlom, ktorého alfa hodnota nie je menšia než beta ľubovoľného predchodcu. ako výsledná hodnota MAX uzla sa použije jeho alfa hodnota -> beta orezávanie
+  * .. sa môže useknúť pod každým MIN uzlom, ktorého beta hodnota nie je väčšia než alfa jeho predchodcov. -> alfa orezávanie
+   * http://www.emunix.emich.edu/~evett/AI/AlphaBeta_movie/sld001.htm
+  * ^ z tohto sa to celkom dobre chape ^
+! dolezite:
+  * treba si dôsledne všímať, ktorý hráč je v danom uzle na ťahu a čo to znamená, podľa toho orezávať alebo meniť hodnoty alfa a beta
+nie je to ťažké, len si treba automatizovať ten princíp
+Alfa-Beta orezávanie je rovnako efektívne ako minimax, ale zvyčajne sa mu podarí nájsť riešenie skôr, čo však nie je pravidlom - záleží od poradia vygenerovaných uzlov.
+== Zdroje ==
+Návrat, P. a kol, Umelá inteligencia, STU BA, 2006
 ==== 9. Databáza znalostí v predikátovej logike, unifikácia, lifting, metódy vyvodzovania. ====
@@ Line 1202: / Line 1281: @@
 === Vizualizácia vysokorozmerných dát ===
 SOM   umožňuje   topograficky   zmapovať   (reprezentovať) **distribúciu vstupných dát**, pričom častejšie prípady aplikácie sú tie, keď počet neurónov v sieti za zvolí **menší** ako počet vstupov. V takom prípade každý neurón sa stane reprezentantom nejakej podmnožiny navzájom podobných vstupov. V opačnom prípade množina blízkych neurónov bude reagovať na ten istý vstup, pričom jeden z nich sa stane (najaktívnejším) centrom. V oboch prípadoch susedné neuróny budú mať tendenciu  reprezentovať  blízke oblasti  vo vstupnom priestore.  V prípade nerovnomernej  distribúcie vstupov SOM proporcionálne rozdelí svoje zdroje a viac zahusteným oblastiam pridelí viac neurónov, čím sa zvýši diskriminačná schopnosť siete v tejto oblasti (magnifikačný faktor). Vďaka 2D štruktúre neurónov sa SOM používa hlavne na vizualizáciu vysokorozmerných dát.
 Príklady použitia: minimum spanning tree, lexical maps, robotic arm control
@@ Line 1207: / Line 1287: @@
-text: {{:cogsci:12_somka.doc|}} {{:cogsci:12_somka.pdf|}}
+text v dokumente: {{:cogsci:12_somka.doc|}} {{:cogsci:12_somka.pdf|}}
+materialy: kniha UvodDoNS: {{:cogsci:chapter_07.pdf|}}; Farkasove slidy: {{:cogsci:som.4x.pdf|}}; na Wikipedii si to snad najdete sami :))
 ==== 13. Rekurentné neurónové siete, architektúry, spôsoby učenia, úlohy s časovým kontextom (klasifikácia   sekvencií, predikcia) ====
+**Motivácia**: k jednému vstupu viacero výstupov, v závislosti od  časového kontextu. Viacvrstvová sieť by mala byť rozšírená o možnosť reprezentovať  časový kontext, aby tak mohla na základe predloženého vstupu lepšie rozhodnúť o výstupe.
+Príklad – paralela: **Mealyho automat**
+  * generuje postupnosti znakov z množ. {α, β}
+  * nedá sa simulovať normálnymi doprednými ANN
+  * V informatice se pojmem Mealyho stroj označuje konečný automat s výstupem. Výstup je generován na základě vstupu a stavu, ve kterém se automat nachází. To znamená, že stavový diagram automatu bude pro každý přechod obsahovat výstupní signál.
+  * [[http://en.wikipedia.org/wiki/Finite_state_machine|viac o konečných automatoch]] alebo [[http://cs.wikipedia.org/wiki/Mealyho_automat|stručne v češtine]]
+{{:cogsci:rnn1.png|}}
+**Riešenie**: pridáme do siete tzv. kontextovú vrstvu, ktorá si „pamätá“ výstup z predošlého času, ktorý sa dá chápať ako akási vnútorná pamäť siete (v Mealyho automate: info o stave, na obr. 1,2,3).
+=== Architektúry ===
+**Elmanova sieť**
+  * najznámejšia a najjednoduchšia architektúra
+  * kontextová vrstva = skrytá vrstva z predošlého kroku: t-1
+  * rozpoznávanie sekvencií, predikcia, dopĺňanie krátkych sekvencií
+{{:cogsci:elman.png|}}
+**Jordan**
+{{:cogsci:jordan.png|}}
+  * ak pridáme **decay units** – pre obsah kontext. vrstvz v t+1 zoberieme časť obsahu kontextovej vrstvy z t-1: C<sub>i</sub>(t+1) = y<sub>i</sub>(t) + αC<sub>i</sub>(t-1)
+  * schopnosť nie len rozpoznávať sekvencie ale aj generovať sekvencie rôznej dĺžky
+  * možnosť: **teacher forcing** = pri učení nahradíme kontextovú vrstvu žiadaným výstupom v t-1
+**Bengio**
+{{:cogsci:bengio.png|}}
+**Williams a Zipser**
+{{:cogsci:williams+zipser.png|}}
+  * plne prepojená rekurentná NS
+**Mozer a Stornetta**
+{{:cogsci:mozer+stornetta.png|}}
+  * lokálna rekurzia = neurón je rekurentne spojený iba sám so sebou, tzv. local-recurrent-global-feedforward networks.
+=== Učenie ===
+**Backpropagation through time**
+  * učenie spätným šírením chyby v čase
+  * rozvinutie rekurentnej siete v čase do potenciálne mnohovrstvovej doprednej siete a použití klasického backpropu
+{{:cogsci:bptt.png|}}
+  * v praxi stačí rozvinúť len niekoľko krokov do minulosti (veľkosť okna)
+  * vzorec:
+{{:cogsci:rnn3.png|}} kde x<sub>i</sub> je aktivita na i-tom neuróne v čase t-1, delta<sub>i</sub> je chyba výstupu (očakávaný – skutočný) a alfa je rýchlosť učenia a
+{{:cogsci:rnn4.png|}}
+  * problém pri sekvenciách neurčenej dĺžky, pretože treba mať veľké okno (sieť potrebuje vidieť ďaleko do minulosti)
+**Real time recurrent learning**
+  * rekurentné učenie v reálnom čase
+{{:cogsci:rnn5.png|}}
+{{:cogsci:rnn6.png|}}
+  * **Ludove intuitívne vysvetlenie**: pre každú váhu si pamätáme jej **vplyv na aktivitu každého neurónu**. Vplyv váhy //ij// (z neurónu //j// do //i//) na neurón k počítame ako váhovanú sumu vplyvov váhy //ij// na neuróny, ktoré kŕmia neurón //k//. V prípade, že //k// = //i// , pripočítame aktivitu neurónu //j// v čase t-1 (člen delta<sup>kr</sup>…). Celé to vynásobíme deriváciou aktivačnej funkcie. Váhu //ij// upravujeme ako sumu chýb na výstupných neurónoch e<sub>k</sub> násobenú vplyvom váhy //ij// na tieto neuróny ∂s<sub>k</sub>(t)/∂w<sub>ij</sub>.
+  * výpočtovo veľmi náročné: zložitosť **O(n^4)**, kde n je počet neurónov
+=== Úlohy pre RNN ===
+  * **rozpoznávanie postupností**: na vstup prichádzajú znaky, sieť naučená na nejaký automat (gramatiku) signalizuje pozitívne (1) ak znak ešte patrí do postupnosti generovanej automatom a negatívne (0) ak znak už nemôže patriť do postupnosti
+  * podobne: **dopĺňanie** postupností, **predikcia** ďalších znakov, **generovanie** nových postupností
+  * simulovanie konečno-stavových automatov – formálnych automatov a jazykov – akéhokoľvek turingovho stroja (výpočtová sila)
+  * **lingvistické úlohy**: predikcia ďalšieho znaku v slove alebo vete, slova vo vete a pod.
+===Literatúra:===
+  * Umelá inteligencia a kogntívna veda I (Kvasnička et. al.)
+  * Úvod do NS: {{:cogsci:chapter_06.pdf|}}
+  * Farkašove slajdy: {{:cogsci:rnn.4x.pdf|}}
+  * TEXT: {{:cogsci:13_rekurentneNS.doc|}}, {{:cogsci:13_rekurentneNS.pdf|}}
 ==== 14. Evolučné algoritmy: základné koncepty a mechanizmy, využitie v UI ====
+vo všeobecnosti sú to špecifické typy optimalizačných algoritmov
+EA využívajú mechanizmy, ktoré sú inšpirované biologickou evolúciou
+Typy evolučných algoritmov
+  * Genetické algoritmy
+  * Genetické programovanie
+  * Evolučné programovanie
+  * Evolučné stratégie
+=== Genetické algoritmy ===
 najpopulárnejší typ EA, využívaný pri riešení problémov a optimalizácií
@@ Line 1263: / Line 1453: @@
 ===Zdroje: ===
 Návrat, P. a kol., Umelá inteligencia, STU BA, 2006

DokuWiki

User Tools

Site Tools

Differences

Page Tools