Sou asné trendy um lé inteligence
Petr Berka
(publikováno v Acta Oeconomica Pragensia, Vol.11, No.8, 2003, s.41-46)
Abstrakt:
lánek se zamýšlí nad sou asnými výzkumnými trendy um lé inteligence ve ty ech základních
oblastech. V oblasti práce se znalostmi dochází k posunu od transferu znalostí k modelování
znalostí a k vytvá ení ontologií. V oblasti práce s neur itostí se v rámci soft computing studuje
vzájemné kombinování více p ístup . V oblasti u ení pozorujeme snahy obohatit klasické
metody dávkového u ení o prvky adaptace. V oblasti komunikace je to vytvá ení
multiagentních systém složených z racionálních agent .
1. Úvod
Stroje a mechanismy napodobující lidskou innost zam stnávají fantazii lov ka
od nepam ti – nedávný film Stevena Spielberga není ani zdaleka prvním um leckým
dílem s touto tematikou. Zmínky o um lých bytostech nacházíme v krásné literatu e již
u Homéra, i první dochované zmínky o konstrukci mechanism a automat jsou z
antických dob. Pokud jde o zem koruny eské, pak je t eba vzpomenout na pov st o
Golemovi a na R.U.R. Karla apka – jeho zásluhou mají roboti své jméno. Za p ímého
p edch dce tv rc dnešních po íta a um lé inteligence lze považovat Angli ana
Charlese Babbage, který od roku 1833 vytvá í projekt analytického stroje (analytical
engine). Poprvé se zde objevuje myšlenka dvou základních ástí po íta e: procesoru a
pam ti, které Babbage nazývá (v duchu pr myslové revoluce) fabrika a sklad. Ve
skladu byl uložen „program“ v podob lístk z tuhého papíru s vyd rovanými otvory.
Babbage o svém projektu prohlásil, že bude p edstavovat mechanizovanou inteligenci,
bude-li schopen „požírat sv j vlastní ohon“, tedy prost ednictvím své funkce m nit
vlastní „skladovaný“ program.
Podle Marvina Minského z Massachusetts Institute of Technology je um lá
inteligence v da, jejímž úkolem je nau it stroje, aby d laly v ci, které vyžadují
inteligenci, jsou-li provád ny lov kem. Za zrod um lé inteligence je považován rok
1950, kdy britský matematik Alan Turing ve svém lánku Computing Machinery and
Intelligence uve ejn ném v asopise Mind položil provokující otázku „Mohou stroje
myslet?“'. Odpov hledal autor v behavioristickém p ístupu k v ci. Inteligenci stroje
posuzuje výlu n na základ jeho vn jšího chování, v dialogu s lov kem. V navrženém
testu (pozd ji tento test dostal název Turing v) je experimetátor spojen dálnopisem se
dv ma místnostmi; v jedné je lov k, ve druhé stroj (po íta ). Úkolem experimentátora
je zjistit (pomocí libovolných otázek) kde je stroj a kde je lov k. Úkolem stroje je
p edstírat, že je lov k, úkolem lov ka v jedné z místností je umožnit
experimentátorovi, aby rozhodl správn . Nejzávažn jší námitkou proti Turingovu testu
je, že m í schopnost po íta e simulovat myšlení, ale nic nevypovídá o vlastní
inteligenci po íta e; krom výsledného efektu by se m la posuzovat i inteligence
zp sobu ešení dané úlohy. Inteligence je tímto testem redukována na pouhou schopnost
p esv d iv lhát. V tomto smyslu je i Minského definice um lé inteligence zam ena
p íliš jednostrann . Na druhé stran ani letadla za letu nemávají k ídly jako ptáci, takže
asto „inteligentní“ chování systému považujeme za dosta ující, i když procesy
probíhající v po íta i nejsou totožné s procesy v lidském mozku.
Od Turingových dob prošla um lá inteligence adou vývojových etap a i když se
výzkum rozprost el do zna né ší e, m žeme vysledovat n které základní principy, se
kterými se v um lé inteligenci potkáváme tém neustále. K t mto princip m pat í práce
se znalostmi (jejich reprezentování a využívání), práce s neur itostí, u ení a adaptace, a
komunikace. lánek ukazuje, jakým vývojem prošly aplikace uvedených princip
v inteligentních systémech a jaké jsou sou asné trendy.
2. Práce se znalostmi
V polovin 70. let se za al v um lé inteligenci p esouvat d raz od hledání
univerzálního algoritmu pro ešení široké t ídy úloh k práci se specializovanými
znalostmi z ur ité oblasti. Tento trend našel své vyjád ení v expertních systémech.
Expertní systém m žeme chápat jako inteligentní po íta ový program, který užívá
znalosti a inferen ní procedury k ešení problém , které jsou natolik obtížné, že pro
své ešení vyžadují významnou lidskou expertízu [Feigenbaum, 1979]. Znalosti
nezbytné k innosti na této úrovni plus použitá inferen ní procedura mohou být
chápány jako model expertízy nejlepších praktik v oboru. Za hlavní rysy expertních
systém bývá považováno:
• odd lení znalostí a mechanismu pro jejich využívání - znalosti experta jsou
uloženy v bázi znalostí odd len od inferen ního mechanismu. To umož uje
vytvá et problémov nezávislé (prázdné) expertní systémy, kde jeden inferen ní
mechanismus m že pracovat s r znými bázemi znalostí,
• práce s neur itostí - v bázi znalostí jsou uloženy nejen exaktn dokázané
znalosti, ale i nejr zn jší heuristiky, které se expertovi osv d ily p i jeho
rozhodování za dlouhou dobu praxe. Zde se pak objevují pojmy jako " asto",
"n kdy". Obdobn i odpov di na otázky b hem konzultace bývají zatíženy
neur itostí, (klient banky má "asi" dostate ný p íjem pro poskytnutí úv ru),
• dialogový režim - typický zp sob práce je "dotaz systému - odpov
uživatele" obdobn , jak probíhá konzultace s lidským expertem,
• vysv tlovací innost - aby se zvýšila d v ra uživatel v záv ry expertního
systému, m l by systém vysv tlovat své usuzování,
• modularita a transparentnost báze znalostí - pro možnost snadné modifikace
báze znalostí i pro její dobrou srozumitelnost.
Expertní systémy postupn nalezly uplatn ní v celé ad oblastí: léka ská nebo
technická diagnostika, návrh a konfigurování technických za ízení (nap . po íta ),
interpretace dat (nap . odhalování ložisek rudy na základ zkušebních vrt nebo
odhalování typu chemické slou eniny na základ hmotových spektrogram ) apod.
Významné jsou i aplikace v oblasti ekonomie: vyhodnocování bonity klienta banky,
predikce vývoje kurz akcií, odhalování podez elých transakcí na bankovních ú tech,
i sestavování plán auditu. Na rozdíl od p vodních optimistických p edstav o
schopnosti expertních systém pln nahradit lidského experta v procesu rozhodování
dnes tyto systémy spíše hrají roli asistent , kte í svým uživatel m pomáhají ešit rutinní
problémy. Z implementa ního hlediska pak tyto systémy tvo í jen díl í ást celkového
programového ešení pro danou úlohu.
Pro vytvo ení expertního systému pro n jakou aplika ní oblast je klí ová otázka
získání a formální reprezentace p íslušných znalostí1. Zpo átku m lo získávání znalostí
podobu transferu znalostí: znalostní inženýr p ebíral znalosti od experta a p ímo je
vkládal do expertního systému. Takto vytvá ené báze znalostí jsou ale obtížn
modifikovatelné a p enositelné. Nebývají v nich totiž rozlišeny statické znalosti, týkající
se celé aplika ní oblasti a znalosti vztahující se k ešení dané konkrétní úlohy. Proto
dochází na p elomu 80. a 90. let ke zm n pohledu na proces získávání znalostí. Tento
proces za íná být chápan jako modelování znalostí, tedy jako tvorba p ehledných a
opakovan použitelných model dané úlohy. Znalosti jsou tedy zachycovány nezávisle
na odvozovacích mechanizmech a formalizmu reprezentace znalostí konkrétního
expertního (znalostního) systému. Tomuto pohledu se p izp sobují i metodiky tvorby
aplikací. K nejznám jším metodikám pat í CommonKADS z druhé poloviny 90. let
[Schreiber a kol., 1999]. Tato metodika používá t i vrstvy modelu znalostí: doménové
znalosti (statické znalosti platné v dané oblasti nezávisle na ešené úloze), inferen ní
znalosti (deklarativní znalosti vyjad ující co lze odvozovat) a úlohové znalosti (znalosti
popisující jakým zp sobem odvozovat). T žišt m metodiky jsou takzvané modely
generických úloh (generic task models), které vznikají propojením inferen ních a
úlohových znalostí – otázka doménových znalostí z stává pon kud v pozadí.
Nejnov ji se ve znalostním modelování objevuje pojem ontologie. Tento pojem je
(na rozdíl od filosofického pojetí, kde ontologie znamená nauku o „bytí“) chápán jako
ozna ení domluvené terminologie pro ur itou aplika ní oblast, která umož uje sdílení
znalostí z této oblasti. Ontologie tedy umož ují formalizovat doménové znalosti.
Jedním z prvních pokus zachytit ve velkém rozsahu znalosti o sv t je Lenat v projekt
CyC [Lenat, Guha, 1990]. Této projekt zahájený již v roce 1984 usiluje o shromážd ní
všeobecných (common sense) znalostí, které by ve znalostních systémech fungovaly
komplementárn ke specializovaným znalostem experta. CyC je p íkladem tzv.
generické ontologie – zachycuje obecné zákonitosti platící nap í r znými aplika ními
oblastmi. ast jší jsou tzv. doménové ontologie, jejichž p edm tem je ur itá specifická
v cná oblast. P íkladem tohoto typu ontologií je Enterprise Ontology zachycující
obecné koncepty a znalosti týkající se organiza ní struktury a inností podniku jako
celku i jeho díl ích ástí [Uschold a kol., 1998]. Ontologie se vytvá ejí i v souvislosti
s internetem; projekt Semantic Web je zam en na p idání sémantiky k webovým
stránkám (v podob metadat). Krom konkrétních ontologií se objevují i prost edky pro
sdílení a p enos ontologií – p íkladem jsou jazyky Ontolingua nebo OCML.
3. Práce s neur itostí
V tšina našich znalostí o reálném sv t je zatížena (ve v tší i menší mí e)
neur itostí. Na druhou stranu, schopnost rozhodovat se i v situacích, kdy nejsou
všechny informace dostupné, je b žnou vlastností lidského rozumu. Zpo átku byla tato
skute nost um lou inteligencí p ehlížena, výzkum se zam oval p edevším na
symbolické manipulace2. Své explicitní vyjád ení našla neur itost až v polovin 70. let
v souvislosti s expertními systémy. Vedle ad hoc p ístup , navržených pro práci
1
Tato skute nost našla sv j odraz i ve zm n terminologie, dnes spíše než o expertních systémech
mluvíme o systémech znalostních.
2
I speciální programovací jazyky pro um lou inteligenci (zejména LISP) zpo átku neumož ovaly
provád t matematické operace.
s neur itostí v konkrétních expertních systémech (nap . MYCIN nebo PROSPECTOR)
se vychází i z propracovaných teorií. Historicky první je teorie pravd podobnosti, jejíž
základy spadají do sedmnáctého století. V sou asnosti je tato teorie nejpropracovan jší
a existuje celá ada jejích aplikací v oblasti um lé inteligence. Za všechny zmi me
bayesovské sít umož ující reprezentovat znalosti o áste n nezávislých evidencích a
tyto znalosti použít p i usuzování. Z dalších teorií našly své uplatn ní v um lé
inteligenci teorie možnosti (possibility theory) a teorie fuzzy množin (a fuzzy logiky).
Zatímco axiomy teorie možnosti jsou velice podobné axiom m teorie
pravd podobnosti, teorie ale umož uje vyjad ovat vágnost p irozeného jazyka, fuzzy
množiny (rovn ž nabízející formalismus pro vyjád ení vágnosti) vycházejí ze zcela
odlišných základ .
D raz na zpracování neur itosti dostal v posledních letech v kontextu um lé
inteligence nový impuls v oblasti nazývané soft computing. Soft computing je termín
souhrnn ozna ující metody, které umož ují rychle nalézat ešení (by ne zcela
optimální) vágn a neúpln popsaných problém [Zadeh, 1994]. Do oblasti soft
computing bývají z metod um lé inteligence azeny fuzzy logika, neuronové sít a
genetické algoritmy. Pat í sem ale i pravd podobnostní metody nebo teorie chaosu.
Podstatné je, že tyto metody se nepoužívají izolovan ale ve vzájemné kombinaci;
nalezneme tak nap íklad celou adu neuro-fuzzy nebo fuzzy-genetických systém . Do
oblasti soft computing se p esouvá i práce s neur itostí ze znalostních systém .
4. U ení a adaptace
D ležitou vlastností živých organism je schopnost p izp sobovat se m nícím se
podmínkám (adaptovat se), eventuáln se u it na základ vlastních zkušeností.
Schopnost u it se bývá n kdy dokonce považována za definici inteligence. Je proto
p irozené, že vybavit touto vlastností i systémy technické je jedním z cíl um lé
inteligence. Navíc v ad praktických p ípad , kdy není dostatek apriorních znalostí o
ešeném problému, ani jinak postupovat nelze.
Prvky u ení m žeme pod r znými názvy nalézt v ad v dních disciplin; ve
statistice se používají termíny explora ní analýza dat nebo inteligentní analýza dat, v
um lé inteligenci se hovo í o metodách rozpoznávání obraz , strojového u ení nebo
automatizovaného získávání znalostí – u ení má své místo i v robotice, v teorii ízení
najdeme adaptivní a u ící se systémy, v souvislosti s dobýváním znalostí z databází
(knowledge discovery in databases) se používá termín dolování z dat (data mining).
Zastavme se trochu u posledních dvou termín . Dobývání znalostí z databází lze
definovat jako netriviální extrakci implicitních, d íve neznámých a potenciáln
užite ných informací z dat [Fayyad a kol, 1996]. Na rozdíl od „prostého“ použití
statistických metod a metod strojového u ení se v procesu dobývání znalostí již klade
d raz i na p ípravu dat pro analýzu a na interpretaci výsledných znalostí. Proces
dobývání znalostí je tedy tvo en celou adou krok , z nichž pouze jeden z nich
odpovídá použitím metod strojového u ení.
Pro získávání znalostí z dat (a tedy i pro dobývání znalostí z databází) se
používá ada nejr zn jších metod strojového u ení: rozhodovací stromy, rozhodovací
pravidla, asocia ní pravidla, neuronové sít , genetické algoritmy, bayesovské metody,
p ípadové usuzování, induktivní logické programování3. V oblasti um lé inteligence
jsou tyto metody známy již desítky let; první modely neuronových sítí byly navrženy ve
40. letech, první algoritmy pro tvorbu rozhodovacích strom , asocia ních, nebo
rozhodovacích pravidel pocházejí ze 60. let. V tšinou se ale jednalo o algoritmy
pracující v dávkovém režimu. P i tomto režimu je od sebe odd lena fáze u ení od fáze
vlastní innosti systému. B hem u ení je systému p edložena kone ná tzv. trénovací
množina p íklad , p i emž každý prvek této množiny je obvykle dopln n informací o
za azení do t ídy (u ení s u itelem). Na základ t chto p íklad si systém vytvo í
obecnou reprezentaci jednotlivých koncept (t íd). Tuto reprezentaci pak používá p i
klasifikaci nových p íklad . „Dou ení“ systému na základ nových dat tedy nebylo
možné.
V poslední dob se objevují snahy vybavit u ící se systémy rysy adaptivity. Ve
shod s evropským výzkumným projektem EUNITE (IST-2000-29207) budeme
adaptivitu chápat jako schopnost inteligentního systému p izp sobit se zm nám
prost edí, novým podmínkám využívání, p ípadn nové aplikaci [Anguita, 2001].
Z pohledu u ících se systém m žeme takto definovanou adaptivitu chápat jako
inkrementální u ení (pr b žné dou ování systému na základ nových dat), u ení a
zapomínání (schopnost systému rozpoznat zm nu konceptu a této zm n se
p izp sobit), integraci znalostí (schopnost systému kombinovat více zdroj znalostí),
meta-u ení (schopnost systému kombinovat více model znalostí v pr b hu
rozhodování), revizi znalostí (schopnost aktualizovat používané znalosti), nebo
využívání analogií.
5. Komunikace
Komunikace se jako jeden z princip objevuje v um lé inteligenci až v druhé
polovin 80. let. V roce 1986 uve ej uje M. Minsky knihu The Society of Mind ve které
podává p edstavu mysli jako systému vzájemn interagujících agent , kte í monitorují
signály vysílané jinými agenty a vykonávají jednoduché akce. V téže dob se za íná
rovn ž mluvit o „nové“ um lé inteligenci. Na rozdíl od „tradi ní“ um lé inteligence,
která se opírá o vnit ní (obvykle symbolický) model sv ta je „nová“ um lá inteligence
inteligencí bez reprezentace znalostí a bez uvažování. P edním p edstavitelem tohoto
sm ru je R. Brooks z MIT, podle kterého vzniká inteligence ze vzájemné interakce
jednoduchých, takzvaných reaktivních agent [Brooks, 1991].
Výše uvedené p íklady ukazují roli komunikace a interakce v systémech um lé
inteligence. V sou asnosti jsou tyto problémy studovány v souvislosti s multiagentními
systémy jakožto jedním z dominujících témat i v oblasti „tradi ní“ um lé inteligence.
Racionálního agenta (agenta který je schopen se rozhodnout o následné akci co
nejoptimáln jším zp sobem) charakterizuje v tradi ním pojetí [Ma ík a kol,. 2001] jeho
autonomnost (schopnost nezávisle pracovat), reaktivita (schopnost pr b žn reagovat
na zm ny prost edí), intencionalita (schopnost uvažovat o svých dlouhodobých cílech),
a sociální inteligence (schopnost komunikovat s ostatními agenty). Pro poslední
schopnost, která je klí ová pro fungování multiagentních systém byla navržena ada
jazyk jako nap . KQML nebo nov jší FIPA-ACL.
3
Lze použít i metody z oblasti statistiky jako diskrimina ní analýza, regresní analýza a shluková analýza.
Možnosti využití multiagentních systém jsou zna n rozmanité, aplikace
m žeme nalézt v oblasti plánování výroby i v oblasti vyhledávání informací na
Internetu. V prvním p ípad by se nejspíš jednalo multiagentní systém tvo ený
hierarchií heterogenních agent specializovaných na r zné innosti (p íklad viz [Ma ík
a kol., 2000]), ve druhém p ípad bychom mohli použít homogenní, rovnocenné agenty.
Literatura
Anguita,D.: Smart Adaptive Systems: State of the Art and Future Directions of
Research. European Symposium on Intelligent Technologies, Hybrid Systems and
their implementation on Smart Adaptive Systems EUNITE 2001, Tenerife, Spain.
Berka,P.: Dobývání znalostí z databází, Academia, Praha, 2003. (v tisku)
Berka,P. - Ma ík,V. - Svátek,V.: Znalostní inženýrství. In: Ma ík,V. - Št pánková,O. Lažanský,J. (eds): Um lá inteligence II. Academia, 1997.
Brooks,R.: Intelligence without representation. Artificial Intelligence 47, 1991,139-160.
Fayyad,U. – Piatetsky-Shapiro,G. – Smyth,P. – Uthurusamy,R. eds.: Advances in
Knowledge Discovery and Data Mining. AAAI Press/MIT Press, 1996
Feigenbaum,E.A.: Themes and Case Studies of Knowledge Engineering. In: Michie,D.
Expert Systems in the Micro-Electronic Age. Edinburgh University Press, 1979.
Lenat,D. - Guha,R.V.: Building Large Knowledge-based Systems: Representation and
Inference in the CyC Project. Addison-Wesley, 1990.
Ma ík,V. – P chou ek,M. – Št pánková,O. – Lažanský,J.: ProPlanT: Multi-Agent
System for Production Planning. Applied Artificial Intelligence 14(7), 2000, 727-762.
Ma ík,V. – P chou ek,M. - Št pánková,O.: Multiagentní systémy: Principy komunikace
a základní formální architektury. In: Ma ík,V. - Št pánková,O. - Lažanský,J. (eds):
Um lá inteligence III. Academia, 2001.
Schreiber,A.T. – Akkermans,H. – Anjewierden,A.: Knowledge engineering and
management: the CommonKADS methodology. MIT Press, 1999.
Svátek,V.: Ontologie a WWW. In: Datakon 2002.
Uschold,M. – King,M. – Moralee,S. – Zorgios,Y.: The Enterprise Ontology. Knowledge
Engineering Review, 13(1), 1998, 31-89.
Zadeh,L.: Fuzzy Logic, Neural Networks and Soft Computing, Communications of the
ACM, 37(3), 1994, 77-84.
Summary:
The history of Artificial Intelligence (AI) started in 1950 with the paper by Alan Turing
„Computing Machinery and Intelligence”. Since then, AI became a mature research (and
application) area with a variety of subfields and research directions. The paper focuses on four
of them: knowledge representation and processing, uncertainty processing, learning and
adaptivity, and communication. In the area of knowledge representation we can observe a
paradigm shift from knowledge transfer (this was the standard way of building 1st generation
expert systems) to knowledge modelling (as described e.g. by the CommonKADS
methodology) and building ontologies. In uncertainty processing, the area of soft computing
stresses the necessity (and effectivity) of combining various approaches to „achieve tractability,
robustness and low solution cost“ [Zadeh, 1994]. In the area of machine learning, standard batch
learning algorithms are enhanced by some adaptivity features to deal with changing domains,
concept drift or knowledge integration and revision. The current trend of research dealing with
communication is to build multiagent systems composed of rational agents.
Download

Úvod - Sorry