Visoka ICT škola u Beogradu
Seminarski rad iz predmeta: Web Programiranje PHP
Semantički web
Student :
Tamara Đorđević 1/10
Profesor:
Nenad Kojić
Beograd, decembar 2012. godine
Sadržaj
UVOD .............................................................................................................................. 3
WEB 3.0 .......................................................................................................................... 4
SEMANTIČKI WEB ......................................................................................................... 4
ARHITEKTURA ............................................................................................................... 5
XML(eXtensible Markup Language) ......................................................................... 5
RDF (Resource Description Framework).................................................................. 6
Ontologija ................................................................................................................. 6
SEMANTIČKA PRETRAGA PODATAKA ...................................................................... 7
PRIMENA SEMANTIČKE TEHNOLOGIJE ..................................................................... 8
ZAKLJUČAK ................................................................................................................. 10
LITERATURA................................................................................................................ 11
2
Uvod
Semantika je nauka koja izučava značenje reči, fraza, rečenica i tekstova. Semantika se
često poredi sa sintaksom. Međutim, sintaksa izučava oblike izražavanja, dok
semantika izučava šta konkretno neka reč ili fraza znači.
Semantički web omogućava da web-u dostupni izvori informacija mogu biti organizovani
semantičkim, a ne sintaksičkim metodama. On sakuplja sadržaj sa web-a iz različitih
izvora, zatim obrađuje informacije i razmenjuje informacije sa drugim programima, na
globalnom nivou.
3
Web 3.0
Eksperti u ovoj oblasti Web 3.0 nazivaju i semantičkim webom. Semantički ovde znači
da je baziran na informaciji (podacima). Podaci će stizati od strane korisnika i web će se
zapravo prilagođavati potrebama korisnika. Na primer, ako često tražite ključnim rečima
“design blogs”, dobijaćete više reklama vezanih za dizajn. Takođe, ako pretražujete
nešto drugo, na primer “computers”, web će znati da često pretražujete design i izvući
će pretragu koja objedinjuje “design” i “computers”.
Zapravo, pokretač svega ovoga je ogromna popularnost u korišćenju pametnih telefona
i cloud aplikacija. Ideja je da korisnik može da pristupi što većem broju podataka sa bilo
koje lokacije, a ne samo od kuće. Tehnologija pokušava da proširi ovu ideju na način na
koji TV-u daje mogućnost da pokupi korisničke podatke, kao i omogućavanje pametnom
telefonu da pristupi podacima sa vašeg računara.
Mnogi dizajn trendovi koji su korišćeni u Web-u 2.0 će se promeniti samo u načinu
dizajniranja. Promena sa Web 2.0 na Web 3.0 je u načinu kako se internet koristi, a ne
kako izgleda sa izuzetkom za mobilne uređaje i slično. Dizajn u Web-u 3.0 će, naravno,
biti baziran na tome kako dizajneri odluče, trendovi će se sami nametati.
Šta je Web 3.0, kako je nastao i kako će izgledati ova nova tehnologija prikazano je u
dokumentarcu koji je napravio Kate Ray, a nalazi se na adresi:
http://player.vimeo.com/video/11529540
Sledeći veliki napredak u Web 3.0 tehnologiji će biti izgrađen na temeljima semantičke
web tehnologije, koji će omogućiti da se podaci razmenjuju i koriste između aplikacija,
preduzeća i zajednica.
Semantički web nastao je u potrazi za efikasnijim rešenjima za pronalaženje
informacija, kao nova ekstenzija World Wide Web-a. On omogućava bolju saradnju
između korisnika i uređaja.
Semantički web
Kod semantičkog web-a ideja je da se sve informacije koje se pojavljuju na web-u
označe posebnim tagovima tako da uređaj može automatski povezivati podatke iz
jednog tipa informacija sa nekim drugim tipom informacija. Tim Berners-Lee, koji je
takođe izumeo i WWW i W3C konzorcijum, upravo je zajedno sa ovim konzorcijumom i
u saradnji sa velikim brojem istraživača koji su radili na poboljšanju, proširenju i
standarizaciji sistema u različitim jezicima, publikacijama i alatima osmislio ideju
semantičkog web-a.
4
Semantički web, mada još uvek u razvoju, obećava radikalno poboljšanje mogućnosti
pronalaženja, sortiranja i klasifikacije informacija.
Kao primer, u rečenici „Ja sam Pera Perić i pet godina se bavim Web dizajnom u
kompaniji PeraWeb”, korišćenjem tehnika razvijenih za semantički Web može se
označiti da se tekst: "Pera Perić" odnosi na osobu čije je ime „Pera Perić”; "pet godina"
odnosi na vremenski period od pet godina; "Web dizajnom" odnosi na zanimanje čiji je
naziv „Web dizajn”; "PeraWeb" odnosi na organizaciju čije je ime „PeraWeb”.
Dodatno je moguće navesti da je Web dizajn Perino zanimanje, a da je pet godina
period tokom kojeg Pera radi u PeraWebu. Bez semantičkih oznaka u tekstu, kompjuter
nikako ne bi mogao da shvati razliku između gornje rečenice i, na primer, rečenice „Ja
sam Pera Perić i pet godina pokušavam da se bavim Web dizajnom, ali ne uspevam jer
me PeraWeb mrzi”.
Arhitektura
Semantički web sastoji se od tri važna standarda:

XML(eXtensible Markup Language)

RDF(Resource Description Framework)

Ontologija
Semantički Web zasnovan je na formatu RDF. To je model pravljenja iskaza o
objektima putem tripleta oblika subjekat-predikat-objekat. RDF se najčešće iskazuje
XML-om, ali ovo nije neizbežno pa postoje i implementacije koje ne koriste XML.
Skup RDF iskaza naziva se ontologija – u suštini, opis mogućih subjekata i predikata.
Same ontologije se opisuju OWL-om, posebnim jezikom razvijenim za definisanje
pojmova i odnosa među njima.
XML(eXtensible Markup Language)
XML je skracenica za Extensible Markup Language, odnosno proširivi (metajezik) za
oznacavanje (engl. markup) tekstualnih dokumenata. XML je standardizovan jezik za
čiju se standardizaciju brine W3C. Ideja je bila da se stvori jezik koji će i ljudi i
računarski programi moći jednostavno da čitaju. XML definiše opštu sintaksu za
označavanje podataka pomoću odgovarajućih etiketa (engl. tags) koje imaju poznato ili
lako razumljivo značenje. Format koji obezbeđuje XML za računarske elemente može
se prilagoditi najrazličitijim oblastima, kao što su elektronska razmena podataka,
čuvanje podataka, odvajanje podataka od prezentacije, vektorska grafika, sistemi
glasovne pošte, izrada novih specijalizovanih jezika za označavanje.
5
RDF (Resource Description Framework)
RDF je predložen od strane W3C konzorcijuma za modeliranje meta-podataka o
resursima na web-u. Kao što samo ime govori RDF nije jezik već model koji se može
predstavljati na različite načine. Kako je XML postao standard za serijsku reprezentaciju
i razmenu informacija, prihvaćen je i za predstavljanje i razmenu RDF opisa. RDF
zapravo opisuje semantičke veze između elektronskih izvora. Informacije u RDF-u su
tzv. izjave u obliku tripleta, tj. osnovni elementi u RDF modelu su: Subjekt, Predikat i
Objekt. Sva tri sastavna dela se nazivaju Resource, a identifikuju se pomoću URI
(Uniform Resource Indentifinder). Subjekt (resurs) je povezan s drugim resursom
(objektom) preko veze koja je određena trećim resursom (predikatom).
RDF shema je jednostavan model koji definiše tipove podataka za RDF. Korišćenjem
RDF shema možemo reći npr. da je “Badi” tip “Pas”, a da je “Pas” podtip životinje. Tako
pomoću RDF shema možemo definisati domenski specifične opcije i klase resursa na
koje se te osobine odnose.
Za modeliranje domena koriste se:

Class i SubClassOf iskazi (za hijerarhiju),

Domain i Range iskazi (za ograničavanje mogućih kombinacija osobina i klasa),

Type iskaz (za definiranje resursa kao instance određene klase).
RDF model omogućava standardni opis činjenica o web resursima, što podacima daje
određenu interpretaciju. Upotrebom RDF shema proširuju se interpretacijske
sposobnosti. Pošto je za realizaciju semantičkog web-a potrebno omogućiti tehnike koje
omogućavaju izražavanje semantike na još višem nivou, neophodna su dalja
proširavnja.
Ontologija
Ontologija je reč grčkog porekla. Sastoji se iz reči „Ontos“, koja znači biće, stvarnost i
reči „logia“ što znači nauka. Ona je po svojim izvornim značenjima nauka o biću, učenje
o fundamentalnim i konstruktivnim određenjima bitka. U informatici ontologija znači
formalno definisani sistem pojmova ili koncepta i/ili relacija između tih pojmova.
Konstruktori na web-u služe se ontologijama za registrovanje odnosa, relacija i
karakteristika objekata. Sistemi ontologija definišu termine, pojmove i njihove
međusobne veze.
Ontologija je opis koncepata i veza koje mogu postojati unutar hijerarhije u sistemu
pojmova. Da bi se omogućilo implementiranje ontologija na web-u, potrebna je
određena jezična podrška. Za sada postoji više jezika, odnosno proširenja jezika, koji
omogućuju „kodiranje“ semantičkih informacija primenom ontologija kao što su OIL i
DAML
6
OIL
OIL (Ontology Inference Layer) predstavlja jezik za opis ontologija na web-u. U velikoj
mjeri OIL se zasniva na RDF shemi. OIL je u potpunosti zasnivan na XML sintaksi, dok
je sa RDF-om u određenoj meri isprepleten. OIL ontologije ujedno predstavljaju i validne
RDF dokumente što se postiže proširivanjem definicije RDFS-a.
Po mišljenju autora OIL-a mala je verovatnoća da samo jedan jezik za ontologije može
zadovoljiti sve potrebe korisnika i primene semantickog web-a. Zato su se autori
opredelili da OIL organiziraju kao seriju slojeva koji će se stalno razvijati. Podrazumijeva
se da viši sloj u potpunosti podržava funkcionalnost nižih slojeva. Trenutna specifikacija
OIL-a predvida pored Core OIL i Standard OIL slojeva, i Instance OIL i Heavy OIL.
DAML
DAML (DARPA Agent Markup Language) je jezik zasnivan na ontologijama, razvijen je
kao proširenje XML-a i RDF-a. DAML u odnosu na RDF Schema ide još jedan korak
dalje, pružajuci dodatnu dubinu kod opcija i klasa, omogućavajući time širi spektar
izražavanja. DAML je konceptualno vrlo sličan OIL-u i da je rijec o pravcima koji za sada
neće ići u novija istraživanja dovoljno svedoči i posljednji iz grupe DAML jezika –
DAML+OIL. Ovakav pristup, naravno, DAML uvrštava u najozbiljnijeg kandidata za
buduce standarde.
Semantička pretraga podataka
Ako spojimo semantičku tehnologiju i pretragu podataka dobijamo semantičku pretragu
podataka. Obe tehnologije su slične imaju zajednički cilj a to je rad sa struktuiranim i
nestruktuiranim podacima. Spajanjem dobijamo novu generaciju pretraživača podataka,
koji se bolje snalaze u nestruktuiranim podacima, koji bolje razumeju kontekst pretrage i
koji daju rezultate pretrage veće relevatnosti. Uvođenjem semantičke tehnologije u
pretraživače omogućava se korisniku postavljanje upita u svakodnevnoj jezičkoj formi
čime proširuje baza korisnika i dobijaju bolji rezultati pretrage. Dobar primer
semantičkog pretraživača je Bing.
Kategorizacija semantičkih pretraživača po pristupu problemu pretraživanja:
- Pretraživač predlaže povezane upite za pretragu. Program predlaže upite koje su na
neki način slični ukucanoj pretrazi. Na primer u takvom pretraživaču ako ukucamo
"pesma Dunav", mogući predlog bi bio "Na lepom plavom Dunavu". Ukoliko pretraživač
ne može da nađe kontekst i smisao pretrage onda je najbolje da ne predloži ništa.
- Pretraživač daje preporuke i napomene za rezultate. Ovde pretraživač odgovara sa
materijalom koji definiše termin za pretragu, na primer reči iz rečnika ili raznih
enciklopedia ili nekih drugih relevantnih podataka.
- Semantički komentarisani rezultati. Ovde pretraživač vraća stranice ili dokumente sa
označenim delovima teksta, sa specijalno imenovanim entitetima, koji su u semantičkoj
vezi sa upitom.
7
- Pretraga teksta po sličnosti. Tekstualni blok se rangira od fraze do celog dokumentam,
umesto sa nekoliko reči koje su u upitu. Tehnika pretrage leži u statističkom i
vektorskom upoređivanju i merenju sličnosti umesto konvencionalnim razumevanjem, a
rezultati se uklapaju u semantičke standarde.
- Pretraga po semantičim i sintaksnim oznakama. Korisnik će označiti termine za
pretragu koji ukazuju na sintaksnu ulogu koju igraju, na primer. delovi rečenice
(imenica, glagol..) ili semantičko značenje (kompanija, lokacija, događaj). Na ovaj način
se izbegavaju dvosmisleni termini koji mogu dati neprecizne rezultate. Na primer
ako programeri koriste UIMA CAS sistem za označavanje upit će biti u obliku XML-a, na
primer <company>kupuje</company>, čime se termin kupuje definiše za kompanije.
- Konceptualna pretraga. Na primer ako tražimo "Manchester United", možemo dobiti
rezultate koje sadrže naziv stadiona Old Trafford a da čak ne sadrže reč iz upita.
Konceptualne veze su definisane taksonomijama i mogu da budu manje deterministički
zaključene nego statističke metode i slične tehnike.
- Ontološka pretraga. Ovde pretraživač ne razume samo hijerarhijske veze entiteta i
koncepata, kao u taksonomijama, nego i kompleksnije među entitetske veze. Na primer
ako tražimo "koji su rezultati Manchester Uniteda", dobićemo rezultate
o Manutd, Ligi Šampiona, Premijer Ligi itd.
- Semantička veb pretraga. Semantički veb je primena beleženja veza između
podataka, na primer podaci u rdf formatu koji omogućavaju upite nad samim veb
sajtom. Više takvih sajtova čine mrežu podataka, što je jedan ciljeva primene
semantičkog veba. Za ovaj vredan cilj su potrebne još godine do praktične primene.
- Promenljiva pretraga. Dinamička pretraga nudi mogućnost istraživanja rezultata
pretrage u zavisnosti od seta predefinisanih kategorija koje zovemo aspekti. Oni se
mogu koristiti u kompletiranju i sugestijama kod kreiranja upita i u istraživanju rezultata
preko zaključaka i značenja.
Primena semantičke tehnologije
Open Calais je najbolji semantički onlajn web servis za Englesko govorno područje.
Ovaj servis generiše bogatu kolekciju metapodataka (podaci koji opisuju sadržaj) nad
datim tekstom. Calais koristi metode procesiranja svakodnevnog jezika, kontinualnog
mašinskog učenja i druge metode, da bi se dati dokument analizirao i kao rezultat našli
entiteti u okviru datog teksta. Pored entiteta Open Calais ide i korak dalje, tako što daje
događaje i fakte, koji su skriveni u značenju teksta. Rezultati Calais web servisa se
mogu koristiti za pretrage podataka, skladištenje,grupisanje i kategorizaciju vesti,
blogova, kataloga i bilo kog drugog sadržaja.
8
Semantički web se takođe koristi za RSS, a koriste ga: BBC, CNET...
Nastao je i novi CMS, pod nazivom DT CMS. DT CMS je editor sadržaja,koji nudi rad sa
tekstovima, slikama, fajlovima za sajt. Omogućava bilo koju strukturu, pojačan sa
semantičkom tehnologijom. DT Wiki je semantički orjentisana enterprajs web aplikacija
za kreiranje i korišćenje baze znanja.
9
Zaključak
Ukoliko bi svi dokumenti na Internetu bili označeni na ovaj način, pretraživači Interneta
bi to mogli da uzmu u obzir. Tako bi, npr. bilo jednostavno naći iskusne Web dizajnere,
napraviti spisak svih srpskih časopisa ili enciklopedija. Tekstualnom pretragom kakva je
sada zastupljena ovako nešto jednostavno nije moguće.
Postoji nekoliko pretraživača koja koriste semantički web:
swoogle.umbc.edu
kmi-web05.open.ac.uk/WatsonWUI
swse.deri.org
Napisane su i knjige, koje još uvek nisu prevedene na naš jezik. Jedne od popularnijih
su:
A Semantic Web
Primer, 2nd Edition
(Cooperative
Information Systems)
Grigoris Antoniou, Frank
van Harmelen
Semantic Web
Programming John
Hebeler, Matthew
Fisher, Ryan Blace,
Andrew Perez-Lopez
Programming the
Semantic Web
Toby Segaran, Colin
Evans, Jamie Taylor
Semantic Web for the
Working Ontologist:
Effective Modeling in
RDFS and OWL
Dean Allemang, James
Hendler
Međutim, iako knjige nisu prevedene postoji srpski sajt na ovu temu
http://www.semanticweb.rs. Na njemu redovno izlaze najnovije vesti vezane za Web 3.0
tehnologiju i njeno dalje napredovanje.
Problem koji semantički Web ima jeste to što je sve ovo veoma komplikovano, a malo
kome potrebno. Pre svega, on zahteva korišćenje XML-a, dakle i XHTML-a, koji mora
biti potpuno ispravan, dok se u praksi retko sreće i ispravan HTML. Čak i u primenama
u kojima bi oni bili očito superiorno ili jedino rešenje, korisnici ne prave semantičke
sadržaje jer ne postoje programi koji bi ih koristili. Ipak, u nekim oblastima, semantički
Web se polako širi. RSS, široko raširen format za pregled vesti, jeste njegov deo.
Creative Commons (http://creativecommons.org) na ovaj način označava status
autorskih prava dokumenata. Na nekim blogovima postoji mogućnost predstavljanja
ličnih podataka u formatu FOAF (Friend Of A Friend – prijatelj prijatelja) koji bi, ako
postane dovoljno raširen, uz svoje proširenje DOAC omogućio bogatim poslodavcima
da nađu iskusne Web dizajnere.
10
Literatura

http://www.sk.rs

http://sr.wikipedia.org

http://www.tutorijali.org

http://www.semanticweb.rs

http://www.urban-design.org.uk
11
Download

Seminarski rad - Tamara Đorđević