POLISEMIJA KAO NEIZVESNOST
ZNAČENJA REČI
Dušica Filipović Đurđević
Odsek za psihologiju, Univerzitet u Novom Sadu
Laboratorija za eksperimentalnu psihologiju, Univerzitet u Beogradu
VIŠEZNAČNOST REČI SKORO DA NE
PRIMEĆUJEMO...
„
Engleski jezik:
“The spirit is willing, but the flesh is weak.”
„
Ruski jezik...
„
Engleski jezik:
“The Vodka is good, but the meat is rotten.”
I...VRLO NAM JE KORISNA
„
Čiko, koliko je sati?....Ne znam, pitaj Zagora.
„
Muž mi je doneo kokošku i rekao da je spremim za
nedelju. Nisam znala šta kokoške nose, pa sam joj obukla
ovu haljinicu.
„
Da li jedete suši?....Ne, uvek jedem s usta!
„
Da li ste došli s juga?...Ne, došao sam s ladu.
„
Svi su bili na mojoj strani, zato se čamac i prevrnuo.
DA LI JE HUMOR JEDINA KORIST OD
VIŠEZNAČNOSTI?
„
Da li bi nam život bio jednostavniji da sve reči imaju
jedno značenje?
„
Da li je višeznačnost “korisna” za obradu jezika?
OBLICI VIŠEZNAČNOSTI REČI
„
Homografija
Cele noći grad je padao na grad.
„
Homoformija
Postoji dodatni kriterijum
za razlikovanje.
Dok sam radio, slušao sam radio.
„
Homonimija
Pop sluša pop.
„
Polisemija
Kljun se popeo na kljun.
Značenje jedini kriterijum
za razlikovanje.
HOMONIMIJA VS. POLISEMIJA
„
Homonimija – reči sa više nepovezanih značenja
pop – sveštenik
pop – vrsta muzike
Posledica slučaja
Usporava obradu
„
Polisemija – reči sa više povezanih značenja
kljun – deo tela ptice
kljun – prednji deo aviona, broda, cipele...
Sistematska pojava u jeziku
Rodd, Gaskell & Marslen-Wilson, 2002
Beretta, Fiorentino & Poeppel, 2005
Ubrzava obradu
kljun
Sve ptice imaju kljun
Cipela ima kljun
kljun
NEIZVESNOST ZNAČENJA
?
?
?
kljun
?
?
?
CILJ
(Filipović Đurđević, 2007)
• Višeznačnost → neizvesnost značenja
• kao što su predložili (Gilhooly & Logie, 1980)
NEIZVESNOST ZNAČENJA REČI
„
Ne postoji
→ znam tačno
šta će da se desi.
juni
„
→
Maksimalna
→ sve je moguće.
TRADICIONALNO – BROJ ZNAČENJA
NEIZVESNOST ZNAČENJA REČI
balkon
zglob
TRADICIONALNO – BROJ ZNAČENJA
„
Porast u broju značenja praćen kraćim vremenom obrade.
Rodd, Gaskell & Marslen-Wilson, 2002
Beretta, Fiorentino & Poeppel, 2005
6
5
4
RT 3
2
1
0
1
2
3
Broj značenja
4
5
NEIZVESNOST ZNAČENJA REČI
1
0.8
0.7
0.6
0.5
0.4
0.3
0.2
balkon
0.9
Verovatnoća
Verovatnoća
0.9
0.8
1
zglob
0.9
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.1
0
0
...
Verovatnoća
1
brada
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
...
NEIZVESNOST ZNAČENJA REČI
„
Dva izvora neizvesnosti
„
Više značenja
→ veća neizvesnost
Ispitano ranijim istraživanjima
„
Ujednačenija učestalost upotrebe značenja
→ veća neizvesnost
Cilj!
KAKO IZMERITI NEIZVESNOST?
„
Mera neizvesnosti → Entropija
n
Entropija = −∑ pi ⋅ log pi
i =0
verovatnoća
„
„
Mera broja značenja
→
Mera (ne)ujednačenosti verovatnoća značenja
→ Redundansa
redundansa = 1−
Entropija
Max.Entropija
Maks.Entropija = log ( BrojZnacenja )
CILJ – POKAZATI DA JE:
• Entropija distribucije verovatnoća značenja adekvatan opis
višeznačnosti reči.
• Kognitivni sistem osetljiv
• ne samo na broj značenja,
• već i na verovatnoće pojedinih značenja – redundansu.
Za procenu
neizvesnosti značenja
potrebno poznavati
verovatnoće
značenja reči!
REČNIK MATICE SRPSKE
• 150 polisemičnih imenica
• Raspon značenja: 2 do 18
• Raspon frekvencije: 10 do 999
20
18
16
(log) Frekvencija
14
12
logp
10
N
8
6
4
Broj značenja
2
0
1
9
17 25 33 41 49 57 65 73 81 89 97 105 113 121 129 137 145
• Prikupljene procene
• familijarnosti reči
• konkretnosti značenja reči
FORMIRANJE DISTRIBUCIJE
VEROVATNOĆA ZNAČENJA
• Ispitanici navode sva značenja neke reči kojih mogu da sete
• Total meaning metric
(Azuma, 1996)
• Klasifikovanje prikupljenih značenja
BRADA (ispitanici)
F
p
H
N
T
Fam
deo lica, deo vilice
(Imam rupicu na bradi)
18
0.39
1.99
7
0.29
6.75
dlake na muškoj bradi
(Obrij tu bradu!)
18
0.39
6.94
deo ploda kukuruza-kukuruzna svila
(kukuruzna brada)
4
0.09
3.94
osetljivo mesto kod boksera
(staklena brada)
2
0.04
3.24
simbol za starost, učenost
(seda brada)
2
0.04
4.71
simbol za visok pološaj
(zna se ko nosi bradu u ovoj kući)
1
0.02
2.18
govoriti u bradu
(mumlati)
1
0.02
5.71
EKSPERIMENTI
„
Da li neizvesnost značenja utiče na vreme prepoznavanja reči?
‰ Entropija
„
Da li ujednačenost verovatnoća značenja utiče na obradu?
‰ Redundansa
EKSPERIMENT 1
„
„
„
„
Zadatak leksičke odluke
54 studenta prve godine psihologije
150 imenica i 150 pseudoimenica
Korelacioni nacrt
‰ Nezavisne varijable:
„ Dužina reči
„ (log) frekvencija leme
„ Familijarnost reči
„ Konkretnost reči
„ Entropija / Broj značenja i redundansa
‰ Zavisna varijabla:
„ Vreme reakcije
EKSPERIMENT 1
Entropija
• Analiza linearnih mešovitih efekata
• Slučajni efekti
Ispitanici
Stimulusi
• Fiksni efekti
dužina reči: β=0.02, t(7435)=4.41, p<0.0001
(log) frekvencija leme: β=-0.024, t(7435)=-8.84, p<0.0001
familijarnost reči: β=-0.052, t(7435)=-6.30, p<0.0001
entropija: β=-0.285, t(7435)=-2.97, p<0.01
entropija (nelinearno): β=0.021, t(7435)=3.04, p<0.01
familijarnost*entropija: β=0.042, t(7435)=2.79, p<0.01
EKSPERIMENT 1
Broj značenja i redundansa
• Analiza linearnih mešovitih efekata
• Slučajni efekti
Ispitanici
Stimulusi
• Fiksni efekti
dužina reči: β=0.018, t(7435)=4.08, p<0.0001
(log) frekvencija leme: β=-0.025, t(7435)=-9.22, p<0.0001
familijarnost reči: β=-0.053, t(7435)=-6.49, p<0.0001
broj značenja: β=-0.002, t(7435)=-2.92, p<0.01
broj značenja (nelinearno): β= 0.0002, t(7435)=2.91, p<0.01
redundansa: β=0.241, t(7435)=4.13, p<0.0001
EKSPERIMENT 2:
FAKTORIJALNI NACRT
T malo
N
malo
T veliko
0.7
0 .7
0.6
0 .6
0.5
0 .5
0.4
0 .4
0.3
0 .3
0.2
0 .2
0.1
0 .1
0
0
1
N
veliko
2
3
4
5
6
7
8
9
10
0.7
0.7
0.6
0.6
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
EKSPERIMENT 2
„
„
„
„
Zadatak leksičke odluke
18 studenata prve godine psihologije
60 imenica i 60 pseudoimenica
Dva faktora:
„
„
„
broj značenja, dva nivoa (N=9.1, N=16)
redundansa, dva nivoa (T=0.10, T=0.21).
Grupe stimulusa ujednačene po:
„
frekvenciji leme
familijarnosti
konkretnosti
broju značenja procenjenim na osnovu Rečnika Matice srpske
„
broju slova.
„
„
„
EKSPERIMENT 2
720
710
RT (ms
700
690
manja redundansa
veća redundasa
680
670
660
650
640
manji broj značenja veći broj značenja
• Analiza linearnih mešovitih efekata
• Slučajni efekti
Ispitanici
• Fiksni efekti
dužina reči: F(1,987)=13.814, p<0.01
(log) frekvencija leme: F(1,987)=6.34, p<0.05
familijarnost: F(1,987)=12.958, p<0.001
broj značenja (kategorije): F(1,987)=4.292, p<0.05
redundansa (kategorije): F(1,987)=7.252, p<0.01
NALAZI
ƒ
Entropija predstavlja kognitivno relevantan opis višeznačnosti reči.
ƒ
ƒ
Veća entropija → brža obrada.
Pored broja značenja, na vreme obrade utiče ujednačenost
verovatnoća značenja.
ƒ
ƒ
Više značenja → brža obrada.
Veća ujednačenost značenja → brža obrada.
0.7
0.7
0.6
0.6
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
TEZA:
ƒ
Efekat entropije distribucije značenja u skladu sa modelima distribuirane
obrade pri prepoznavanju vizuelno prikazanih reči.
(Seidenberg & McClelland, 1989)
ƒ
Povratna aktivacija sa semantičkog nivoa.
(Hino & Lupker, 1996)
ƒ
Polisemija
ƒ
Veći stepen povratne aktivacije usled smanjene kompeticije između
jedinica koje se preklapaju.
(Rueckl, 1995)
ƒ
ƒ
Ukoliko stepen aktivacije prati učestalost značenja, predviđamo veći
stepen povratne aktivacije za reči sa ujednačenim frekvencijama značenja.
Homonimija i ostali oblici višeznačnosti (nepovezana značenja)
ƒ
Sporija obrada usled kompeticije na semantičkom nivou
ƒ
Predikcija – entropija usporava obradu
(Rogers, Marslen-Wilson & Davis, 2008, AMLaP)
PROBLEMI U OPISU
VIŠEZNAČNOSTI REČI
• Problemi u formiranju distribucije verovatnoća značenja
na osnovu iskaza ispitanika:
• Kategorizacija odgovora?
• Korekcija broja značenja?
• Rečnik, ili ispitanici?
• Nedostatak jedinstvenog opisa za različite vrste višeznačnosti
• Homonimija vs. polisemija
- ista mera facilitira/inhibira u zavisnosti od vrste višeznačnosti
POTREBAN ALTERNATIVNI NAČIN
OPISIVANJA VIŠEZNAČNOSTI REČI
• Opisati višeznačnost bez oslanjanja na subjektivne procene
(Schütze, 1998)
• Naći jedinstvenu meru za različite vrste višeznačnosti
Moscoso del Prado Martìn, Kostić & Filipović Đurđević (submitted)
VEKTORSKI ZASNOVANA
SEMANTIČKA ANALIZA
• Tehnika kvantitativne lingvistike
• Kvantitativni opis značenja reči
• Značenje reči = kontekst u kojem se reč pojavljuje
• Predstavljanje reči preko n-dimenzionog vektora
tri
Kontekst
reč
različit
muzika
osnov
osoba
0
0
0
0
0
Frekvencija pojavljivanja reči u datom kontekstu
FORMIRANJE VEKTORA
tri
reč
različit
muzika
osnov
osoba
0
0
0
0
0
• Prozor širine od 7 reči
• Centralna pozicija ciljna reč
• Registrovanje unapred odabranih kontekst reči u +/- 3 susedne
pozicije
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
0
0
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
1
1
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
1
1
0
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
1
2
1
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
1
2
1
0
0
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
1
2
1
0
1
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
reč
različit
muzika
osnov
osoba
1
2
1
0
1
tri
"Ako pokušam da ispričam vic, trudeći se pri tom da
•reč
Više istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom
istovremeno
stvarima.
Iz
tog
razgovaraju
razloga
u
ovoj
o
različitim
knjizi
nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.
Beograd, Naroda knjiga.
VEKTORSKI ZASNOVANA
SEMANTIČKA ANALIZA
• Kosinusna distanca – ugao između vektora odslikava
povezanost značenja reči koje vektori predstavljaju.
vrabac
slavuj
noj
VEKTORSKI ZASNOVANA SEMANTIČKA
ANALIZA VIŠEZNAČNIH REČI
• Formiranje vektora drugog reda
(Schütze, 1998)
• Korak 1: Odvojeni vektori za pojedinačna pojavljivanja reči.
reč
različit
muzika
osnov
osoba
tri – 1
1
1
0
0
0
tri – 2
0
1
1
0
0
tri – 3
0
0
0
0
1
tri – 1
reč
različit
muzika
osnov
osoba
1
1
0
0
0
Korak 2: Vektori prvog reda za kontekst reči.
reč
reč
različit
muzika
osnov
osoba
3
1
0
0
2
0
1
5
0
različit
4
muzika
1
2
osnov
0
0
5
osoba
0
1
0
3
3
tri – 1
reč
različit
muzika
osnov
osoba
1
1
0
0
0
reč
različit
muzika
osnov
osoba
3
1
0
0
2
0
1
5
0
reč
različit
4
muzika
1
2
osnov
0
0
5
osoba
0
1
0
3
3
tri – 1
reč
različit
muzika
osnov
osoba
1
1
0
0
0
reč
različit
muzika
osnov
osoba
3
1
0
0
2
0
1
5
0
reč
različit
4
muzika
1
2
osnov
0
0
5
osoba
0
1
0
3
reč
različit
muzika
osnov
osoba
4
3
3
0
1
tri – 1
3
VEKTORI DRUGOG REDA
• Korak 3: Suma odgovarajućih vrednosti vektora prvog reda
kontekst reči koje su pronađene u susedstvu
datog pojavljivanja ciljne reči.
reč
različit
muzika
osnov
osoba
tri – 1
4
3
3
0
1
tri – 2
5
2
2
5
1
tri – 3
0
1
0
3
0
VEKTORI DRUGOG REDA
• Kosinusna distanca – ugao između vektora odslikava
povezanost pojedinih značenja višeznačnih reči
koje vektori predstavljaju.
kljun ptice
kljun – nos/usta
kljun aviona
BIT MODEL
Moscoso del Prado Martìn, Kostić & Filipović Đurđević (submitted)
• Polazna tačka – vektori drugog reda
• Multidimenzionalna distribucija
značenja reči u semantičkom
prostoru.
• Mešavina multidimenzionalnih
Gausovih distribucija
- određivanje parametara bez unapred zadatkog broja komponenti!
• RT u funkciji neizvesnosti,
tj. diferencijalne entropije multidimenzionalne distribucije.
KOOPERACIJA VS. KOMPETICIJA
• Diferencijalna entropija pod uticajem:
• Generalne širine distribucije
LAKOĆA AKTIVACIJE
• Broj komponenti (broj Gausovih distribucija)
• Relativne verovatnoće komponenti
• Stepen razdvojenosti komponenti
KOMPETICIJA
EGE VS. NEGENTROPIJA
• Analiza vremena reakcije na skupu homonima i polisemičnih reči
(Moscoso del Prado Martìn et al., submitted)
• EGE
(Entropy of Equivalent Gaussian)
• Generalna varijabilnost konteksta
• Odslikava kooperaciju povezanih
značenja – polisemija.
• Negentropija
• EGE – diferencijalna entropija
• Odslikava kompeticiju između
nepovezanih značenja – homonimija.
NAŠ CILJ
• Efekat EGE i
• odsustvo efekta negentropije
• na skupu isključivo polisemičnih imenica srpskog jezika
• koristeći metod kojeg su predložili Moscoso del Prado Martìn
et al. (submitted).
FORMIRANJE KONTINUALNE
DISTRIBUCIJE VEROVATNOĆA
• Metod predložen od Moscoso del Prado Martìn et al. (submitted)
• Vektori drugog reda za 150 polisemičnih imenica srpskog jezika
(Schütze, 1998)
• 1000 najfrekventnijih reči kao kontekst reči
• Ebart – elektronska baza od 70 miliona reči
• 130 reči sa više od 500 pojavljivanja
• Procenjeni EGE i Negentropija.
EKSPERIMENT
„Zadatak
„54
„
„
vizuelne leksičke odluke
studenta prve godine psihologije
150 imenica i 150 pseudoimenica
Korelacioni nacrt
‰Nezavisne varijable:
„Dužina reči
„(log) frekvencija leme
„Familijarnost reči
„Konkretnost reči
„EGE / Negentropija
‰Zavisna varijabla:
„Vreme reakcije
REZULTATI
• Analiza linearnih mešovitih efekata (RT VLD Eksperiment)
• Slučajni efekti:
Ispitanici
Stimulusi (reči)
• Fiksni efekti:
Dužina reči: β=0.014, t(1,6573)=3.07, p<0.01
(log) Frekvencija leme: β=-0.022, t(1,6573)=-7.89, p<0.001
Familijarnost reči: β=-0.043, t(1,6573)=-5.13, p<0.001
Entropija (diskretno p): β=-0.014, t(1,6573)=-2.62, p<0.01
Entropija (diskretno p), nelinearno: β=0.027, t(1,6573)=3.78, p<0.001
Entropija (diskretno p) * Familijarnost reči: β=0.051, t(1,6573)=2.70, p<0.01
EGE: β=-0.084, t(1,6573)=-2.46, p=0.01
EFEKAT EGE
REZIME
ƒ
ƒ
ƒ
Polisemija može da se opiše kao varijabilnost konteksta u kojima
se reč javlja.
EGE (Entropy of Equivalent Gaussian) ubrzava obradu
polisemičnih reči.
Negentropija multidimenzionalne distribucije kontekstualnih
vektora nema uticaja na obradu.
ZAKLJUČCI
ƒ
Polisemične reči se brže obrađuju zahvaljujući:
ƒ
širokoj aktivaciji u semantičkom prostoru i
ƒ
smanjenoj kompeticiji između komponenti distribucije koje se
preklapaju u velikoj meri.
ƒ
Potvrđene predikcije izvedene iz modela koji
ƒ
ne zahteva subjektivne procene ispitanika
ƒ
pruža jedinstven okvir za različite vrste višeznačnosti
KOGNITIVNI SISTEM VOLI REČI KOJE
MOGU DA SE KORISTE U RAZLIČITIM
POVEZANIM ZNAČENJIMA
HVALA
Ovo istraživanje sufinansirano je od strane
Ministarstva nauke i zaštite životne sredine Republike Srbije
(projekat broj: 149039D).
Download

Polisemičnost kao neizvesnost značenja reči