23.1.2007
Fyrirlestur
um orðflokksmörkun 6. febrúar
Næsti fyrirlestur
Tungutækniseturs verður haldinn í
stofu 201 í Háskólanum í
Reykjavík
við Ofanleiti þriðjudaginn 6.
febrúar og hefst kl. 12:00. Fyrirlesari er Hrafn Loftsson
lektor og nefnist fyrirlestur hans Orðflokksmörkun
íslensks texta. Tilraunir
með sameiningu og
samsetningu á mörkurum.
Rannsóknir
hafa sýnt að nákvæmni
við orðflokksmörkun íslensks texta
er lág í
samanburði við skyld tungumál. Í
þessum fyrirlestri verður sýnt hvernig
hægt er að nota sameiningu (e. integration) og
samsetningu (e.
combination) á mörkurum til að
hækka nákvæmnina. Hæsta
nákvæmni
sameinaðs markara er 91,80% en sá markari
samanstendur af málfræðilegum
reglumarkara og tölfræðilegum markara.
Með því að setja saman fimm
mismunandi markara tekst aftur á móti að
hækka nákvæmnina í 93,34%.
Þegar tveimur málfræðilegum
reglum er jafnframt bætt við hinn samsetta
markara þá mælist
nákvæmnin 93,48%. Á þennan
máta tekst að fækka villum
um 20,5% miðað við besta sameinaða
markarann.
Hrafn
Loftsson útskrifaðist
með BS gráðu í
tölvunarfræði frá
Háskóla Íslands
árið 1989. Hann lauk
meistaraprófi í
tölvunarfræði og
aðgerðagreiningu frá Pennsylvania
State University árið 1992. Hrafn er lektor
við tækni- og
verkfræðideild Háskólans
í Reykjavík og stundar jafnframt
doktorsnám í
máltækni við University of Sheffield.
Doktorsverkefni Hrafns fjallar um
orðflokksmörkun og setningagreiningu
íslensks texta. Hrafn situr í
stjórn Tungutækniseturs.
|