DOAJ Open Access 2012

Automaatne ajaväljendite tuvastamine eestikeelsetes tekstides

Siim Orasmaa

Abstrak

<p>Artikkel käsitleb eestikeelsete tekstide arvutianalüüsi alamprobleemi: ajaväljendite automaatset tuvastamist tekstist. Ülesanne on püstitatud kaheosalisena: tekstist tuleb üles leida ajaväljendid (piiritleda ajaväljendifraasid) ning normaliseerida leitud ajaväljendite semantika (st esitada semantika eeldefineeritud märgenduskeele raamides). Artiklis kirjeldatakse ajaväljendite tuvastamisel kasutatavat märgenduskeelt ning piiritletakse vaadeldavate ajaväljendite hulk lähtuvalt märgenduskeele (aga ka praktilise analüüsi) võimalustest. Antakse ülevaade loodud reeglipõhise ajaväljendite tuvastaja tööpõhimõtetest ajaväljendite leidmisel ning semantika normaliseerimisel kasutatavatest strateegiatest. Programmi testimiseks moodustatakse Tartu Ülikooli koondkorpuse tekstidest u 70 000-sõnaline korpus, millel parandatakse käsitsi automaatse tuvastamise vead ning hinnatakse tuvastaja töö kvaliteeti.</p><p>DOI: http://dx.doi.org/10.5128/ERYa8.10</p>

Penulis (1)

S

Siim Orasmaa

Format Sitasi

Orasmaa, S. (2012). Automaatne ajaväljendite tuvastamine eestikeelsetes tekstides. https://doi.org/10.5128/ERYa8.10

Akses Cepat

PDF tidak tersedia langsung

Cek di sumber asli →
Lihat di Sumber doi.org/10.5128/ERYa8.10
Informasi Jurnal
Tahun Terbit
2012
Sumber Database
DOAJ
DOI
10.5128/ERYa8.10
Akses
Open Access ✓