DOAJ Open Access 2015

Statistilised meetodid ühendverbide tuvastamisel tekstikorpusest

Eleri Aedmaa

Abstrak

Artiklis võrdlen sõnadevahelise seose tugevuse mõõtmise statistilisi meetodeid, mida kasutatakse arvutilingvistikas püsiühendite tuvastamiseks. Töö põhieesmärk on rakendada viit sümmeetrilist statistikut – t-skoori, vastastikuse informatsiooni väärtust, hii-ruut-statistikut, log-tõepära funktsiooni ja minimaalset tundlikkust – erineva suurusega korpuste peal ja välja selgitada, milline meetod töötab eesti keele ühendverbide automaatsel tuvastamisel kõige paremini. Teine suurem eesmärk on katsetulemuste põhjal uurida, milline on korpuse suuruse mõju statistikute tööle. Lisaks palju testitud nimetatud sümmeetrilistele statistikutele rakendan psühholoogiliselt paremini põhjendatud asümmeetrilisi statistikuid ning toon välja nende eelised sümmeetriliste statistikute ees.

Penulis (1)

E

Eleri Aedmaa

Format Sitasi

Aedmaa, E. (2015). Statistilised meetodid ühendverbide tuvastamisel tekstikorpusest. https://doi.org/10.5128/ERYa11.03

Akses Cepat

PDF tidak tersedia langsung

Cek di sumber asli →
Lihat di Sumber doi.org/10.5128/ERYa11.03
Informasi Jurnal
Tahun Terbit
2015
Sumber Database
DOAJ
DOI
10.5128/ERYa11.03
Akses
Open Access ✓