Expanding small corpora to aid people with communication impairment

Vörös Gyula: Expanding small corpora to aid people with communication impairment. In: Acta cybernetica, (22) 1. pp. 229-242. (2015)

[thumbnail of actacyb_22_1_2015_14.pdf]
Előnézet
Cikk, tanulmány, mű
actacyb_22_1_2015_14.pdf

Letöltés (818kB) | Előnézet

Absztrakt (kivonat)

Difficulties in the communication of people with various movement and cognitive disorders may be alleviated by means of pictorial symbols. Automatic transformation of symbol sequences to natural language is of high importance. Performing this task by defining all valid sentences manually would require a large amount of work. We show that a small initial seed corpus is sufficient, which can be expanded automatically by generating candidate sentences and filtering them using A-gram statistics from a much larger corpus. The method is evaluated on a seed corpus containing dialogues, collected from an English language learning website. The ratio of useful sentences in the expanded corpus is 3-4 times bigger than in the set of unfiltered candidate sentences. We also use a manually constructed corpus for further evaluation. To demonstrate the practical applicability of the method, we have implemented a sentence production prototype that performs the transcription of symbol sequences to natural language. The system produces new and meaningful sentences and thus it can considerably decrease the size of the corpus needed, while it can increase the variability of sentences.

Mű típusa: Cikk, tanulmány, mű
Befoglaló folyóirat/kiadvány címe: Acta cybernetica
Dátum: 2015
Kötet: 22
Szám: 1
ISSN: 0324-721X
Oldalak: pp. 229-242
Nyelv: angol
Kiadás helye: Szeged
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/38539/
DOI: 10.14232/actacyb.22.1.2015.14
Kulcsszavak: Számítógép-hálózat - kommunikáció
Megjegyzések: Bibliogr.: p. 241-242. ; összefoglalás angol nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
Feltöltés dátuma: 2016. okt. 17. 10:37
Utolsó módosítás: 2022. jún. 20. 11:35
URI: http://acta.bibl.u-szeged.hu/id/eprint/36261
Bővebben:
Tétel nézet Tétel nézet