Statistical language models within the algebra of weighted rational languages

Hanneforth Thomas; Würzner Kay-Michael: Statistical language models within the algebra of weighted rational languages. In: Acta cybernetica, (19) 2. pp. 313-356. (2009)

[thumbnail of Hanneforth_2009_ActaCybernetica.pdf]
Előnézet
Cikk, tanulmány, mű
Hanneforth_2009_ActaCybernetica.pdf

Letöltés (702kB) | Előnézet

Absztrakt (kivonat)

Statistical language models are an important tool in natural language processing. They represent prior knowledge about a certain language which is usually gained from a set of samples called a corpus. In this paper, we present a novel way of creating N-gram language models using weighted finite automata. The construction of these models is formalised within the algebra underlying weighted finite automata and expressed in terms of weighted rational languages and transductions. Besides the algebra we make use of five special constant weighted transductions which rely only on the alphabet and the model parameter N. In addition, we discuss efficient implementations of these transductions in terms of virtual constructions.

Mű típusa: Cikk, tanulmány, mű
Befoglaló folyóirat/kiadvány címe: Acta cybernetica
Dátum: 2009
Kötet: 19
Szám: 2
ISSN: 0324-721X
Oldalak: pp. 313-356
Nyelv: angol
Kiadás helye: Szeged
Konferencia neve: Weighted Automata : Theory and Applications (2008) (Dresden)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/38528/
Kulcsszavak: Számítástechnika, Kibernetika
Megjegyzések: Bibliogr.: p. 346-349. ; összefoglalás angol nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
Feltöltés dátuma: 2016. okt. 15. 12:25
Utolsó módosítás: 2022. jún. 17. 09:03
URI: http://acta.bibl.u-szeged.hu/id/eprint/12868
Bővebben:
Tétel nézet Tétel nézet