Archive for the 'pln' Category

CLaRK, un sistema para o desenvolvemento de corpora

Domingo, Novembro 28th, 2004

Na lista de distribución sobre corpus corpora list anunciouse hai pouco a nova versión de CLaRK, un sistema para o desenvolvemento de corpora.

Na páxina do proxecto din que un dos obxectivos principais é minimizar a intervención humana na elaboración de corpus. Está implementado en Java, emprega XML e Unicode.

Un segmentador simple con ferramentas estándar da consola

Luns, Novembro 15th, 2004

NSP, ngram statistics package

Luns, Novembro 15th, 2004