O día 12 de xullo de 2003 a Real Academia Galega aprobou varias modificacións sobre as Normas Ortográficas e Morfolóxicas do Idioma Galego (que non deixa de se-lo título do libriño da normativa).
Dende a Biblioteca do Consello da cultura galega pódense baixa-las modificacións feitas ás Normas Ortográficas e Morfolóxicas do Idioma Galego.
Eu acabo de baixalas, a ver se teño tempo de estudialas durante a fin de semana.
Arquivo da categoría: lingüística
IV Escola de verán de Terminoloxía.
A próxima semana comeza a IV Escuela Internacional de Verano de Terminología. Dende o día 7 de xullo ata o día 11, tentaremos transmitirlle á xente un pouco do que se fai aquí. O luns e o martes teño que impartir un taller, o de Recursos lingüísticos en Internet: estrategias de búsqueda y criterios de evaluación.
Para os interesados na neoloxía, hai un taller titulado Recursos neológicos para la terminología.
Silencios
Hoxe temos un seminario co señor Picht, un dos grandes da Terminoloxía. Acabo de baixar á cafetería a tomar un café, e alí estaba el, rodeado dos outros bolseiros, e coa nosa directora. Así que cheguei e sentei na mesa, chamoume a atención o silencio dos meus compañeiros.
Polas mañás, baixamos a toma-lo café os da miña sala, e adoitamos discutir e falar bastante, do que sexa. Hai quen só fala de traballo, hai quen comenta o partido do día anterior, ou quen se interesa polo estado de ánimo dos demais.
Hoxe non. Hoxe viña este señor tan importante, e todos estaban calados. Eu non me atrevía a falar con ningún deles, porque ademais, todos estaban a mirar para el. A verdade, unha situación un tanto ridícula.
¿Como se sentiría o señor Picht? Debe ser incómodo ir dar unha conferencia e que todo o mundo te mire como o miraban a el hoxe, na cafetería. Ou se cadra gústalle chamar tanto a atención, non o sei porque non o coñezo.
Agora iremos ó seminario, a ver qué nos conta.
O Diccionario da Real Academia Galega
O outro día publicaba este post: ¿Que pasou cos diccionarios da Xunta?. Fíxeno porque parecía que os diccionarios xa non estaban alí. Hoxe parece que volveron. Se cadra nunca marcharon. Trátase de dous diccionarios, e un deles é o diccionario da Real Academia Galega. Como non me fío do que poidan durar aí metidos, creo que o vou tentar baixar, para poder consulta-lo na casa. Espero non estar rompendo ningunha legalidade vixente… se cadra, podería dicir que, como comprei o diccionario en papel, considero que teño dereito a unha «copia de seguridade».
Como creo que pode haber xente interesada en recuperar ese diccionario, poder telo como arquivo local e así consultalo do xeito que un considere conveniente, así que a continuación vos explico cómo o faría eu…
Antes de continuar, debedes saber qué necesitades:
- coñecer algunha linguaxe de scripting: php, perl, o mesmo bash (o que sexa, eu poño exemplos do Linux porque é o que uso, pero a mesma estratexia explicada máis abaixo podería facerse con vbscript en windows e cun programa de captura de páxinas web tipo wget).
- ter coñecementos de html.
- ter un ordenador con conexión a Internet dende o cal poder executa-lo script.
Tamén debedes saber que aquí non atoparedes un programa completo para baixa-lo diccionario, e que a información que se dá aquí é con fins totalmente educativos.
Se vos estades preguntando por qué explico cómo facer esto é polo seguinte:
- son un traductor usuario de Linux,
- non hai diccionarios monolingües en galego que se poidan consultar no sistema operativo Linux.
Ben… imos logo coa estratexia a seguir:
Se un abre a primeira páxina do diccionario da Academia en Internet, a que contén as primeiras entradas e pasa o rato por riba, poderá ver que a URL á que apunta a primera entrada é deste tipo:
http://www.edu.xunta.es/diccionarios/g/ListaDefinicion.jsp?IDXT=00002
Se descompoñemos esa URL nas súas partes, o que obtemos é que estamos solicitando unha páxina chamada «ListaDefinición.jsp» á que se lle pasa o parámetro «IDXT» co valor «00002″.
Se imos á ultima páxina do diccionario, o que contén as últimas entradas, veremos que a última entrada, a de zurreira, é a que se obtén ó pedi-la páxina «ListaDefinición.jsp» co parámetro «IDXT» de valor «20550″.
Ben… así que temos un programa (ListaDefinicion.jsp) ó que lle pasas un número e devolve unha entrada do diccionario.
O que temos que facer é:
- un bucle que vaia dende 1 ata 20550.
- dentro do bucle, executamos unha petición para a páxina, e imos aumentando o valor do parámetro IDXT.
- esa petición que executamos debería garda-la páxina, ben colocándoas todas nun mesmo arquivo, ou ben gardando cada páxina de definición nun arquivo á parte.
Algo que estaría moi ben sería deixar que o servidor no que reside o diccionario descanse un pouco, é dicir, o noso programiña debería esperar un pouco despois de capturar unha definición. Dese xeito evitamos causarlle problemas ó servidor.
¿Que pasou cos diccionarios da Xunta?
Hoxe ía fusila-lo diccionario da Academia Galega e non puiden. Os diccionarios que antes estaban en http://edu.xunta.es/diccionarios xa non están.
¿Que farei agora? Eu que quería copialo enteiro e levalo para casa. Cachis.
Internet en galego.
Onte levei para casa o artigo de A lingua galega en Internet de Xavier Gómez Guinovart. Para os que non o coñezan, Xavier Gomez Guinovart é profesor de lingüística da universidade de Vigo, onde leva o Seminario de Lingüística Informática.
Lendo o artigo, pareceume interesante a idea de non quedarse co número de páxinas que hai nunha lingua, senón tentar tamén atopa-lo número de páxinas que hai por falante.
Os números que me chamaron a atención:
en galego temos arredor das 100.000 páxinas en Internet.
tócannos a 0,025 páxinas por falante de galego.
Así que, tendo en conta estes números, e pensando que moitos da comunidade blogueira teñen un dominio ou subdominio propio, pregúntome se non serei un privilexiado… ;-)
En todo caso, e tentando ser crítico co artigo, vexo algún problema de fondo, como por exemplo, a definición de «páxina». ¿Entendemos por páxina o que aparece aquí, neste weblog? ¿entendemos por «páxina» a unidade que cataloga un buscador de Internet (para o estudio, Guinovart emprega o buscador alltheweb)? ¿os números devoltos polos buscadores agrupan ou non os resultados por dominios e subdominios?.
Supoño que o empregado é o número que devolve o buscador, sen cuestionar tampouco a calidade dos resultados, e é que facendo unha busca por páxinas en galego, veremos cómo entre os resultados se nos coan páxinas que non estan en galego (en blogaliza discutiuse o problema de cómo saber que a páxina está en galego sen mirar no código, e de cómo facer que os buscadores saiban que a nosa páxina está en galego).
Outra cousa que non se contempla no informe é o caso á parte que representan os blogs, bitácoras, xornais, diarios na rede ou como os queirades chamar (debido, seguramente, á escaseza e pouca información que sobre eles había no momento da elaboración do informe).
Tomemos, por exemplo, o blog de blogaliza. En alltheweb ese blog aparecerá como una «páxina».
Sen embargo, se mirámo-las estatísticas de uso, veremos que nesa «páxina» hai publicados 36 artigos (a día de hoxe) con 133 comentarios en total, e que ten 23 participantes.
Na miña opinión, os blogs deberían ser considerados á parte, e nós, os que nos adicamos ó estudio (cando nos deixan) da lingüística en e para o galego, deberiamos telos moi en conta no futuro como fonte de material lingüístico.
Lista de diccionarios galegos na rede.
Vía tradgal, a lista de traductores galegos chégame esto:
http://www.linmiter.net/aspect_galicien.html (gracias Ana). Trátase do compendio máis longo que teño visto ata agora de obras lexicográficas en rede. Estaría ben poder acceder a toda esa información dende unha única páxina. Se cadra debería abrir unha categoría para diccionarios en liña.
Answer bus: preguntas a un buscador en linguaxe natural.
Hoxe inauguro unha categoría máis de artigos: a dos buscadores. Fágoo porque este verán impartirei un taller na IV Escuela Internacional de Verano de Terminología. Un dos temas que trataremos no taller será o dos buscadores en Internet, e eu pedín a parte do que demos en chamar buscadores alternativos. A idea é diferencia-los «alternativos» dos tradicionais, os alternativos serían os que empreguen máis información lingüística da que xa empregan motores como Google ou alltheweb.E para comezar facendo boca, aquí tedes a answerbus, que disque admite as interrogacións en linguaxe natural.
É interesante ver que non só funciona en inglés (inda que o inglés e a linguaxe na que mellor funciona), tamén admite interrogacións en español e portugués.
Acabo de facer algunhas probas, pregunteille:
«onde estaba o nubeiro»
(polo visto non lle gustan moito os signos de interrogación nas preguntas que se lle fan). E deume unha sorpresa ben curiosa:
A outra pregunta que lle fixen foi:
«quen é o nubeiro»
E mirade o que me contesta:
Non está mal ¿non?
Algo novo: o proxecto NEO
O Proxecto NEO está en marcha. A idea é recolle-las palabras novas (que non están nos diccionarios) para telas todas xuntas. Xa dixera que poría un vencello, aí o tedes. Con sorte, axudará a facer medra-los nosos diccionarios galegos algún día.
E seguimos:
Prestige: esiximos responsabilidades.
Algo novo está a punto de aparecer
Estes días estou rematando algo no que levo traballando bastante tempo xa con outras persoas. Será bonito, será interactivo e sobre todo, novo. ;-D
Cun pouco de sorte, servirá para contribuír ó desenvolvemento da nosa lingua.
De momento máis nada. De aquí a un par de semanas igual podo pasar un enlace ou dous sobre esto tan novo :-D
Prestige: Esiximos responsabilidades.