Aurrerapausoa euskararentzat!

Posted on March 11th, 2008 in Euskera, Tecnologías Lingüísticas by Arrate Unzueta Print This Post

Euskal Herriko Unibertsitateko ikasle talde batek, euskarazko ahozko hizketa prozesatzen duen sistema garatu du. Gaur egun, sarean dauden idatzizko dokumentuetan bilaketak egitea erraza da, baina bilaketa horietan ikus-entzutezko dokumentuak alde batera gelditzen dira. Ikerketa talde honi esker irrati eta telebistatik informazioa automatikoki eskuratzea posible izango da, izan ere, ahozkoa testua bihurtzen duen sistema garatzen ari dira.

BasqueLem, el nuevo lematizador de euskera

Posted on February 6th, 2008 in Emergiatech, Euskera, Tecnologías Lingüísticas by Edurne Andrés Print This Post

Tras un año de trabajo y esfuerzo ya está aquí BasqueLem, el nuevo lematizador de euskera desarrollado por EmergiaTech (Emerging Advanced Technologies, S.L.) con la ayuda tecnológica de Thera y financiera (30%) del programa IKT (Informazio eta Komunikazio Teknologiak) del Departamento de Cultura del Gobierno Vasco.

Basquelem permitirá identificar la forma canónica de cualquier palabra en euskera y hallar su categoría gramatical así como la flexión o derivación que la genera. Entre las características más destacables de BasqueLem se encuentra su rapidez, que se consigue reduciendo al mínimo la aplicación de reglas. BasqueLem dispone de 53.647 lemas a los que hay que sumar otros tantos elementos gramaticales desplegados (paradigmas verbales, por ejemplo), gracias a los cuales realiza su trabajo de una forma extremadamente eficaz. Se trata además de una herramienta fácil de integrar en otras aplicaciones. Toda una ventaja.

Las pruebas que se han realizado con BasqueLem demuestran que es una herramienta capaz de lematizar textos a gran velocidad aportando, a la vez, numerosa información gramatical: lemas, rasgos desinenciales, categoría morfosintáctica, etc. Y pronto estará disponible para todo aquel que lo desee. Habrá, pues, que descubrirla, ¿no?

Badator BasqueLem!

Posted on February 6th, 2008 in Emergiatech, Euskera, Tecnologías Lingüísticas by Arrate Unzueta Print This Post

Euskararako lematizatzailea jaio da, edonorentzat eskuragarria izango den lematizatzailea.

EmergiaTechek Theraren laguntza teknologiko eta Kultura Saileko IKT (Informazio eta Komunikazio Teknologiak) programaren diru-laguntzarekin BasqueLem sortu du. Lematizatzaile honen ezaugarri nagusien artean azkartasuna dugu aipatzekoa: Alde batetik, 53.647 lema eta beste hainbat datu (aditzen paradigmak, esaterako) datu basean izateak, eta, beste alde batetik, arauen bidez ahalik eta gutxien funtzionatzeak abiadura handian lematizatzea ekarri dute.

Horretaz gain, BasqueLem duen diseinuari esker beste tresna batzuetara aplikatu daiteke elkarren osagarri izateko.

Egin diren proben emaitzak oso onak izan dira. Lematizatzaileak testuak zuzen lematizatzeaz gain, ematen diren datuak asko dira, besteak beste, lema, erroa, deklinazio atzizkiak, etab.

Proba dezagun!

LUCY taldea

Posted on February 6th, 2008 in Euskera, Machine Translation, Tecnologías Lingüísticas by Arrate Unzueta Print This Post

Eusko Jaurlaritzako Kultura Sailak gaztelera-euskara itzultzaile automatikorako lehiaketa antolatu du. Lucy Software and Servicesek lehiaketa horretarako proposamena aurkeztu du eta EmergiaTech proposamen horretako partaide da.

Proposamenak lau lan-talde biltzen ditu:

Proposamena egin duten hamabost adituetatik bost EmergiaTecheko langileak dira:

Joseba Abaitua (hizkuntzalaria eta teknologoa), Edurne Andrés (hizkuntzalaria), Koldo Garai (hizkuntzalaria eta lexikografoa), Ainhoa Sainz-Gorbea (hizkuntzalaria eta itzultzailea) eta Arrate Unzueta (hizkuntzalaria era itzultzailea).

Baldin eta, Lucy/Translendiumen proposamena aukeratzen badute, itzultzailearen garapenean EmergiaTechek bi ardura nagusi izango ditu:

  • Transferentzia sintaktikorako arauen kodifikazioa
  • UZEIrekin batera, baliabide lexikografiko elebidun eta elebakarren bilketa

El equipo Lucy

Posted on February 6th, 2008 in Euskera, Machine Translation, Tecnologías Lingüísticas by Joseba Abaitua Print This Post

EmergiaTech forma parte de la propuesta de traductor automático de español a euskera presentada por Lucy Software and Services al concurso convocado por el Departamento de Cultura de Gobierno Vasco.

La oferta incluye la participación de cuatro grupos de trabajo:

Del total de quince expertos del equipo de la propuesta, cinco forman parte de la plantilla de EmergiaTech :

Joseba Abaitua (lingüista y tecnólogo), Edurne Andrés (lingüista), Koldo Garai (lingüista y lexicógrafo), Ainhoa Sainz-Gorbea (lingüista y traductora) y Arrate Unzueta (lingüista y traductora).

El cometido particular de EmergiaTech en el desarrollo del traductor, de resultar elegida la propuesta de Lucy/Translendium, será ocuparse de la codificación de las reglas de transferencia sintáctica. Asimismo colaborará con UZEI en la compilación de los recursos lexicográficos, tanto monolingües como bilingües.

Una década de XML

Posted on January 13th, 2008 in Internet, Semantic web, XML by Joseba Abaitua Print This Post

El 12 de diciembre de 2007 propuese este debate para la asignatura Tecnologías de la Sociedad de la Información, que se imparte en el primer curso de Filología de Deusto, con el siguiente enunciado:

En 2008 se cumplirá una década de la primera “recomendación de XML 1.0” por parte de W3C.

Es un buen momento para reflexionar sobre cuáles han sido las principales consecuencias de esta innovación en el diseño de documentación para la Web. Los grupos deberán hacer sus aportaciones a este debate con fecha límite del 16 de enero de 2008.

El 10 de febrero de 1998 la W3C convirtió la especificación de XML v1.0 en recomendación oficial. Los encargados de elaborar el documento fueron tres renombrados especialistas: Tim Bray (de Netscape), Jean Paoli (de Microsoft) y C. M. Sperberg-McQueen (de University of Illinois at Chicago).

La última revisión es del 26 de agosto de 2006 y está disponible en http://www.w3.org/TR/REC-xml/ .

No se trata de hacer historia del origen y objetivos de XML, sino de conocer su relevancia y consecuencias, como puede ser la emergencia de la propia Web2.0., o la expansión de sistemas como TEI, tan relevantes para la edición electrónica de textos humanísticos.

Bibliografía

 

Ya han empezado a aparecer algunos artículos, como el de Ariane Sande, que he “compartido” hoy desde GoogleReader, o los anteriores de Eider Santiesteban, Iraia Fernández y Luken Lamikiz. Atentos, porque este año el nivel de contribuciones de los alumnos de primero ha subido mucho.

 

Por otro lado he apuntado en mi cuenta de del.icio.us interesantes hallazgos relacionados con XML:

 

Este Jean Paoli parece un buen tipo ¿eh? Un gurú que, a tenor de lo que se desprende de la base de datos bibliográfica DBLP, ha dejado de publicar para dedicarse en exclusiva a desarrollar herramientas XML, suponemos.

 

SAREKO ARGIAren 10. urteurrena

Posted on November 28th, 2007 in Euskera, Internet, Telecomunicaciones, Uncategorized by Arrate Unzueta Print This Post

2007ko abenduan 10 urte beteko ditu www.argia.com web guneak. 1997an aldizkariko atal batzuk sareratu zituzten eta 1999aren erdialdean Euskal Kulturaren Hari@ izeneko buletina sortu zuten. Hainbat aldaketa gertatu dira urte horietan zehar, baina helburuak argi izan dituzte hasiera-hasieratik. Kultura, euskara, irakaskuntza, teknologia berri eta komunikabideei buruko artikuluak egunero biltzen ditu eta harpidunek e-posta bidez jasotzen dituzte.

Horretaz gain, urte berean, aurrera pausua eman zuten eta ARGIA aldizkariko eduki guztiak sarean jarri zituzten eskuragai, horretaz gain, 1963-1998 bitarteko elkarrizketak ere eskuragarri daude sarean. Gaur egun ere, aldaketak etengabeak dira, izan ere, 2006an audio grabazioak eta bideo muntaiak egiten hasi ziren, esate baterako, Txomin Txueka argazkilaria eta Amets Arzallus kazetaria Boliviara joan ziren eta handik bildutako eta landutako materiala (argazkiak, bideoak, artikuluak) sarean jarri zituzten ikus eta entzungai.

Ildo horretatik, www.argia.com/bideoak atala sortu zuten, eta azaroaren 30etik aurrera, bideo-zerrenda luze, antolatu eta erabilgarria izango dugu ikusgai. ARGIAren Multimedia kanala sortzeko asmoz, denbora luzean sortutako audio grabazioak, argazki galeriak eta ikus-entzunezkoak aurkeztuko dituzte kanal horretan.

Egindako lan guzti horrek euskararen normalizazioan aurrerapausu garrantzitsua da, horregatik, mila esker eta ZORIONAK!

Wikipedia

Posted on November 28th, 2007 in Internet, Telecomunicaciones by Arrate Unzueta Print This Post

Sorry, but this post is not available in English

Wikinomics: How Mass Collaboration Changes Everything (2006)

Posted on November 26th, 2007 in Internet by Ane Bilbao Print This Post

Wikinomics: How Mass Collaboration Changes Everything (en castellano La Nueva Economía de las Multitudes Inteligentes) es un libro sobre la participación activa en la economía gracias a la colaboración entre personas. Sus autores son Don Tapscott (New Paradigm) y Anthony D. Williams (Business 2.0) y fue publicado en diciembre del 2006.

El libro está dividido en once capítulos que describen siete tipos de colaboración conjunta: Peer Pioneers, Ideagoras, Prosumers, New Alexandrians, Platforms for Participation, Global Plant Floor y The Wiki Workplace. Además, entre otras compañías y pioneros en prosperar empresas del siglo XXI se encuentran:

  • Rob McEwen, presidente ejecutivo de Goldcorp, Inc. usó tácticas de código abierto y competición online para enfrentarse a las reglas de una industria ya obsoleta.
  • Flickr, Second Life, YouTube y otras prósperas comunidades online que llegan a una red social innovan en una nueva forma de producción colaborativa que revoluciona firmas y mercados.
  • Procter & Gamble como ejemplo de compañías multibillonarias que crean relaciones basadas en la confianza con colaboradores externos, son más eficaces que las empresas organizadas jerárquicamente.

Participación en el I Simposio sobre XML Legislativo en España

Posted on November 14th, 2007 in Semantic web by Ane Bilbao Print This Post

logo

Durante los días 15 y 16 de noviembre se celebrará el I Simposio sobre XML Legislativo en España organizado por la Facultad de Derecho de la Universidad de Valladolid.

Gracias al soporte XML (ya adoptado en Europa), se está trabajando para ofrecer y mejorar el acceso a la legislación en formato electrónico tanto a profesionales y usuarios como a los propios ciudadanos.

El Simposio organizará a través de una reunión científica periódica a los diferentes investigadores españoles, empresas y administraciones que se valen del ámbito del XML jurídico. Así, estas jornadas tienen como objetivo el debate, la divulgación y discusión entre la comunidad española, entidades públicas, empresas e investigadores sobre la evolución de este campo en nuestro país.

Nuestro granito de arena

Dentro del programa y en la sección (o Panel II): Las experiencias de investigación en España sobre la aplicación de la tecnología XML a los textos jurídicos, uno de los asistentes será Joseba Abaitua de la Universidad de Deusto, donde compartirá sus conocimientos en Metadatos y ontologías para el tratamiento de textos jurídicos: la experiencia del grupo DELi.

Fuente: Universidad de Valladolid.