|
COES: Publicaciones
S. Rodríguez, J. Carretero.
Building a Spanish Speller
In
Taller sobre el Software de Libre
Distribución.
Universidad Carlos III de Madrid, Spain.
September 1995.
Abstract
The lack of spelling tools for the Spanish language in the Unix
Operating System, led us to build a speller based on the
Unix tool
ispell
. The main task of this work
was to develop an extensive set of Spanish
grammatical
rules, which was very complex due to the big number of
rules. The speller built has been integrated with
ispell
software and it is being
distributed for free since the end of 1994.
S. Rodríguez, J. Carretero.
A Formal Approach to Spanish Morphology: the COES Tools
Sociedad Española para el procesamiento
del Lenguaje Natural
pp: 118-126. September 1996. El número completo
lo puede encontrar
aquí o en local.
Abstract
The increasing use of computers in language processing has shown the
lack
of
some specialized tools (spelling checkers, grammatical checkers, etc.)
for
the Spanish Language. Spanish is the third most extended language of
the world.
However, the availability of linguistic
tools is far from that of other less
extended
languages, perhaps due to the smaller technological influence of
the
Spanish-speaking countries.
The potential importance of the Spanish
Language in a near future led
the authors to develop some lexical tools for
computer environments.
Moreover, to enhance the utilization of these tools, we
thought to
distribute them freely with the
ispell
tool.
J. Carretero, S. Rodríguez
Building Lexical Tools to Manage Information Written in Spanish
Journal of Information Science
22(5)
pp: 391-399. October 1996.
Abstract
Most of the largest operating systems and information retrieval tools do
not
provide lexical tools for Spanish, which makes it very difficult to
check the
information fed to the systems. This problem is specially critical
in big
organizations (libraries, museums, etc.) where information is
acquired
mechanically by scanning or typing, which adds to the already
existing errors,
new errors caused by the mechanization process.
The need to filter large amount
of information written in Spanish led us
to build lexical tools for the Spanish
language. This paper presents COES,
a complete environment that allows the user
to deal with Spanish grammatical
problems. Special emphasis has been made on
formal specification of Spanish
grammar, word tagging and dictionary
generation. Finally some evaluation
results of the spelling services are shown.
COES is being freely distributed
since the end of 1994.
Keywords:
Linguistic; Spelling; Spanish; Formal specification;
Data Acquisition
J. Carretero, S. Rodríguez
COES: Herramienta Lingüística de Libre Distribución para la Lengua Española
Novática
Vol 126 pp: 39-45. Noviembre 1997.
Resumen
La carencia de herramientas software de libre distribución que
permitan la
corrección de textos escritos en castellano llevó a los
autores a la
construcción de un diccionario de castellano basado en el
programa de libre
distribución ispell.
Este artículo presenta la integración del diccionario
al
entorno de la herramienta ispell, haciendo especial hincapié
en los aspectos de
la especificación formal de las reglas de
derivación, etiquetado de las
palabras que componen el diccionario
raíz y la generación final del
diccionario. Por último se muestran
algunos medidas de evaluación realizadas
por los autores. El diccionario
se distribuye como una herramienta de libre
distribución desde 1994 bajo
los términos de la General Public License de Free
Software Foundation
S. Rodríguez, J. Carretero.
Formalización de Reglas morfológicas para un nuevo
corrector ortográfico en Español.
Revista Española de lingüística
26(2) pp: 379-387. Noviembre 1996.
Resumen
La extensión de los computadores como herramienta de tratamiento de
textos ha
dejado patente la insuficiencia de las herramientas
informáticas
para la
corrección ortográfica en español. La mayoría de las
existentes no parten de
las reglas gramaticales definidas
por la Real Academia Española de la Lengua
(RAEL), sino de un
subconjunto de palabras que se acepta como correcto.
En este
artículo se presenta un corrector ortográfico para textos
en
español que se
ajusta a las reglas de la RAEL, así como los pasos
seguidos en el desarrollo de
dicho corrector.
Las principales tareas en la construcción de un
corrector
ortográfico son: desarrollar de forma exhaustiva el conjunto
de
reglas gramaticales de lenguaje, formalizar dichas reglas para su uso
en una
herramienta informática y
aplicar dichas reglas a las palabras raíces que
permiten extraer el
conjunto completo de palabras del lenguaje.
El trabajo que
se expone en este
artículo comenzó su desarrollo en Febrero de 1994 y está
disponible
como
paquete de libre distribución para utilizarse con el
programa
ispell desde Diciembre de ese mismo año.
S. Rodríguez, J. Carretero.
Corrector ortográfico de libre distribución basado
en reglas de
derivación.
Primer encuentro del grupo de usuarios de TeX hispanohablantes.
EGUTH'99
pp: 44-52. Septiembre 1999. La publicación en
el formato de la revista la puede encontrar en
CervanTeX
Resumen
La carencia de herramientas software de libre distribución que
permitan la
corrección de textos escritos en castellano llevó a los
autores a la
construcción de un diccionario de castellano basado en el
programa de libre
distribución
ispell
.
Este artículo presenta la integración del diccionario
al entorno de la
herramienta ispell haciendo especial hincapié
en los aspectos de la especificación formal de las reglas de
derivación, etiquetado de las palabras que componen el diccionario
raíz y la generación final del diccionario. El diccionario
se
distribuye como una herramienta de libre distribución desde 1994 bajo
los
términos de la
General Public License
de
Free Software
Foundation
.
M. López, S. Rodríguez, J. Carretero.
Herramientas ortográficas de libre
distribución para la lengua
castellana.
II Congreso Hispalinux.
Noviembre 1999.
Resumen
La carencia de herramientas software de libre distribución que
permitan la
corrección de textos escritos en castellano llevó a los
autores a la
construcción de un diccionario de castellano basado en el
programa de libre
distribución
ispell
. Por otra parte,
aprovechando la experiencia obtenida, se ha ampliado el
conjunto de
herramientas lingüísticas con un diccionario de
sinónimos/antónimos.
Su particularidad es ser sensible a las reglas
morfológicas de las
palabras y no sólo a las raíces, como hacen la casi
completa totalidad
de los diccionarios de sinónimos actuales.
En este artículo
se presentan ambas herramientas en un entorno de
software de libre distribución
como Linux. Se distribuyen desde 1994, bajo
los términos de la
General Public License
de
Free Software
Foundation
.
Palabras Clave:
Lenguaje Natural, Especificación Formal, Software
de Libre distribución,
LaTeX, Linux.
|