Bridging the Semantic Gap between Citizens' and Government Regulators' Language in Bogotá. D.C. : An Automatic Approach Using Frequency Analysis and Word Embeddigns/ Hubeimar Alfredo Morales Roa ; directores Sergio Gonzalo Jiménez Vargas ; George Enrique Dueñas Luna

Por: Morales Roa, Hubeimar AlfredoColaborador(es): Jiménez Vargas, Sergio Gonzalo [director] | Dueñas Luna, George Enrique [director]Tipo de material: TextoTextoIdioma: Español Editor: Bogota : Instituto Caro y Cuervo. Facultad Seminario Andrés Bello, 2023Descripción: 1 CD-ROM ; 12 cm. de diámetroPremios: Tesis laureada.Nota de disertación: Tesis (Monografía para optar al título de Magíster en Lingüística) - Instituto Caro y Cuervo, Facultad Seminario Andrés Bello, Bogotá, 2023 Resumen: En las metrópolis urbanas de hoy, se espera que los ciudadanos se adhieran a un sistema de reglas implementado por sus órganos de gobierno y agencias reguladoras. Sin embargo, estas leyes y regulaciones a menudo se expresan en jerga legal, lo que puede presentar dificultades para que los ciudadanos las comprendan, creando así barreras de comunicación e inconvenientes. Investigaciones previas han abordado este problema empleando la simplificación automática de texto para mejorar la legibilidad y simplificar el vocabulario. No obstante, esta estrategia pasa por alto las discrepancias semánticas en las connotaciones de las palabras entre los ciudadanos y los reguladores, lo que puede llevar a malentendidos. El presente estudio introduce una metodología novedosa para la identificación de palabras con dominios semánticos distintos entre los ciudadanos y los reguladores, utilizando amplios corpus y la técnica de incrustación de palabras conocida como 'word2vec'. Este método se empleó en dos corpus separados, cada uno con 100 millones de palabras, que representan el lenguaje regulatorio y las solicitudes y quejas escritas de los ciudadanos en Bogotá, Colombia. Nuestros hallazgos indicaron que aproximadamente el 2% del vocabulario altamente recurrente demostró diferencias léxico-semánticas que podrían llevar a malentendidos. El método identificó de manera efectiva estas palabras ambiguas y sus posibles reemplazos, requiriendo un nivel razonable de intervención humana y sin mostrar dependencia del idioma.
    Valoración media: 0.0 (0 votos)
Tipo de ítem Ubicación actual Colección Signatura URL Copia número Estado Notas Fecha de vencimiento Código de barras
Tesis Sede Yerbabuena
Colección de trabajos de grado CD-ROM LING 2023 M828 Enlace al recurso ej. 1 Disponible (En catalogación) tmt10 500087083

Tesis (Monografía para optar al título de Magíster en Lingüística) - Instituto Caro y Cuervo, Facultad Seminario Andrés Bello, Bogotá, 2023

Incluye referencia bibliográficas.

Acceso restringido, consulta únicamente en la Biblioteca Sede Yerbabuena.

En las metrópolis urbanas de hoy, se espera que los ciudadanos se adhieran a un sistema de reglas implementado por sus órganos de gobierno y agencias reguladoras. Sin embargo, estas leyes y regulaciones a menudo se expresan en jerga legal, lo que puede presentar dificultades para que los ciudadanos las comprendan, creando así barreras de comunicación e inconvenientes. Investigaciones previas han abordado este problema empleando la simplificación automática de texto para mejorar la legibilidad y simplificar el vocabulario. No obstante, esta estrategia pasa por alto las discrepancias semánticas en las connotaciones de las palabras entre los ciudadanos y los reguladores, lo que puede llevar a malentendidos. El presente estudio introduce una metodología novedosa para la identificación de palabras con dominios semánticos distintos entre los ciudadanos y los reguladores, utilizando amplios corpus y la técnica de incrustación de palabras conocida como 'word2vec'. Este método se empleó en dos corpus separados, cada uno con 100 millones de palabras, que representan el lenguaje regulatorio y las solicitudes y quejas escritas de los ciudadanos en Bogotá, Colombia. Nuestros hallazgos indicaron que aproximadamente el 2% del vocabulario altamente recurrente demostró diferencias léxico-semánticas que podrían llevar a malentendidos. El método identificó de manera efectiva estas palabras ambiguas y sus posibles reemplazos, requiriendo un nivel razonable de intervención humana y sin mostrar dependencia del idioma.

Tesis laureada.

El texto del CD-ROM consta de 56 páginas.

Lenguaje y lenguas

Novedades





Sector Cultura


Gobierno de Colombia


Instituto Caro y Cuervo


Sede principal

Sede Casa Cuervo Urisarri:
Calle 10 # 4-69, Bogotá, Colombia


Sede Yerbabuena:
Carretera Central Norte. Kilómetro 9 más 300 metros, Chía (Cundinamarca)

Delegación Madrid, España:

C/Alcalá, 49 Madrid

Horarios de atención:

Sede Casa Cuervo Urisarri:

lunes a viernes de 8:00 a. m. a 5:00 p. m.

Sede Yerbabuena:

lunes a viernes de 8:00 a. m. a 5:00 p. m.

Teléfono:
(+57) 601 3422121


Línea gratuita nacional:
018000111124


Correo electrónico:
contactenos@caroycuervo.gov.co

Correo denuncias por actos de corrupción:
soytransparente@caroycuervo.gov.co

Logo Mincultura

Sede Yerbabuena:
Carretera Central Norte. Kilómetro 9 más 300 metros, Chía (Cundinamarca)

Código postal:
250008

Delegación Madrid, España:
C/Alcalá, 49 Madrid