TY - BOOK AU - Morales Roa,Hubeimar Alfredo AU - Jiménez Vargas,Sergio Gonzalo AU - Dueñas Luna,George Enrique TI - Bridging the Semantic Gap between Citizens' and Government Regulators' Language in Bogotá. D.C. : : An Automatic Approach Using Frequency Analysis and Word Embeddigns PY - 2023/// CY - Bogota PB - Instituto Caro y Cuervo. Facultad Seminario Andrés Bello N1 - Tesis (Monografía para optar al título de Magíster en Lingüística) - Instituto Caro y Cuervo, Facultad Seminario Andrés Bello, Bogotá, 2023; Incluye referencia bibliográficas; Acceso restringido, consulta únicamente en la Biblioteca Sede Yerbabuena N2 - En las metrópolis urbanas de hoy, se espera que los ciudadanos se adhieran a un sistema de reglas implementado por sus órganos de gobierno y agencias reguladoras. Sin embargo, estas leyes y regulaciones a menudo se expresan en jerga legal, lo que puede presentar dificultades para que los ciudadanos las comprendan, creando así barreras de comunicación e inconvenientes. Investigaciones previas han abordado este problema empleando la simplificación automática de texto para mejorar la legibilidad y simplificar el vocabulario. No obstante, esta estrategia pasa por alto las discrepancias semánticas en las connotaciones de las palabras entre los ciudadanos y los reguladores, lo que puede llevar a malentendidos. El presente estudio introduce una metodología novedosa para la identificación de palabras con dominios semánticos distintos entre los ciudadanos y los reguladores, utilizando amplios corpus y la técnica de incrustación de palabras conocida como 'word2vec'. Este método se empleó en dos corpus separados, cada uno con 100 millones de palabras, que representan el lenguaje regulatorio y las solicitudes y quejas escritas de los ciudadanos en Bogotá, Colombia. Nuestros hallazgos indicaron que aproximadamente el 2% del vocabulario altamente recurrente demostró diferencias léxico-semánticas que podrían llevar a malentendidos. El método identificó de manera efectiva estas palabras ambiguas y sus posibles reemplazos, requiriendo un nivel razonable de intervención humana y sin mostrar dependencia del idioma ER -