000 03032nam a2200277 a 4500
003 CO-BoICC
005 20220830112803.0
008 220215s2018 ck |||||s|||| 00| 0 spa d
040 _aCO-BoICC
_bspa
041 0 _aspa
090 _aLING 2018
_bR696
100 1 _aRodríguez Díaz, Carlos Alberto
245 1 0 _aDialectonos :
_bbúsqueda de fronteras dialectrales estadísticamente significativas usando corpus léxicos geolocalizados /
_cCarlos Alberto Rodríguez Díaz ; directores Sergio Gonzalo Jiménez Vargas, George Enrique Dueñas Luna
260 _aBogota :
_bInstituto Caro y Cuervo. Facultad Seminario Andrés Bello,
_c2018
300 _a1 CD-ROM ;
_c12 cm. de diámetro
502 _aTesis (Monografía para optar al título de Magíster en Lingüística) - Instituto Caro y Cuervo, Facultad Seminario Andrés Bello, Bogotá, 2018
504 _aIncluye referencia bibliográficas.
520 3 _aEsta tesis presenta un método dialectométrico inspirado en el concepto ecológico "ecotono": zona de tensión/cambio entre ecosistemas. Utiliza corpus léxicos geolocalizados para detectar y cartografiar zonas de tensión dialectal (dialectonos). Pretende solucionar la dependencia a parámetros variables de los métodos dialectométricos tradicionales, señalada en 2007 por Nerbonne y Kleiweg en el artículo Toward a dialectological yardstick, en Journal of Quantitative Linguistics. En lugar de utilizar alternancias predefinidas, como se hace tradicionalmente en dialectometría, utilizamos el Criterio de independencia de Hilbert-Schmidt (HSIC) para seleccionar características lingüísticas geográficamente relevantes directamente en el corpus. El listado de características así obtenido es comparado entre pares de localidades mediante la Prueba de Rangos con Signo de Wilcoxon (WSRT) para medir su divergencia. Los valores de correlación de ranking de WSRT son representados en un mapa relacionándolos al grosor de la línea que divide cada pareja de localidades (llamamos glosotono a esa línea). Como ni HSIC ni WSRT requieren parámetros, el método es no paramétrico. Ambas pruebas reportan la significancia estadística de los resultados. En este trabajo aplicamos el método propuesto a un corpus de Twitter compuesto por más de 20 millones de tweets geolocalizados de 237 localidades de Colombia, producidos entre los años 2009 y 2016. Como resultados se ofrecen: un mapa de glosotonos de Colombia y un listado de correlaciones de ranking correspondientes a cada pareja de localidades adyacentes. Este trabajo aporta el primer método dialectométrico basado en corpus que compara a nivel léxico dos localizaciones mediante dos pruebas estadísticas no paramétricas.
586 _aTesis laureada
590 _aEl texto del CD-ROM consta de 321 páginas.
591 _anewadq13
700 1 _aJiménez Vargas, Sergio Gonzalo
_edirector
700 1 _aDueñas Luna, George Enrique
_edirector
856 _uhttp://bibliotecadigital.caroycuervo.gov.co/id/eprint/1757
942 _cTES
999 _c113811
_d113811