TY - BOOK AU - Torruella Casañas,Joan TI - Lingüística de corpus: génesis y bases metodológicas de los corpus (históricos) para la investigación en lingüística T2 - Sudien zur Romanischen Sprachwissenschaft und nterkulturellen Kommunikation SN - 9783631717189 U1 - 410.188 22 PY - 2017/// CY - Frankfurt am Main PB - Peter Lang KW - Lingüística de corpus KW - ARMARC KW - Lingüística KW - Procesamiento electrónico de datos N1 - Incluye referencias bibliográficas; Primera parte: los corpus y la lingüística de corpus. -- La lingüística de corpus. -- Corpus textuales. -- Parámetros clasificatorios de los corpus. -- Modalidad. Temática. -- Época. -- Temporalidad. -- Magnitud. -- Evolución. -- Distribución. -- Número de ediciones. -- Número de lenguas. -- Tipo de edición. -- Muestras. -- Marcaje. -- Corpus de lectura. -- Segunda parte: Diseño del a estructura del corpus y post-edición de los textos. -- Fases de la construcción de un corpus. -- Estructura y ejes principales. -- Eje temporal. -- Límites. -- Periodización. -- El eje diacrónico en los en los corpus históricos informatizados iberorrománicos. -- Eje diatópico. -- Organización. -- El eje diatópico en los en los corpus históricos informatizados iberorrománicos. -- Eje tipológico. -- Clasificaciones tipológicas para textos antiguos. -- Propuesta de clasificación. -- Postulados teóricos. -- Propuestas de indicadores para una falsificación tipológica. -- nivel de formalidad y grado de oralidad. -- Nivel de formalidad. -- Grado de oralidad. - -El eje tipológico en los corpus informatizados iberorrománicos. -- Traducciones. - Composición del corpus. -- Representatividad y equilibrio. -- Representatividad cualitativa. -- Representatividad cuantitativa. -- Equilibrio externo. -- Equilibrio interno. -- Cantidad de textos que deben configurar un corpus. -- Tamaño de las muestras. -- Corpus provisional versus corpus definitivo. -- Selección de las obras. -- Selección de los documentos. -- Filiación de documentos (Metadatos). -- Título. -- Autor. -- Fecha. -- Tipo textual. -- Dialecto. -- Principios básicos en la composición de un corpus. -- Preparación de los textos. -- Preparación de los ficheros. -- Codificación de los caracteres. -- Formato de los ficheros. -- Edición textual. -- Tipo de edición. -- Edición facsímil. -- Edición diplomática o paleográfica. -- Edición diplomático-interpretativa. -- Edición normalizada. -- Edición crítica. -- Multiedición. -- Unidades léxicas. -- Edición filológica digital. -- Marcaje de obras. -- SGML. -- XML. -- Estructura de las etiquetas. -- Definición del tipo de documento (DTD). -- TEI. -- La estructura de un documento TEI. -- Cabecera (Header). -- Cuerpo (Body). -- La edición filológica digital en el sistema TEI. -- Edición lingüística. -- Lematización. -- Lexicón. -- Lematización y categorización. -- Análisis morfológico. -- Desambiguación. -- Estandarización de las categorías (EAGLES). -- Tercera parte: Bases científicas de la investigación a partir de corpus. -- Elementos de base en la investigación científica. -- Método comparativo. -- Bases estadísticas en la investigación con corpus. -- Análisis. -- Las variables. -- El muestreo. -- El valor de la estadística. -- Epílogo ER -