Humanidades digitales: Glosario

Academia.edu

Una plataforma de redes sociales para que los académicos compartan, rastreen y comuniquen sus investigaciones. Fundada en 2008, Academia.edu tiene más de 1,4 millones de usuarios y contiene casi 1,4 millones de artículos. El sitio permite el acceso en tiempo real a investigaciones relevantes para los intereses de los usuarios en un formato de código abierto.

Adobe Flash

Una plataforma de animación de gráficos vectoriales patentada e independiente del navegador. Usando el plug-in de Player, el contenido Flash aparecerá de forma idéntica en varios navegadores y dispositivos.

análisis de componentes principales

Una técnica analítica diseñada para identificar patrones en los datos y expresar esos datos de manera que se destaquen las similitudes y diferencias dentro de los datos. Se basa en el principio de reducir las diferencias inherentes a un conjunto de variables interrelacionadas, manteniendo al mismo tiempo la mayor variación posible.

análisis de patrones de puntos (point pattern analysis)

Conjunto de técnicas analíticas utilizadas para estudiar la disposición espacial de los puntos del espacio dentro de un área definida. El análisis de patrones de puntos puede indicar si un conjunto de datos está agrupado, es regular o aleatorio en un espacio determinado. El análisis de patrones de puntos se utiliza a menudo en los SIG (Sistemas de Información Geográfica) para detectar patrones geográficos.

análisis de reconocimiento de patrones

En el aprendizaje de las máquinas, un tipo de algoritmo que permite a las máquinas detectar patrones en una entrada determinada. En las humanidades digitales, el análisis de reconocimiento de patrones suele adoptar la forma de algoritmos que facilitan la clasificación, agrupación, regresión y etiquetado de secuencias de la entrada de texto. La aplicación de las aplicaciones de reconocimiento de patrones al texto ha demostrado ser útil en los estudios de autores y en la estilometría.

AntConc

Un programa de concordancia gratuito disponible para los sistemas operativos Windows, Mac OS X y Linux. AntConc ha evolucionado de un simple programa de concordancia a una poderosa herramienta de análisis textual. Es capaz de realizar los siguientes tipos de análisis lingüísticos: concordancia, gráfica de concordancia, clusters, n-gramas, coloquios, frecuencia de palabras, lista de palabras clave.

Apache

Un paquete de software de dominio público, de código abierto y de servidor web. Este software permite que la computadora de un usuario y un servidor Web se comuniquen entre sí. El Servidor HTTP Apache es el servidor Web más utilizado en el mundo.

API

Interfaz de programación de aplicaciones: Una especificación que permite que las aplicaciones de software se comuniquen entre sí. Una API permite a los programas cliente acceder a las instalaciones dentro de una aplicación.

Archivo de Internet

Una biblioteca digital sin fines de lucro y de acceso abierto. Contiene más de 3 millones de libros de dominio público, así como música, imágenes en movimiento, archivos de audio, software y páginas web archivadas. El material digital puede ser descargado y cargado por los usuarios. El Archivo de Internet supervisa uno de los proyectos de digitalización de libros más grandes del mundo.

Archivo de textos de la Universidad de Oxford (OTA)

Un archivo digital que desarrolla, recopila, cataloga y preserva recursos literarios y lingüísticos electrónicos. Fundado en 1976 por los Servicios de Computación de la Universidad de Oxford, se cree que es el archivo más antiguo de recursos textuales académicos digitales. El acceso a la OTA es gratuito, al igual que la descarga de todos los recursos, aunque algunos requieren permiso para ser descargados, solicitado ya sea a la OTA o a los depositantes originales.

Archivo Rosetti (Rosetti archive)

Un archivo digital de toda la producción artística del poeta y pintor prerrafaelista Dante Gabriel Rossetti. Los textos han sido transcritos y codificados para su búsqueda y análisis, y la mayoría de ellos están acompañados de imágenes digitales de alta calidad. El archivo también contiene un sustancial cuerpo de comentarios críticos, notas y glosas. El Archivo Rossetti es uno de los archivos digitales de humanidades más antiguos y establecidos que se encuentran actualmente en la Web y ha influido en el desarrollo de muchos otros proyectos.

autocorrelación espacial

Medida del grado en que un conjunto de características espaciales y sus valores de datos asociados tienden a agruparse en el espacio o a dispersarse. Es una medida de la dependencia entre las observaciones en un espacio geográfico determinado. Los valores agrupados en el espacio muestran una autocorrelación espacial positiva, mientras que los que están dispersos muestran una autocorrelación espacial negativa.

BASIC (código de instrucción simbólico de uso múltiple para principiantes)

Un lenguaje de programación simple y fácil de aprender desarrollado a mediados de los 60 para los estudiantes no científicos que incorporaba un simple editor de programas.

bioinformática

La aplicación de la informática y las tecnologías de la información al estudio y la conservación de los datos biológicos. La investigación bioinformática, un campo inherentemente interdisciplinario, se origina en la informática y en campos científicos más tradicionales. Entre los principales campos de investigación bioinformática figuran el análisis de secuencias de ADN, las bases de datos y la extracción de datos de la literatura científica, la visualización en tres dimensiones y la anotación del genoma.

bit

Unidad de información derivada de la elección entre dos alternativas o “acontecimientos” igualmente probables; dicha unidad se almacena electrónicamente en una computadora, por ejemplo, 1 y 0.

bitmap

Una representación, por ejemplo, de la memoria de un ordenador, en la que cada elemento se representa con un bit; específicamente una pantalla gráfica en la que los caracteres se forman asignando a cada píxel individual un valor de bits.

browser (navegador)

Una aplicación informática que permite a los usuarios localizar y recuperar información de los servicios de información en red. Actualmente se utiliza con mayor frecuencia para referirse a un navegador de Internet, el término se refiere a un programa informático especializado para ver, interactuar y navegar por las páginas web. Estos programas utilizan HTTP para implementar el HTML (véase más abajo).

cluster analysis (análisis de conglomerados)

Una forma de analizar los datos que clasifica un conjunto de información en dos o más grupos mutuamente exclusivos basados en combinaciones de variables internas. El análisis de grupos es útil para descubrir estructuras y patrones dentro de los datos basados únicamente en una categoría seleccionada de similitudes y diferencias. En la práctica, el análisis de conglomerados de un corpus de textos suele agruparlos según las similitudes y diferencias de las frecuencias de las palabras más frecuentes. El análisis de conglomerados ha demostrado ser muy fiable en la atribución de autoría y la identificación de géneros. El programa de software estadístico MINITAB facilita el análisis de conglomerados.

código fuente (source code)

Las instrucciones para un programa en su forma original. Estas instrucciones están escritas en un lenguaje de programación particular, normalmente en forma de texto. Este código fuente se compila en código de máquina que puede ser ejecutado por un ordenador. La mayoría de las aplicaciones se distribuyen como archivos ejecutables, no como código fuente. El código fuente es también el único formato de código de computadora que los seres humanos pueden leer.

CommentPress

Un tema de código abierto y un plug-in para el sistema de gestión de contenidos WordPress que permite a los lectores comentar párrafo por párrafo en el margen de un texto. Se puede aplicar a un documento fijo (por ejemplo, un ensayo, un libro) o a un blog constantemente actualizado. Recientemente, CommentPress ha evolucionado a Digress.it, una versión más robusta de la aplicación. Los usuarios de CommentPress deben tener un sitio web de WordPress, y los usuarios de Digress.it deben registrarse en Digress.it para obtener una cuenta alojada.

Concordance (Concordancia)

Un programa de concordancia de propiedad. La concordancia es una aplicación completa con un número de características poderosas, incluyendo soporte para múltiples idiomas, alfabetos definibles por el usuario, contextos definibles por el usuario, visualización de múltiples paneles, la capacidad de analizar estadísticamente textos seleccionados y la capacidad de exportar resultados de concordancia como archivos de texto, HTML o Web Concordance.

content management system (sistema de gestión de contenidos)

Un programa de software o un conjunto de aplicaciones diseñadas para permitir la creación, edición, revisión, organización y publicación de contenido en la Web desde una interfaz central. Los sistemas de gestión de contenidos más populares incluyen WordPress, Drupal y Joomla!.

corpus

Pl. Corpora, una colección de textos escritos, en particular el conjunto de obras sobre un tema o por un creador específico; una colección de material escrito o hablado en forma legible por máquina, reunido con el fin de estudiar las estructuras lingüísticas, las frecuencias, etc.

CSS (hojas de estilo en cascada)

Una forma de especificar la apariencia de HTML o XML en un navegador. El CSS permite la separación del contenido estructural de la presentación. Para una mayor introducción a CSS.

CSV

 (Comma Separated Values/Valores separados por comas) un tipo de archivo que permite guardar datos en un formato estructurado de tabla. La extensión de este archivo es .csv; tradicionalmente toman la forma de un archivo de texto que contiene información separada por comas, pero puede ser manipulado por programas como excel y open refine.

database (base de datos)

Una colección de información organizada de tal manera que un programa de computadora puede seleccionar rápidamente los datos deseados. La estructura de una base de datos depende del tipo de relación que se describe. Una base de datos se diferencia de un archivo de esa misma información en que describe la forma en que los datos se relacionan entre sí en lugar de presentar una colección no ordenada del mismo contenido.

DocuScope (Escritorio; Java, multiplataforma)

DocuScope es un entorno de análisis de texto con un conjunto de herramientas de visualización interactiva para el análisis retórico basado en el corpus.

Drupal

Un sistema de gestión de contenidos libre y de código abierto distribuido bajo la Licencia Pública GNU. Drupal, WordPress y Joomla! son los sistemas de gestión de contenidos más comunes utilizados para administrar el contenido de la Web.

Dublin Core

Un conjunto estándar de términos de vocabulario utilizados para describir una amplia gama de recursos. Este conjunto de elementos comprende un sistema básico, normalizado y compartido de metadatos ampliamente utilizado por bibliotecas, gobiernos, organizaciones internacionales y empresas. Véase metadatos.

escalado multidimensional

Un conjunto de técnicas analíticas utilizadas para visualizar similitudes o disimilitudes en los datos. El escalamiento multidimensional se utiliza cada vez más para representar información no espacial en términos espaciales, a menudo dentro de aplicaciones de SIG.

estadísticas espaciales

Una rama de la estadística y la geografía que se ocupa del análisis de las distribuciones, pautas, procesos y relaciones espaciales. La mayoría de las técnicas utilizadas en la estadística espacial se desarrollaron especialmente para su uso con datos geográficos; como tales, incorporan el espacio directamente en sus matemáticas.

Facebook

En 2004 se puso en marcha un servicio de redes sociales. Los usuarios, una vez registrados, pueden crear un perfil personal, añadir a otros usuarios como amigos, intercambiar mensajes, unirse a grupos y publicar y compartir imágenes. Facebook es el sitio de redes sociales más popular del mundo de habla inglesa.

FedoraCommons (Arquitectura del Depósito de Objetos Digitales Extensibles de Fedora)

Una arquitectura modular de gestión de activos digitales para almacenar, gestionar y acceder a objetos digitales. No debe confundirse con el sistema operativo Linux llamado Fedora, FedoraCommons proporciona una arquitectura subyacente extremadamente flexible para la formación de repositorios digitales que contienen cualquier tipo de contenido digital.

Flickr

Un sitio web para compartir fotos y vídeos creado en 2004. Ampliamente utilizado para alojar imágenes incrustadas en blogs y foros en línea, Flickr contiene más de 6.000 millones de imágenes. Flickr es una aplicación de la Web 2.0 que utiliza el etiquetado folksonómico para organizar el contenido para su recolección y descubrimiento.

Gephi (Escritorio, multiplataforma)

Gephi es un software de análisis de red de código abierto para la visualización y manipulación de datos.

Google Books

El texto completo de los libros y otros materiales impresos es escaneado por Google, convertido a texto mediante reconocimiento óptico de caracteres, almacenado en su base de datos y puesto a disposición para su búsqueda. Los materiales de dominio público están disponibles en su totalidad y para su descarga; para los materiales con derechos de autor, se dispone de varios niveles de acceso. La Búsqueda de libros de Google contiene actualmente más de 20 millones de artículos.

Google Books Ngram Viewer (Visor Ngram de la Búsqueda de libros de Google)

Una herramienta gráfica, desarrollada por Google para graficar el conteo anual de n-gramas (combinaciones de letras), palabras o frases seleccionadas como se encuentran en más de 5.2 millones de libros digitalizados por Google hasta el 2008. Los resultados se muestran como un gráfico de líneas normalizadas, con sólo las coincidencias encontradas en más de 40 libros indexados en la base de datos.

Google Docs

La suite ofimática gratuita de Google, basada en la web, y el servicio de almacenamiento de datos. El servicio, ahora renovado como Google Drive, permite a los usuarios crear, editar y compartir documentos, hojas de cálculo y presentaciones con diapositivas. Aunque Google Docs sigue existiendo (a fecha de septiembre de 2014) como sistema heredado, Google Drive incorpora Google Docs y también permite a los usuarios almacenar, compartir y sincronizar cualquier archivo en los servidores de Google.

Google Earth

Un globo terráqueo virtual y una aplicación cartográfica que permite a los usuarios ver imágenes satelitales, mapas, terrenos, edificios en 3-D, etc. Las imágenes y los datos se actualizan regularmente. Desde su lanzamiento en 2005, Google Earth ha sido descargado más de mil millones de veces.

HTML (lenguaje de marcado de hipertexto)

Un lenguaje de autor utilizado para crear documentos en la World Wide Web. El HTML define la estructura y el diseño de un documento utilizando una variedad de etiquetas y atributos. Los navegadores web leen los documentos HTML y los transforman en las páginas web que los usuarios encuentran en línea; el HTML no se muestra directamente, sino que es utilizado por un navegador para interpretar el contenido de una página. XHTML es HTML escrito como XML. Ver Chuck Musciano y Bill Kennedy, HTML: The Definitive Guide (3ª ed.; Sebastopol: O’Reilly, 1998), 1-15.

gráficos de vectores

Un gráfico almacenado como una serie de instrucciones matemáticas que se utilizan para formar una imagen. Como los gráficos vectoriales se almacenan como fórmulas matemáticas, el tamaño de sus archivos es menor que el de los archivos de imágenes de mapa de bits. Debido a que son objetos creados matemáticamente, los usuarios pueden cambiar el tamaño y estirar los gráficos vectoriales sin reducir su claridad. Ver gráficos rasterizados.

gráficos de trama (raster graphics)

Un gráfico almacenado como un mapa de bits. Un mapa de bits es una representación en la que cada elemento corresponde a uno o más bits de información. Al referirse a los gráficos, estas representaciones toman la forma de filas y columnas de puntos (píxeles); el valor de cada punto de la matriz se almacena como un bit de datos. El valor más básico de cada punto es 1 o 0, creando una imagen en blanco y negro en la que cada píxel corresponde a cualquiera de los dos valores. Lo más notable es que los gráficos raster son imágenes que pueden almacenarse en diversos formatos de imagen y que sólo pueden procesarse simultáneamente, a diferencia de los gráficos vectoriales, que consisten en objetos que pueden gestionarse individualmente dentro de una pantalla. Los gráficos raster también son difíciles de escalar y se pixelan cuando se reducen o amplían. Véase gráficos vectoriales.

HTTP (protocolo de transferencia de hipertexto)

Un protocolo de aplicación (reglas) para el intercambio o transferencia de hipertexto. HTTP es el protocolo subyacente utilizado por la World Wide Web para definir cómo se formatean y transmiten los mensajes. La abreviatura, en letras minúsculas seguidas de dos puntos, constituye el comienzo de la dirección web de un archivo que se transmitirá utilizando este protocolo.

Intelligent Archive (Escritorio; Java, multiplataforma)

El Archivo Inteligente es una interfaz para un archivo de textos, e incorpora una gama de funcionalidades de conteo para apoyar el análisis estadístico y la estilística computacional.

JavaScript

Un lenguaje de programación parecido a C++. Típicamente, los programas JavaScript se insertan en el HTML de una página Web y son ejecutados por un navegador. JavaScript provee contenido dinámico, cambiando el aspecto de una página o respondiendo a eventos iniciados por el usuario como un clic del ratón.

Joomla!

Un sistema de gestión de contenidos libre y de código abierto para el desarrollo de sitios web distribuido bajo la Licencia Pública GNU. Otros sistemas de gestión de contenidos comunes incluyen Drupal y WordPress.

Juxta (Desktop; Mac/Win/Unix)

Juxta es una herramienta multiplataforma de código abierto para comparar y cotejar múltiples testigos de una misma obra textual. El software permite a los usuarios establecer cualquiera de los testigos como texto base, añadir o eliminar textos de testigos, cambiar el texto base a voluntad y anotar las comparaciones reveladas por Juxta y guardar los resultados.

KWIC (palabra clave –keyword– en contexto)

Un tipo de salida de concordancia que ordena y alinea las palabras dentro de una muestra textual alfabéticamente y en conjunción con el texto circundante. En lugar de aislar los términos de búsqueda en una lista de palabras individuales, KWIC permite a los usuarios ver los resultados de una búsqueda dentro de un contexto limitado, proporcionando un significado más completo. KWIC es también el nombre de un programa de concordancia (KWIC Concordance for Windows) diseñado para analizar textos y proporcionar listas de frecuencias de palabras, concordancia y tablas de colocación.

LAMP (Linux, Servidor HTTP Apache, MySQL y PHP)

Un conjunto de programas de software libre y de código abierto utilizados para construir un servidor web de propósito general. Linux es el sistema operativo, Apache es el servidor Web, MySQL es el sistema de gestión de bases de datos relacionales, y PHP (o Perl o Python) es el lenguaje de programación

Linkedln

Un sitio de redes sociales para la creación de redes profesionales. Los perfiles de Linkedln resumen la historia laboral, la educación y los logros profesionales. Linkedln también permite a los usuarios desarrollar «conexiones» con colegas, clientes y socios.

LION (Literatura en línea)

Una biblioteca virtual que contiene más de 350.000 textos literarios, revistas de texto completo, biografías de autores y otras fuentes de referencia y críticas relacionadas con el estudio de la literatura en inglés. Lanzada en 1996 y propiedad de ProQuest/Chadwyck-Healey, LION está disponible por suscripción.

literatura electrónica

Objetos digitales de primera generación creados en una computadora y destinados generalmente a ser leídos en una; o bien, literatura que aprovecha las capacidades y contextos proporcionados por los dispositivos informáticos autónomos o en red. Esta amplia colección de obras suele aprovechar las capacidades de enlace de hipertexto, interactividad, juego y multimedia presentadas por código ejecutable.

LiveJournal

Una combinación de blog y sitio de redes sociales fundada en 1999. Los usuarios pueden escribir entradas para su diario personal, restringir la visibilidad, cargar multimedia, personalizar la apariencia de su diario mediante HTML y CSS, «hacer amigos» a otros usuarios, unirse a comunidades basadas en intereses comunes y comentar las entradas de otros usuarios. LiveJournal tiene más de 1,8 millones de usuarios activos y fue uno de los primeros ejemplos de un sitio Web 2.0.

LM (modelo de lenguaje)

Un modelo de lenguaje estadístico es una distribución de probabilidad sobre secuencias de palabras, asignando una probabilidad matemática que estima la probabilidad relativa de diferentes frases. La fórmula matemática básica para esto es P(w1,…, wm), donde m es la longitud de la secuencia. Los modelos lingüísticos se utilizan en el reconocimiento de voz, el reconocimiento óptico de caracteres (OCR), el etiquetado de partes de la palabra (POS) y otros procesos. Un LM de n-gramos asume que la probabilidad de una palabra depende de las n palabras anteriores.

Lucene

Una biblioteca de software libre y de código abierto para la recuperación de información apoyada por la Fundación de Software Apache. Lucene facilita la indexación de texto completo y la búsqueda de cualquier contenido de la Web, pero se utiliza principalmente para la búsqueda de aplicaciones Web locales de un solo sitio, como Twitter. Lucene es agnóstico en cuanto al formato de los archivos y funciona con PDF, HTML y procesadores de texto siempre que se pueda extraer su información textual.

machine learning (aprendizaje automático)

Una forma de programar las computadoras que permite la evolución del comportamiento computacional basado en datos empíricos o experiencias pasadas. El aprendizaje automático se centra especialmente en la capacidad de los ordenadores para aprender a reconocer patrones complejos y tomar decisiones inteligentes basadas en esos patrones, una capacidad que es especialmente valiosa en el análisis textual computacional.

MALLET (Escritorio; Java, multiplataforma)

MALLET es un paquete basado en Java para el procesamiento estadístico del lenguaje natural, la clasificación de documentos, la agrupación, el modelado de temas, la extracción de información y otras aplicaciones de aprendizaje automático al texto.

Graphical User Interface version of MALLET (La versión de interfaz gráfica de usuario de MALLET) (Desktop; Java, multiplataforma)

Esta es una interfaz gráfica de usuario (GUI) para la implementación de la Asignación de Dirichlets Latentes de MALLET.  

Many Eyes

Un sitio web desarrollado por IBM en el que los usuarios pueden cargar datos, crear visualizaciones interactivas o estáticas y llevar a cabo debates. El sitio está diseñado para facilitar no sólo el descubrimiento individual a través de la visualización de datos, sino también para estimular el debate y la colaboración entre personas dedicadas a tipos similares de producción de conocimientos. Many Eyes ofrece numerosos tipos de visualizaciones, divididas en categorías, entre las que se incluyen gráficos de dispersión, diagramas de red, gráficos de barras, gráficos de burbujas, gráficos lineales, árboles de palabras, nubes de etiquetas y mapas de árboles. Junto con Voyant Tools, Many Eyes es una de las plataformas de visualización y análisis basadas en la Web más útiles que están disponibles públicamente.

MARC (catalogación legible por máquina)

Un conjunto de normas internacionales para la representación y comunicación de información bibliográfica en forma legible por máquina. Desarrolladas por la Biblioteca del Congreso en la década de 1960, las normas MARC constituyen la base de la mayoría de los sistemas de catalogación de bibliotecas que se utilizan hoy en día. Para otro conjunto de normas, véase Dublin Core.

Memex

Un término acuñado por Vannevar Bush para referirse a un dispositivo mecanizado para almacenar, acceder y organizar cantidades masivas de información. Bush formuló su idea del memex en un artículo de 1945 publicado en The Atlantic Monthly (“As We May Think”). La idea del memex influyó en el desarrollo del hipertexto, la computación personal, la Internet, la World Wide Web y las colecciones de conocimiento en línea como Wikipedia.

metadatos

Datos que describen otros datos. Los metadatos proporcionan información sobre uno o más aspectos de los datos, como el tipo, la fecha, el creador, la ubicación, etc. Los metadatos, que se encuentran con mayor frecuencia en contextos de bibliotecas y archivos, facilitan la organización, el descubrimiento y la utilización de una amplia gama de recursos. Para más información, consulte la publicación de la Organización Nacional de Normas de Información, Understanding Metadata [pdf].

methodological commons (patrimonio metodológico común)

En la formulación de Willard McCarty, un conjunto de técnicas computacionales compartidas entre las disciplinas de las humanidades y ciencias sociales relacionadas, incluyendo el diseño de bases de datos, análisis de texto, análisis numérico, imágenes, recuperación de información musical y comunicación. Para una ilustración de este acervo metodológico, así como un análisis más detallado del papel que la informática para las humanidades tiene que desempeñar en un sistema de este tipo.

MINITAB

Un programa de análisis estadístico propio y bien establecido desarrollado en los años 70. MINITAB permite cálculos estadísticos básicos, así como análisis de regresión, producción de tablas y gráficos, análisis multivariados, herramientas de predicción y análisis de variación.

MMOG (juego masivo multijugador en línea)

Término que describe los juegos de rol en línea que suelen presentar un mundo virtual persistente y en evolución y que permiten la cooperación y la competencia en línea a gran escala. World of Warcraft es uno de los MMOGs más grandes y populares del mundo.

MonoConc Pro

Un programa de concordancia fácil de usar. Además de proporcionar la capacidad de búsqueda de texto completo para los textos cargados, MonoConc Pro permite el análisis textual como búsquedas de expresiones regulares, búsquedas de etiquetas y la capacidad de comparar corpus basados en las variables elegidas.

MorphAdorner (Escritorio; Java, multiplataforma)

MorphAdorner es un lematizador XML, un segmentador de texto y un analizador de procesamiento de lenguaje natural para textos de la Edad Moderna (especialmente textos EEBO-TCP).

Myspace

Un servicio de redes sociales fundado en 2003. Durante el período 2005-08, Myspace fue el sitio de redes sociales más popular del mundo. Fue superado en popularidad por Facebook en 2008 y ha visto una disminución constante de usuarios desde entonces.

MySQL

Un sistema de gestión de bases de datos relacionales de código abierto (RDMS). MySQL es el RDMS más utilizado en el mundo. Muchos de los sitios web y aplicaciones más utilizados de la World Wide Web usan MySQL.

nuevos medios de comunicación

Término amplio que se utiliza para referirse a la creación, distribución y ejecución digital de contenidos, así como a la retroalimentación interactiva de los usuarios y las comunidades que se forman en torno a dichos contenidos. La creación y la crítica de los nuevos medios de comunicación se han identificado a menudo con la producción artística y los movimientos de democratización social y de justicia. Véase The New Media Reader, Eds. Noah Wardrip-Fruin y Nick Montfort (Cambridge: MIT P, 2003), 3-25.

n-gram

En la lingüística, una secuencia de n elementos de una determinada secuencia de texto o discurso. Los N-gramas pueden ser cualquier combinación de letras, fonemas, sílabas, palabras o letras. Una secuencia bigram de la frase «ser o no ser», por ejemplo, se desglosaría de la siguiente manera: ser, ser o, o no, no ser, ser. Los N-gramas se utilizan regularmente en el procesamiento del lenguaje natural y en el reconocimiento del habla.

OCR (reconocimiento óptico de caracteres)

El uso de tecnologías informáticas para convertir imágenes escaneadas de texto mecanografiado, impreso o escrito a mano en texto legible por máquina. Esta conversión permite la computarización de los textos materiales en formatos para el almacenamiento, la búsqueda y la visualización digital. Adobe Acrobat Professional soporta los procesos de OCR, al igual que Microsoft Office para Windows. La precisión del OCR depende de la fuente y el estilo del documento original. Formas de letra inusuales y serifs fuertes pueden causar errores de transcripción, el más común de los cuales es el largo de leer erróneamente para los primeros textos modernos.

OHCO (jerarquía ordenada de objetos de contenido)

Una frase acuñada para responder a la pregunta, «¿Qué es el texto?» Los textos están, en esta visión, compuestos de objetos (por ejemplo, capítulos, párrafos, frases) organizados jerárquicamente de manera que «anidan» unos dentro de otros. Estos objetos no se superponen y organizan el texto en unidades basadas en el significado y la comunicación. Este concepto es parte integral de la codificación TEl con XML.

Omeka

Una plataforma de publicación en la Web, gratuita y de código abierto, para la exhibición de colecciones y exposiciones de bibliotecas, museos, archivos y académicos. Está disponible como aplicación alojada o como sistema de gestión de contenidos (CMS) descargado e instalado en un servidor externo. Desarrollado en el Centro de Historia y Nuevos Medios de la Universidad George Mason, Omeka está diseñado para ayudar a los no especialistas a presentar digitalmente las investigaciones basadas en colecciones. Omeka utiliza las normas de metadatos de Dublin Core para organizar el contenido.

PBWorks

Un espacio wiki alojado fundado en 2005. PBWorks permite la creación de un sitio wiki colaborativo que puede ser público o privado y que está disponible a un nivel básico de funcionalidad sin costo para el usuario.

Plain Vanilla ASCII

Una frase usada por el Proyecto Gutenberg para describir su filosofía de preservar los textos en la forma más simple y fácil de usar disponible. En la práctica, esto significa que el Proyecto Gutenberg utiliza una forma básica del Código Estándar Americano para el Intercambio de Información (ASCII) para preservar y difundir los textos. Casi todos los programas y aplicaciones de software son capaces de interpretar y mostrar caracteres ASCII, asegurando la longevidad y la utilidad de los textos del Proyecto Gutenberg.

Proyecto Gutenberg

Un proyecto voluntario fundado en 1971 para digitalizar y archivar textos literarios. Los textos digitalizados se pueden descargar libremente en diversos formatos. Muchos de ellos son transcripciones de texto completo de libros de dominio público. El proyecto es la colección más antigua de textos electrónicos gratuitos.

Python (Desktop; Mac/Win/Unix)

Un lenguaje de programación de propósito general que hace hincapié en la legibilidad y la facilidad de depuración. Python ha encontrado un amplio uso en una variedad de aplicaciones Web. Para más información, así como tutoriales diseñados para diferentes niveles de conocimiento.

R (Desktop; Mac/Win/Unix)

R es un entorno de software libre para la computación estadística y los gráficos.

Second Life

Un mundo virtual en línea lanzado en 2003. Los usuarios de Second Life pueden explorar libremente su entorno virtual e interactuar con otros usuarios a través de avatares. Second Life ha desarrollado una economía y una moneda internas, y hay numerosos ejemplos de organizaciones que crean espacios virtuales afiliados o que reflejan sus instancias del mundo real.

servidor

Una combinación de hardware y software que lleva a cabo un servicio especializado para otros programas conectados a ella a través de una red. Hay una gran variedad de servidores, incluidos los servidores web, que reciben las solicitudes de los navegadores de páginas web; los servidores de bases de datos, que responden a las solicitudes de datos correspondientes a una consulta de búsqueda; y los servidores FTP (protocolo de transferencia de archivos), que permiten a los usuarios emplear programas FTP para cargar y recuperar archivos. El servidor puede referirse a un hardware, un software o a la combinación de ambos.

SGML (lenguaje de marcado general normalizado)

Un lenguaje de marcado diseñado para formatear, almacenar y acceder a grandes conjuntos de documentos. El lenguaje es declarativo, lo que significa que describe los documentos de origen en lugar de especificar los detalles de su futura exhibición. Estas etiquetas descriptivas pueden entonces ser procesadas de varias maneras. SGML es el lenguaje padre de HTML, XHTML (la versión XML de HTML), y XML.

SIG (Sistemas de Información Geográfica)

Un sistema informático diseñado para capturar, almacenar, manipular, analizar, gestionar y presentar todo tipo de datos espaciales o geográficos.

SOM (mapa auto-organizado)

Técnica de visualización de datos que se basa en el entrenamiento de una red neural artificial para reducir las dimensiones de un conjunto de datos. Los SOM se entrenan primero con ejemplos de entrada y luego utilizan esos ejemplos para reformular la visualización.

SpecLab (Laboratorio de Computación Especulativa)

Un laboratorio digital de humanidades fundado en la Universidad de Virginia en 2000. Centrado en la «computación especulativa» más que en la digitalización y clasificación de textos existentes, el SpecLab se centró en la investigación exploratoria que utilizaba herramientas de humanidades en un contexto digital más que herramientas digitales en contextos de humanidades. SpecLab incubó varios proyectos digitales que han durado más de tres años de existencia, incluyendo NINES, el Archivo Rossetti, Ivanhoe, y Modelado Temporal.

TAPoR (Portal de Análisis de Texto para la Investigación)

Un proyecto diseñado para desarrollar una red de infraestructura humana e informática mediante el establecimiento de centros regionales para desarrollar el almacenamiento y análisis electrónico de textos. Desde su inicio, TAPoR ha evolucionado hasta convertirse en un portal centralizado para herramientas de análisis textual basadas en la web como Wordle, la suite de herramientas Voyant y la suite de herramientas TAPoRWare.

TEI (Iniciativa de Codificación de Textos)

Un consorcio que desarrolla y mantiene colectivamente normas para la representación de textos en forma digital. En la práctica, la organización se ocupa principalmente de producir y mantener las directrices TEl para la codificación de textos en las humanidades, las ciencias sociales y la lingüística. Las Directrices TEl, a diferencia de otros formatos de conservación de textos, son un sistema principalmente semántico; las unidades textuales se codifican según lo que son y no según cómo aparecen.

TextArc

Una aplicación de visualización textual diseñada para mostrar la distribución de las palabras en los textos. TextArc representa todo el texto como dos espirales concéntricas. Cada línea del texto se muestra en una fuente muy pequeña alrededor del exterior; cada palabra se muestra dentro de esa espiral en un tamaño más legible. Cada palabra que aparece más de una vez también aparece dentro de estos dos círculos, con su posición gobernada por su frecuencia.

text encoding (codificación del texto)

En términos generales, el proceso de poner el texto en un formato especial para su preservación o difusión. En las humanidades digitales, la codificación textual casi siempre se refiere a la práctica de transformar el contenido de texto simple en XML. A menudo se siguen las directrices TEl al codificar materiales textuales en las artes, las humanidades y las ciencias sociales. Véase TEl.

text mining (minería de texto)

El proceso de derivar automáticamente información previamente desconocida de textos escritos mediante técnicas computacionales. Las herramientas de minería de textos facilitan a los investigadores el descubrimiento de patrones dentro de datos estructurados.

Transcribe Bentham

Un proyecto participativo de transcripción de manuscritos con sede en el University College de Londres. A través de la interfaz Transcribe Bentham, los voluntarios pueden transcribir los documentos originales y no estudiados del filósofo y reformador Jeremy Bentham. El proyecto pone a disposición imágenes digitales de alta calidad de los manuscritos, que luego se utilizan para producir las transcripciones. Estas transcripciones son a su vez codificadas con un marcado TEI básico por voluntarios. Transcribe Bentham es un experimento muy reconocido en la producción académica de masas.

Twitter

En 2006 se puso en marcha un servicio de redes sociales y microblogging en línea. Los usuarios pueden enviar y leer mensajes de texto («tweets») de hasta 140 caracteres. La plataforma Twitter es uno de los sitios web y aplicaciones más populares del mundo, con cientos de millones de tweets generados diariamente.

Versioning Machine (WEB) Máquina Versionadora (Web)

Versioning Machine es un marco y una interfaz para mostrar múltiples versiones de texto codificado según las directrices de la Iniciativa de Codificación de Texto (TEI).

Visual Basic

Diseñado por Microsoft, un lenguaje de programación y un entorno basado en BASIC. Visual Basic fue uno de los primeros productos en proporcionar un entorno gráfico para desarrollar interfaces de usuario simplemente arrastrando y soltando controles (es decir, botones o cuadros de diálogo) y luego definiendo su comportamiento.

visualización

En términos generales, cualquier expresión gráfica destinada a representar un determinado conjunto de información. En las humanidades digitales, la visualización suele referirse a la visualización de datos, o a la expresión gráfica de colecciones a gran escala de información no numérica como elementos textuales, relaciones de redes o análisis de frecuencias. Véase Martyn Jessop, «Data Visualization as Scholarly Activity» Literary and Linguistic Computing 23, no. 3 (2003): 281-93.

visualización estática

Una visualización de información que no contiene elementos interactivos. Las visualizaciones estáticas, como los gráficos impresos, suelen contrastarse con las visualizaciones digitales e interactivas que cambian según las entradas del usuario. Los gráficos de pastel convencionales, los gráficos de barras y los gráficos de dispersión son ejemplos de este tipo de visualización de la información.

visualización interactiva

Una representación gráfica diseñada para ser manipulada por usuarios humanos. En una visualización interactiva, las ilustraciones gráficas de la información generadas por computadora pueden cambiar con la entrada del usuario. Un ejemplo muy básico es el movimiento del cursor del ratón en la pantalla de una computadora que se produce cuando el usuario mueve el dispositivo físico del ratón.

Voice of the Shuttle (VoS) (La voz del transbordador)

Un recurso de la Web comenzó en 1994 como un conjunto de sitios Web estáticos que ha crecido hasta convertirse en una gran base de datos digital de contenido relacionado con las humanidades y las humanidades. La VoS organiza el contenido en varias áreas, incluyendo estudios religiosos, estudios de medios, danza, literatura y arquitectura. La VoS sigue sirviendo como un directorio bien considerado de contenido Web adaptado a los estudiosos de las humanidades.

Voyant Tools (Herramientas Voyant)

Un conjunto de herramientas de análisis textual basado en la web, destinado a ser fácil de usar, flexible y poderoso. Contiene numerosos módulos capaces de analizar y visualizar el texto de diversas maneras, entre ellos un lector de documentos, un generador de frecuencias de términos, un visualizador de colocación, una visualización de nubes de palabras y un generador de diagramas de dispersión. Los usuarios pueden cargar texto simple en Voyant o cortar y pegar texto en el campo de entrada de la pantalla de Voyant. Los resultados son exportables, al igual que algunas visualizaciones.

Web 1.0

La web 1.0, fue la primera (apareció hacia 1990) y en ella solo se podía consumir contenido. Se trataba de información a la que se podía acceder, pero sin posibilidad de interactuar; era unidireccional.

Web 2.0

La web 2.0, (apareció en 2004) y contiene los foros, los blogs, los comentarios y después las redes sociales. La web 2.0 permite compartir información. Y aquí estamos, de momento la mayor parte de los consumidores.

Web 3.0

La web 3.0 (fue operativa en el 2010) y se asocia a la web semántica, un concepto que se refiere al uso de un lenguaje en la red. Por ejemplo, la búsqueda de contenidos utilizando palabras clave.

Web 4.0

La web 4.0. empezó en el 2016 y se centra en ofrecer un comportamiento más inteligente y más predictivo, de modo que podamos, con sólo realizar una afirmación o una llamada, poner en marcha un conjunto de acciones que tendrán como resultando aquello que pedimos, deseamos o decimos.

wiki

Un sitio web cuyo contenido puede ser añadido, modificado y eliminado por los usuarios empleando un lenguaje de marcado simplificado o un editor de texto dentro de un navegador web. Los wikis se han hecho cada vez más frecuentes en muchos niveles, desde pequeños wikis privados hasta wikis de colaboración y grandes colecciones de wikis. Los wikis suelen incluir una página de discusión donde se pueden debatir los cambios o volver a una versión anterior.

The William Blake Archive

Un archivo de acceso abierto en línea de la obra literaria de William Blake. Fundado en 1996, el archivo contiene imágenes digitalizadas de la obra de Blake, así como ediciones electrónicas de texto completo de muchas de sus obras iluminadas, libros comerciales, dibujos y pinturas, y manuscritos. Codificado en XML, el sitio es un catálogo híbrido, una base de datos y una serie de ediciones.

word cloud (nube de palabras)

Una visualización de las frecuencias de las palabras. Normalmente, cuanto más frecuentemente aparece una palabra en un texto dado, mayor es su tamaño en la visualización resultante. Los programas diseñados para crear nubes de palabras son fácilmente accesibles; dos de los más utilizados son Wordle y la Many Eyes tag cloud.

WordHoard ((Escritorio; Java, multiplataforma)

Un entorno de análisis de textos que contiene varias categorías de textos precargados, como los de Chaucer, Spenser, los primeros griegos y Shakespeare. Para este grupo escogido de textos canónicos, los usuarios pueden realizar una variedad de análisis, incluyendo la búsqueda de texto completo, la construcción de concordancias y la búsqueda de cotejos.

WordPress

Una herramienta de blog y CMS (sistema de gestión de contenidos) libre y de código abierto basada en PHP (Hypertext Preprocessor) y MySQL. WordPress se refiere tanto al software del sistema de gestión de contenidos que se utiliza para administrar materiales en los servidores web como al popular servicio de blogs.

Wordsmith (Desktop, Mac/Win/Unix)

Wordsmith es un software de concordancia para el análisis digital de textos con métricas de análisis estadístico incorporadas que incluyen palabras clave y colocación, con muchos recursos disponibles en la página del software.

XML

Lenguaje de marcado extensible) Lenguaje de marcado diseñado para codificar documentos en un formato que sea legible tanto por humanos como por máquinas. El XML separa el contenido de la estructura y es altamente personalizable.

XSL (lenguaje de hojas de estilo extensible)

Una familia de lenguajes utilizados para transformar y renderizar documentos XML. Las transformaciones del lenguaje de hojas de estilo extensible (XSLT) es un lenguaje XML que transforma un documento XML en otro formato; los objetos de formato del lenguaje de hojas de estilo extensible (XSL FO) especifican el formato visual de un documento XML.

XSLT (Extensible Style Sheet Language Transformation)

Lenguaje basado en XML utilizado para transformar documentos XML en otro formato o estructura, normalmente otros documentos XML o documentos HTML, documentos PDF o mosaicos de procesadores de texto.

YouTube

El sitio web de intercambio de vídeos más grande del mundo, creado en 2005. YouTube utiliza Adobe Flash y HTML5 para mostrar una amplia variedad de contenido generado por el usuario.

Zotero

Una aplicación gratuita y de código abierto diseñada para gestionar referencias y materiales bibliográficos. Desarrollado por el Centro de Historia y Nuevos Medios de la Universidad George Mason, Zotero tiene numerosas características diseñadas para facilitar la integración con los entornos de investigación en línea, incluida la integración con los principales navegadores web para detectar automáticamente la información bibliográfica e importarla cuando sea necesario; la sincronización en línea; la exportación de listas de referencia con formato a los principales programas de procesamiento de textos; y el intercambio de colecciones y artículos con otros usuarios registrados. Está disponible como un complemento del navegador (Zotero para Firefox) y como un producto independiente que puede interactuar con varios navegadores (Zotero Standalone).

Deja un comentario

Diseña un sitio como este con WordPress.com
Comenzar