CorpusRedEs: proyecto de investigación

Señalamos en este espacio dos artículos publicados recientemente, en los que se presenta el proyecto de creación de un corpus de discurso digital o de comunicación mediada por ordenador, en distintas variedades de la lengua española.

Una aproximación a los estudios sobre el discurso mediado por ordenador en lengua española, A. Pano Alamán y P. Moya Muñoz, Tonos Digital. Revista de Estudios Filológicos, 30 (2016), pp. 1-30. http://www.tonosdigital.com/ojs/index.php/tonos/article/view/1434/834

Resumen
El objetivo de este artículo es ofrecer un primer estado de la cuestión sobre los principales temas y métodos adoptados en los estudios sobre el discurso mediado por ordenador en lengua española. Por medio de un análisis de contenido de artículos de investigación publicados en revistas en español entre 1998 y 2014, se identifican, por un lado, los objetivos que han guiado estas investigaciones y, por otro lado, los métodos y técnicas adoptados para el análisis de interacciones en el medio digital. Los resultados de este estudio de carácter exploratorio, que constituye la primera fase de un proyecto de investigación más amplio (CorpusRedEs), muestran cómo los estudios sobre el discurso mediado por ordenador han pasado de caracterizar la llamada “lengua de Internet” a partir de la descripción de algunos rasgos del discurso en los chats, a analizar distintos fenómenos lingüístico-pragmáticos relacionados con la variación, el género discursivo o la (des)cortesía, en una tipología más amplia de medios digitales.

CorpusRedEs. Proyecto de creación y anotación de un corpus de comunicación mediada por ordenador en español, A. Pano Alamán y P. Moya Muñoz, CHIMERA. Romance Corpora and Linguistic Studies 2 (2015), pp. 117-129.
https://revistas.uam.es/index.php/chimera/article/view/1042/2931

Abstract
This paper presents CorpusRedEs, a project which aims at building a corpus of Computer-Mediated Communication in Spanish. This corpus will gather texts from different cybergenres or socio-technical modes, and it will include different geographical or diatopic varieties of Spanish, covering several fields of interest as well. The annotation of the macrolevel of texts included in the corpus is based on the standard TEI-XML adapted to CMC, in order to promote both interoperability between platforms and the easy recovery of data by users. In this sense, we suggest that <posting> and <thread> elements, considered in other projects in order to segment CMC interaction units, may be enriched by the adoption of attributes like @trans (transition), generally used for the annotation of spoken language corpora, since it allows the representation of the interactional dynamics within these texts.

Anuncios

Las redes sociales como corpus de estudio

Hola,

gatwin539

Estos días estamos elaborando la comunicación que vamos a presentar en el I Congreso Internacional de la HDH: Humanidades Digitales Hispánicas. Sociedad Internacional Humanidades, que se desarrollará entre el 9 y el 12 de julio de 2013 en A Coruña (España).

Nuestra intervención, que está previsto que tenga lugar el viernes 12 de julio a las 12:30 en la sesión B22, versará sobre “Las redes sociales como corpus de estudio para el Análisis del Discurso Mediado por Ordenador”.

Ahí va el resumen por si os interesa:

El propósito de nuestro trabajo es llevar a cabo una revisión de algunas de las cuestiones que más se han debatido en los estudios sobre la influencia de las nuevas tecnologías en el lenguaje en el marco de lo que tradicionalmente se ha llamado Comunicación mediada por ordenador (CMO), y que se plantea hoy como Discurso mediado por ordenador (S. Herring, 2003) dentro de un enfoque discursivo que considera el lenguaje utilizado, las creencias que se comunican y la interacción en situaciones de índole social (T. van Dijk, 1997).

Brevemente, delinearemos un estado de la cuestión de la disciplina a partir de una revisión de los principales análisis llevados a cabo en los últimos años. Por ejemplo, el estudio de la literatura científica en este sector revela que los enfoques adoptados por la mayor parte de los análisis que han venido apareciendo hasta nuestros días, tanto en el ámbito de la lengua española como en otras lenguas, se ha basado casi exclusivamente en aspectos vinculados con el soporte o la tecnología, el tiempo de la interacción y la reconfiguración de las características del individuo y de los grupos sociales en la Red (A. Pano Alamán, 2008).

Sin embargo, se echan de menos reflexiones metodológicas relacionadas con la recopilación de datos extraídos de Internet, esto es, con la constitución de corpus para el análisis lingüístico de los discursos mediados por ordenador. Así, con frecuencia, las muestras adolecen de escasa representatividad y los corpus de estudio seleccionados son de escaso volumen. Además, asistimos en numerosas ocasiones a una mezcla de géneros o a la modificación de otros ya existentes –por ejemplo en el discurso periodístico (A. Mancera Rueda, 2011)–, lo que exige el desarrollo de nuevas pautas para su caracterización. Por otra parte, en la selección de un corpus digital es necesario tener en cuenta asimismo la cantidad de información contextual necesaria y plantearse cuestiones de tipo ético, que tienen que ver con el anonimato y la protección de la privacidad (J. Androutsoupoulos y M. Beiβwenger, 2008).

Estas cuestiones resultan especialmente relevantes cuando se abordan trabajos de investigación centrados en el análisis de nuevas dinámicas conversacionales surgidas en la Web 2.0, donde los parámetros tecnológicos pasan por una convergencia de los canales y herramientas, y por una multimodalidad por la que el uso de imágenes, texto y sonido se integran. Los estudios sobre el discurso en la Web 2.0 en espacios como Facebook, Flickr, Twitter y YouTube son aún muy recientes (C. Thurlow y K. Mroczek, 2011), pero la mayoría apunta en esta dirección. De acuerdo con K. Crowston y M. Williams (2000), es posible clasificar los fenómenos discursivos en la Web 2.0 en función de los cambios que se observan en el uso de cada medio. Por ejemplo, el correo electrónico, el chat, los foros de discusión y los blogs se adaptan a los entornos Web 2.0 con un mínimo de diferencias; mientras que canales como Twitter y las redes sociales virtuales como Facebook, Tuenti, las herramientas de colaboración y los espacios en que se comparten documentos, se consideran emergentes, pues plantean nuevas dinámicas discursivas.

En concreto, las redes sociales virtuales, como el servicio de microblogging Twitter, generan nuevas dinámicas discursivas a través de dispositivos como el retuit y las etiquetas o hashtag, que reconfiguran en el discurso los procedimientos de cita, la coherencia textual, la gestión de la alternancia de turnos o la intertextualidad (A. Mancera y A. Pano, 2013). Así, como mostraremos en esta comunicación, su estudio obliga al investigador a reconsiderar los planteamientos de la lingüística de corpus, marco “en ebullición” (Parodi, 2010: 35), y a pensar en estos espacios como corpus textuales que requieren nuevos métodos interdisciplinarios de análisis.

Referencias bibliográficas:

  • Androutsoupoulos, J. y M. Beiβwenger (2008): “Introduction: Data and Methods in Computer-Mediated Discourse Analysis”, Language@Internet, 5, pp. 1-7.
  • Crowston, K. y M. Williams (2000): “Reproduced and emergent genres of communication on the World-Wide Web”, The Information Society, 16(3), pp. 201-216.
  • Herring, S. (2003): “Media and Language Change”, Journal of Historical Pragmatics, 4 (1), pp. 1-17.
  • Mancera Rueda, A. (2011): ¿Cómo se “habla” en los cibermedios? El español coloquial en el periodismo digital, Berna, Peter Lang.
  • Mancera Rueda, A. y A. Pano Alamán (2013): El discurso político en Twitter, Barcelona, Anthropos.
  • Pano Alamán, A. (2008): Dialogar en la Red. La lengua española en chats, e-mail, foros y blogs, Berna, Peter Lang.
  • Parodi, G. (2010): Lingüística de Corpus: de la teoría a la empiria, Madrid, Iberoamericana Vervuert.
  • Thurlow, C. y K. Mroczek (2011): Digital discourse: Language in the new media, Nueva York, Oxford University Press.
  • Van Dijk, T. (1997): Discourse as social interaction, vol. 2, London, SAGE.

Volviendo sobre el “ola k ase?”…

Ayer publicábamos una entrada sobre el meme “ola k ase?”, que ha inundado las redes sociales acompañando a fotografías de carácter humorígatwin542stico, y se encuentra también muy presente en YouTube, en vídeos como los del rapero Lorey Money.

Precisamente a raíz de la publicación de esta entrada hemos sabido que hace unos meses, concretamente el 25 de abril de 2013, Diario de Navarra publicaba un reportaje que llevaba por título “Contra el ‘ola k ase?'”.  Manuel Casado, catedrático de Lengua Española de la Universidad de Navarra y miembro correspondiente en la Real Academia Española (RAE) por Navarra, y Alfredo Asiáin, profesor del departamento de Filología y Didáctica de la Lengua de la Universidad Pública de Navarra (UPNA), respondían en él a preguntas como las siguientes: ¿sufre el español en boca y papel de sus hablantes? ¿se habla y se escribe mal? ¿hay conciencia de la necesidad de cambiar de registros?
Además, recomendaban una lista de libros muy aconsejable para mejorar el uso del idioma.

Desde aquí queremos recomendaros la lectura de este reportaje, que podéis descargar aquí:

http://www.unav.es/centro/analisisdeldiscurso/files/file/entrevista_%20ManuelCasado_abril_2013.pdf

 

Descortesía e ironía con el “ola k ase?”

gatwin543En las interacciones conversacionales la prosodia desempeña una función de considerable importancia. De hecho, como han puesto de manifiesto los investigadores del Groupe aixois de recherches en syntaxe (GARS), esta puede llegar a sustentar hasta el noventa por ciento del sentido de los enunciados. De ahí que en los estudios sobre la (des)cortesía en el coloquio [1] se haga especial hincapié en el análisis de los rasgos entonativos, como elementos esenciales para interpretar el sentido cabal de un enunciado. Sin embargo, dada la escasez de recursos orientadores con los que cuenta la escritura –comillas, puntos suspensivos, signos de exclamación e interrogación y poco más–, no cabe en ella una representación de la prosodia equiparable a la de la conversación.

En el DMO esto puede suplirse mediante el empleo de una escritura ideofonemática (Torres, 2003), que contribuye a enriquecer el contenido modal de lo asertado, otorgando información sobre el estado de ánimo del emisor, o sobre la actitud desde la que sus palabras deben interpretarse. Por ejemplo, tras conocer la información publicada por el diario El País sobre la contabilidad llevaba a cabo por el extesorero del Partido Popular Luis Bárcenas, Otero escribe el siguiente tuit:

Otero, Julia (@julia_otero). «#Rajoy. OLA K ASE!!!». 31-01-2013. Tuit.

Mediante la utilización del apellido del presidente del Gobierno a modo de etiqueta, la periodista parece invitar a sus seguidores a incluirla también en sus tuits con el objeto de que se convierta en tema del momento. Hay que tener en cuenta que algunas horas después de conocerse la noticia, los internautas criticaban a Rajoy por no comparecer ante los medios para explicar la situación de su partido. A él apela también Otero mediante un enunciado con faltas de ortografía en el que la modalidad interrogativa del saludo característico de la cortesía formularia –«hola, ¿qué hace?»– se sustituye por la modalidad exclamativa y el uso de las mayúsculas. La naturaleza de dicho enunciado, que constituye lo que en el DMO se conoce como meme (Dawkins, 1976) [2], y el uso de las mayúsculas y de los signos de exclamación reiterados no deberían dejar lugar a dudas sobre su finalidad irónica. Así es interpretada por la mayoría de sus seguidores, que le responden con tuits como el siguiente, en el que el internauta se sirve de un emoticono y de una etiqueta para mostrar su sorpresa, además de una onomatopeya que representa las carcajadas que la ocurrencia le provoca:

McPhee, Flanagan D. (@FlanaganMcPhee). «@julia_otero O_o #ojipláticomehallo #JAJAJAJA». 31-01-2013. Tuit.

Tales recursos pueden considerarse manifestaciones de cortesía valorizante (Kerbrat-Orecchioni, 1996), pues muestran la consonancia del enunciador con el comentario de la periodista y el reconocimiento de su ingenio. No obstante, he localizado un caso en el que la intervención reactiva de uno de sus seguidores implica un acto de amenaza a la imagen (Brown y Levinson, 1978 [1987]):

Lobato, Andrea (@andreealobato). «Un tweet muy profesional, sí. “@julia_otero: #Rajoy. OLA K ASE!!!”». 31-01-2013. Tuit.

En este ejemplo la internauta retuitea la intervención de Otero, a la que hace preceder por un enunciado valorativo cuya connotación positiva se torna en negativa, pues solo puede entenderse en sentido reprobatorio. Dicha contradicción argumentativa (Berrendonner, 1987), con la que la figura del locutor se disocia del enunciador, induce a la interpretación irónica. A este mensaje responde otro internauta con un nuevo acto de amenaza a la imagen en forma de ataque ad hominem sobre sus facultades mentales:

RajoyitoFullHD (@ustednoesyo). «@julia_otero @andreealobato Andrea se llama sentido del humor, ironía fina. Pero Andrea para entenderlo es necesaria cierta dosis de inteli». 31-01-2013. Tuit.


[1] Cfr. por ejemplo Culpeper, Bousfield y Wichmann (2003).

[2] Es decir, una forma de expresión de sentido más o menos gramaticalizado por su amplia difusión en Internet, que suele acompañar a fotografías de carácter humorístico. En la siguiente dirección web pueden encontrarse varios ejemplos: <http://www.olakase.org/&gt;; 10/03/2013.

Día de las Humanidades Digitales (DHD)

Con motivo del Día de las Humanidades Digitales , que se celebrá el próximo 10 de junio, hemos desarrollado un pequeño blog en el que explicamos brevemente nuestra actividad investigadora. Te invitamos a seguirnos también en:

http://dhd2013.filos.unam.mx/adired/

gatwin541

Categorías:nuevos eventos

El discurso político en Twitter – Novedad bibliográfica

Hola a tod@s,

Es un placer anunciar aquí la publicación de nuestro libro “Análisis del discurso político en Twitter”. Ahí va el resumen, esperando que os interese.

Resumenportada.gif

¿Cómo se comunican los políticos españoles vía Twitter? ¿Puede hablarse de renovación en la propaganda electoral transmitida a través de esta red de “microblogging”? ¿Qué estrategias se utilizan para favorecer la “conversación” con los votantes? ¿Se promueve la cortesía o predomina más bien la agresividad verbal? ¿Qué funciones pueden desempeñar la ironía y el humor en mensajes de 140 caracteres?
Estas son algunas de las preguntas a las que se pretende dar respuesta en el presente trabajo. Con esta investigación se espera contribuir a los estudios sobre el papel de Twitter en la configuración de un discurso político que a menudo “trina” frente a un universo de opiniones.

Información sobre el libro
ISBN: 9788415260660
Editorial: Anthropos Editorial
Fecha de edición: 2013
Lugar de edición: Barcelona
Colección: Divulga!
Encuadernación: Rústica
n. pág.: 329

Ana Mancera y Ana Pano

El concepto de gramática multimedia

Hola, después de algunos meses, volvemos al blog con una nueva entrada. Esta vez para comentar un par de artículos de Judith González Ferran publicados en Estilo. Manual para los nuevos medios de Fundéu BBVA. En ellos, se expone el concepto de “Gramática multimedia”, un concepto interesante que permite reflexionar sobre los cambios que experimenta la lengua en la Red. Los artículos pueden leerse aquí.

De acuerdo con González Ferran, la gramática de los nuevos medios es un sistema armónico y coherente, como cualquier otra gramática. Además, este tipo de gramática está estrechamente relacionado con el concepto de “usabilidad”, es decir, la facilidad con que se puede utilizar una herramienta o un objeto fabricado por humanos con el fin de alcanzar un objetivo concreto:

Si la usabilidad se refiere al grado de facilidad con la que se puede utilizar algo, lo que debe centrar nuestros esfuerzos a la hora de redactar para la web es facilitarle el trabajo a un lector al que ahora llamamos también usuario.

kellsfol200rgeneolgyofchrist

Libro de Kells, manuscrito (800 d.c.)

¿Cómo se logra esto? Pues a través de la brevedad y el uso de elementos tipográficos, visuales (algo habitual en los manuscritos medievales) e interactivos. Así, por ejemplo:

  • las oraciones y los párrafos en la entrada de un blog o en una noticia en unmedio digital deben tener una extensión limitada a pocas palabras (de unas 20 a 30) o líneas (no más de cinco o seis);
  • los dispositivos multimedia (vídeos, fotografías, infografías, etc.) e hipermedia (hipertexto) deben acompañar al texto siempre que sea posible;
  • es aconsejable dividir la información en bloques de texto y utilizar la negrita o la multititulación para resaltar cada parte pasando de una organización lineal de la información a una organización en profundidad o “en estratificación”;
  • cabe adaptar los títulos por medio de mecanismos lingüísticos como la dislocación a la izquierda, esto es, poner la información nueva (foco) al inicio del título, o mediante las palabras gancho. Y es que en la Red, los títulos no sólo deben capturar el interés del lector sino que también deben ser legibles para los buscadores como Google;
  • el lenguaje deber ser objetivo, por ejemplo, se debe evitar el uso de referencias temporales (el próximo día, mañana, el año pasado), que enseguida pueden dejar obsoleta la información. Así, el redactor debe mantener actualizados los tiempos verbales de las noticias en desarrollo puesto que “el lector digital quiere el directo permanente“.

Algunos comentarios a estos artículos agradecen los consejos para una mejor redacción en la Web, como el uso de la dislocación a la izquiera en los títulos, sin embargo, uno de ellos lamenta esa búsqueda incesante de brevedad en la lengua de los nuevos medios:

De acuerdo con casi todo. Sin embargo, como educador tengo reparos frente a la frase corta elevada a férrea ortodoxia. De acuerdo, las subordinadas requieren más esfuerzo mental. ¿Eso es malo? ¿No corremos el riesgo de que esos músculos se atrofien por falta de uso? – EndivioR

Por un lado, la usabilidad, tal y como se entiende aquí, promueve el acceso directo a los conceptos e ideas que vehicula un texto, lo que hace más fácil la lectura por parte del lector y, no menos importante, por parte de los buscadores en Internet. Por otro lado, estamos de acuerdo en que la brevedad en todos sus componentes (títulos, oraciones, párrafos), la estratificación de los datos y el recurso a un presente o directo permanente pueden llegar a simplificar el texto en extremo y promover a la larga una lectura en superficie y quizás superficial de  textos digitales y no solo. ¿Cómo conjugar, pues, estos dos aspectos de la gramática multimedia?
Categorías:gramática multimedia, reseñas Etiquetas: