Investigación, Comunicación y Universidad. Research, Communication and University.

Proyectos I+D y Tesis doctorales, Debates y Encuestas a investigadores en las Facultades con Grados en Comunicación

 

 

Título del Capítulo: «Visualización interactiva de la metainvestigación»

Autoría: María Elena Melón Jareda

Melón Jareda, M.E. (2018): «Visualización interactiva de la metainvestigación». En Piñuel, J.L. (dir.); Caffarel, C; Gaitán, J.A.; Lozano, C.; (eds.), Investigación, Comunicación y Universidad. Research, Communication and University. Proyectos I+D y Tesis doctorales, Debates y Encuestas a investigadores en las Facultades con Grados en Comunicación. Salamanca: Comunicación Social Ediciones y Publicaciones.

ISBN:978-84-17600-12-9

d.o.i.: https://doi.org/10.52495/c4.emcs.18.mic7

 

 

 

4. Visualización interactiva de la metainvestigación

 

 

María Elena Melón Jareda1

 

 

Por visualización de datos se entiende cualquier tipo de representaciones visuales que soportan la exploración, análisis y comunicación de un conjunto de datos. Para algunos autores (Chen et al. 2013) su objetivo es facilitar procesos cognitivos efectivos y eficientes en la realización de tareas que involucren datos, donde la medida de la efectividad es la exactitud, y donde la medida de la eficiencia es la cantidad de tiempo requerida para efectuar una tarea. Para otros (Few, 2009), las visualizaciones amplifican nuestra cognición, auxiliando a nuestra memoria y representando datos de una manera que nuestro cerebro puede comprender con facilidad. Para cumplir con estos objetivos, todos los aspectos gráficos del diseño deben servir principalmente para presentar la información con claridad. Colores, formas y tipografía deben guiar al usuario y proveer significado, mientras que el acceso a los datos debe ser lo más directo posible sin sacrificar la complejidad que sea relevante y necesaria (Steele y Iliinsky, 2010).

Las visualizaciones dan acceso a los datos para que el usuario pueda obtener conocimiento. Al proveer vistas alternativas, revelan propiedades, relaciones, excepciones, tendencias y patrones, a veces inesperados, que se encuentran ocultos en la información.

Entre las visualizaciones de datos existen las estáticas y las interactivas. En las primeras sólo se presenta información, mientras que en las segundas los datos pueden ser manipulados para realizar acciones como filtrar o enfocar la atención en detalles. La interacción ofrece un control en la exploración de la información y la obtención de respuestas que empodera al usuario (Murray, 2017).

Para este proyecto de investigación se programaron visualizaciones de datos interactivas. La primera de ellas, muestra una representación cartográfica de todas las tesis doctorales y proyectos I+D del campo de la Comunicación realizados en España del año 2007 al 2013 (https://mapcom.es/includes/mapas/tesis_doctorales/ y https://mapcom.es/includes/mapas/proyectos/). La segunda muestra la visualización de los Grupos de Investigación localizados en las universidades españolas con titulaciones de grado y posgrado en Comunicación (https://mapcom.es/includes/mapas/grupos_investigacion2/). Y la tercera visualiza las respuestas a la encuesta aplicada al censo de investigadores (https://mapcom.es/includes/mapas/encuestas/). Vamos a centrar la exposición en el método seguido para la elaboración de la primera y de la tercera de estas visualizaciones por ser las más interactivas de cara al análisis de datos, mientras que la segunda permite más la búsqueda de datos que su análisis interactivo. El método utilizado para la elaboración de ambas visualizaciones consta de las siguientes etapas:

1. Revisión y análisis de la información.

a) Estructura de las tablas.

b) Importancia de la codificación.

c) Selección del paradigma de programación y de estructuras internas de datos.

2. Diseño e implementación de la representación visual.

a) Representación cartográfica.

b) Criterios de representación de la visualización de tesis y proyectos.

c) Criterios de representación de la visualización de la encuesta.

3. Diseño e implementación de la interacción.

4. Refinamiento de la visualización.

 

Revisión y análisis de la información

 

El primer paso que se llevó a cabo para crear las visualizaciones fue una revisión y análisis general de las tablas (Bases de Datos) en las que se encuentra guardada toda la información recopilada del proyecto MapCom. Era necesario comprender la estructura de los datos y las relaciones existentes entre ellos para transformar esa estructura inicial en una representación gráfica, de modo que la estructura pudiera ser examinada visualmente y se pudiera interactuar con ella (Chen, 2006). Era esencial que las representaciones visuales e interacción fueran las más adecuadas para dar respuesta a la preguntas de la investigación y permitir una navegación sencilla a través de la información.

También era importante conocer la codificación de los datos, así como revisar su consistencia a lo largo de las tablas, para asegurar que a través de la programación computacional se obtuvieran los resultados correctos.

 

Estructura de las tablas (Bases de Datos)

 

La tabla que contiene toda la información de las tesis doctorales y proyectos I+D del proyecto MapCom (https://mapcom.es/bases-de-datos/) cuenta con 57 columnas y 1120 filas (más una fila o renglón de encabezados). Cada fila o renglón corresponde a una tesis o proyecto, mientras que cada columna identifica a un campo o dato particular (variables) de ese trabajo (Ver Cuadro 6).

Cuadro 6. Campos de la tabla de tesis doctorales y proyectos I+D.

Columna

Encabezado de

la columna

Valores

0

ID

Identificador único para cada documento

1

Documento

Tipo de documento: Tesis Doctoral o Proyecto I+D

2

Autoría

Nombre del autor

3

Género

Género del autor: Hombre o Mujer

4

Año

Año de entrega del documento

5

Área

Área geográfica a la que pertenece la universidad: Área 1, 2, 3, 4

6

Título

Título de la tesis doctoral o proyecto I+D

7

Universidad

Nombre de la universidad en la que se realizó

8

Acrónimo

Identificador único para cada universidad

9

Titularidad

Titularidad de la universidad: 1 para universidad pública, 2 para universidad privada

10

Autonomía

Autonomía en la que se encuentra la universidad

11

Idioma

Idioma en el que está escrito el documento

12

Objetivos

Objetivo del documento: Evaluar, Describir,

Explicar, Intervenir o NP/NC

13

Camponatural

Sí, No

14

Campoexperimental

Sí, No

15

Campodocumental

Sí, No

16

Campoacción

Sí, No

17

Constacampo

Sí, No

18

Contracampo

No existe, Sí existe

19

Contracamponatural

Sí, No

20

Contracampoexperimental

Sí, No

21

Contracampodocumental

Sí, No

22

Contracampoacción

Sí, No

23

Objetodeestudio

Tipo de objeto de estudio del trabajo: De Masas convencional, De Masas en línea, Grupal en línea, Grupal presencial, Interpersonal en línea, Interpersonal presencial, Organización en línea, Organización presencial y Otros

24

Objetoagrupado

Objeto de estudio agrupado: De Masas, Grupal, Interpersonal, Organizaciones y Otros

25

Virtualidadobjeto

Virtualidad del objeto de estudio: On-line, Off-line, Otros y NP/NC

26

Sivariosobjetos

Descripción del objeto de estudio

27

Entornoescenario

Escenario del objeto de estudio: De Masas convencional, De Masas en línea, Grupal en línea, Grupal presencial, Interpersonal en línea, Interpersonal presencial, Organización en línea, Organización presencial, Varios, Otros y NP/NC

28

Virtualidadescenario

Virtualidad del escenario: On-line, Off-line, Otros y NP/NC

29

Sivariosescenarios

Descripción del escenario

30

Muestras

Tipo de muestra utilizada: Estructurales, Intencionales, Probabilísticas, Significativas de población, No hay muestra y NP/NC

31

Datos

Tipo de datos utilizados: Cuanti-cuali, De atributo, De variación, Lógicos, Paramétricos y NP/NC

32

Técnicadominante

Técnica principal utilizada: Conversaciones, Documentos, Encuestas, Experimentos, Observaciones y NP/NC

33

Observaciones

Tipo de observación realizada: Auto-observación, Observación participante, Observación sistemática, Varias y No consta

34

Entrevistas

Tipo de entrevistas realizadas : Delphi, Dinámica grupal, Entrevistas personales, Focus groups, Phillips 66, Socioanálisis conversacional, Varias y No Consta

35

Encuestas

Tipo de encuestas realizadas: Encuesta de actitudes, Encuesta de opinión, Varias y No consta

36

Experimentos

Tipo de experimentos realizados: Experimentos de campo, Experimentos de grupo, Experimentos de sujeto, Varios y No consta

37

Documentos

Tipo de documentos: Análisis de contenido, Análisis de discurso, Documentación, Varias y No consta

38

Trianguladocumentos

Sí, No

39

Triangulaexpertos

Sí, No

40

Triangulamodelos

Sí, No

41

Triangulamétodos

Sí, No

42

Sintriangular

Sí, No

43

Npnc

Sí, No

44

Palabrasclave

Palabras claves del trabajo

45

Soporte

Tipo de soporte: Cartel, Cibermedios, Cine, Espectáculos, Internet, Libros, Poesía, Prensa, Radio, Telefónico, TV, Videojuegos, Varios y NP/NC

46

Prac.Profes

Prácticas profesionales: Biblioteconomía, Cinematografía, Educación, Escritura, Periodismo, Marketing, Fotografía, Publicidad, Musicología, Iconografía, Varios, Otros y NP/NC

47

Prac.Soc

Prácticas sociales: Consumo, Producción, Distribución, Regulaciones, Representaciones, Varios, Otros y NP/NC

48

Relaciones

Tipos de relaciones: Amistad, Amorosas, Familiares, Ocio, Profesionales, Varios y NP/NC

49

Dimensiones

Tipos de dimensiones: Artística, Ciberespacial, Fisiognómica, Proxémica, Verbal, Varios y NP/NC

50

Códigos

Códigos usados: Amplios, Metafóricos, Restringidos, Varios y NP/NC

51

Sociodemográficos

Sociodemográficos: De edad, De género, De rol y status, Varios y NP/NC

52

Culturales

Culturales: De estigma, De etnia, De filiación, De nacionalidad, De pertenencia, Varios y NP/NC

53

Comunicacionales

Comunicacionales: De audiencias, De profesionales, De prosumidores, Personajes, Relato, Varios y

NP/NC

54

Porobjetivos

División de las organizaciones por objetivos: Arte, B to B, Com. Interna, Crisis, Documentación, Eventos, Formación, Publicidad, Regulaciones, RR. Prensa, RSC, Sponsoring, Varias y NP/NC

55

Pornaturaleza

División de las organizaciones por naturaleza: Administración, Artes, Empresas, Enseñanza, II. Públicas, ONG’s, Partidos, Sindicatos y AA. Prof, Varias y NP/NC

56

Porfunción

División de las organizaciones por función: Administraciones, Agencias Prensa, Agencias Publicidad, Comunidades étnicas, Consultorías, Enseñanza, Gabinetes prensa, Grupos mediáticos, Lobby, Medios, Organizaciones educativas, Participación ciudadana, Productoras, Varias y NP/NC

 

 

Por otro lado, la tabla que guarda las respuestas a la encuesta aplicada al censo de investigadores cuenta con 129 columnas y 838 filas (más un renglón de encabezados). Cada renglón guarda las respuestas dadas por una persona, mientras que cada columna corresponde a una pregunta específica de la encuesta o a información general de la misma, como identificador único, fecha de inicio y de fin. Las dos bases de datos fueron convertidas a archivos de texto delimitados por tabuladores, un formato fácil y seguro de leer por diferentes lenguajes computacionales.

Importancia de la codificación

Como parte de la revisión de la información se verificó que todos los datos estuvieran consistentemente codificados. Por ejemplo, que el acrónimo de una universidad estuviera escrito exactamente de la misma forma cada vez que se hiciera referencia a esa universidad o que la respuesta «Sí» estuviera escrita con mayúsculas y acento en todas las ocasiones en que se usara. Esta consistencia es esencial para que el programa que genera la visualización arroje los porcentajes, radios y colores correctos.

 

Selección del paradigma de programación y de las estructuras internas de datos

 

A partir del análisis de la estructura de la información contenida en las tablas o bases de datos, se decidió utilizar el Paradigma Orientado a Objetos (POO) para codificar la visualización. Este paradigma de programación permite representar la información como objetos que se relacionan entre sí, en este caso, de tipo Tesis, Universidad, Autonomía, Encuesta, etc., lo que resulta bastante intuitivo y directo a partir de las tablas. Internamente se usó como estructura de datos principal una tabla indexada de universidades, en donde cada universidad tiene asociada una lista de documentos (tesis o proyectos I+D), que a su vez, tienen una colección de atributos y funciones.

El lenguaje de programación seleccionado para implementar las visualizaciones fue Processing por la facilidad que ofrece para programar orientado a objetos, leer archivos de texto tabulados, dibujar e implementar la interacción del usuario. Además, permite convertir la aplicación para ser desplegada en una página web, lo que constituye la forma más rápida y sencilla de alcanzar una audiencia global (Murray, 2017).

 

Diseño e implementación de la representación visual

 

Dados los campos de la tabla de tesis doctorales y proyectos I+D, se observó que podría haber varios criterios de agrupación visual de los trabajos: por tipo de documento, por el año de creación o por el objeto de estudio, entre otros. Sin embargo, se descubrió que las 1120 tesis doctorales y proyectos I+D pertenecían a sólo 39 universidades que podían ser representadas con claridad en un mapa de España, permitiendo al usuario explorar la información espacialmente de una manera natural e intuitiva (Chen, 2006) y navegar de lo general a lo específico. Una representación cartográfica sería valiosa además para los usuarios que están familiarizados con el territorio de España, porque les permitiría proyectar su contexto personal sobre la visualización y sacar conclusiones basadas en su propia experiencia del área (Steele y Iliinsky, 2010).

En el caso de la base de datos de la encuesta existía también información sobre las universidades de los investigadores que la contestaron, así que se decidió que el criterio principal de organización para ambas visualizaciones sería el criterio espacial. El mapa de España se encontraría al centro, dejando espacio alrededor de él para otros elementos importantes como una gráfica de barra que mostrara porcentajes, una línea de tiempo y botones para los diferentes tipos de documentos y categorías.

 

Representación cartográfica

 

Para lograr una representación cartográfica de la información recabada, surgió la necesidad de agregar coordenadas (x,y) a cada una de las universidades. Un programa auxiliar que captura la posición en pantalla sobre la que se hace clic con el ratón fue codificado con el fin de recuperar estas coordenadas y posteriormente usarlas para dibujar cada universidad.

Dado que colocar estas coordenadas en la base de datos original hubiera supuesto repetir mucha información y habría complicado el mantenimiento de la misma, se creó una nueva base de datos con información específica de cada universidad: acrónimo, nombre, titularidad, autonomía y coordenadas (x,y) en el mapa (ver Cuadro 7).

Cuadro 7. Campos de la tabla de universidades.

Columna

Título de la columna

Valores posibles

0

Acrómino

Identificador único para cada universidad

1

Universidad

Nombre de la universidad

2

Titularidad

Titularidad de la universidad: 1 para universidad pública, 2 para universidad privada

3

Autonomía

Autonomía en la que se encuentra la universidad

4

X

Coordenada x en la pantalla

5

Y

Coordenada y en la pantalla

 

 

Teniendo esta nueva información, cada universidad quedó representada visualmente como un círculo sobre el mapa de España. Dado que el tamaño es una de las representaciones más intuitivas y útiles, porque nos permite comparar y diferenciar rápidamente dos números desconocidos (Steele y Iliinsky, 2010), se utilizaron diferentes radios para estos círculos. En el caso de la primera visualización, el radio de cada círculo es proporcional al número de trabajos entregados en dicha universidad, mientras que para la segunda visualización el radio corresponde al número de respuestas a la encuesta recibidas de esa universidad. En ambos casos se estableció un radio mínimo y uno máximo que permitiera al usuario de la visualización distinguir fácilmente todas las universidades. El número de círculos, su distribución y tamaños guían la atención del usuario, haciendo evidente las diferencias. Con tan solo ver el mapa se pueden ubicar rápidamente las regiones con mayor participación. Dado que hay varias universidades que se encuentran a poca distancia, al menos en el mapa, las coordenadas (x,y) utilizadas son aproximadas, no exactas, a la ubicación geográfica real de cada universidad. Existió la necesidad de ajustar ligeramente el valor de las coordenadas para que las universidades no se amontonaran y la interacción fuera fluida.

Criterios de representación de la visualización de tesis y proyectos

La visualización de las tesis doctorales y proyectos I+D es la que cuenta con mayor complejidad y por lo mismo tiene un número mayor de criterios de organización de la información. De todos los posibles criterios, se seleccionaron el temporal, tipo de documento, autonomía, género, objetivos, técnicas y objetos de estudio por ser los más relevantes para la investigación.

 

Criterio Temporal

 

Después del criterio de organización espacial, el temporal es el más importante, porque nos permite observar y entender con claridad los cambios que ocurren con el paso del tiempo. Los documentos investigados en el proyecto MapCom van del año 2007 al 2013, de modo que hay un rango razonable de tiempo que puede ser manipulado. En la parte superior de la visualización se colocó una barra de tiempo que puede deslizarse para mostrar el acumulado de trabajos realizados del año 2007 hasta el año seleccionado, teniendo como límite el 2013. El tamaño de los círculos que representan universidades se actualiza a tiempo real de acuerdo al número de trabajos realizados en ese rango de años. Esta funcionalidad permite apreciar cómo han ido creciendo el número de trabajos, cuáles han sido las universidades protagonistas de dicho crecimiento y cuántas se han ido incorporando a lo largo de los años. En 2007 había sólo 17 universidades involucradas y un total de 48 documentos. Para el 2013 el número de universidades se incrementó a 39 y los documentos a 1120.

 

Tipo de documento

 

Para este proyecto se tomaron en cuenta dos tipos de documentos: Tesis doctorales y Proyectos I+D. A la derecha del mapa se despliegan tres botones que permiten seleccionar sólo las tesis doctorales, sólo las investigaciones de Proyectos I+D o bien todos los documentos a la vez. De esta manera se puede reconocer rápidamente que para el año 2013 había 143 proyectos I+D, un número mucho menor que de tesis doctorales, que para ese año eran ya 977. Por otro lado, se observa que en 28 universidades hay proyectos I+D, mientras que en 36 hay solo tesis doctorales. La visualización también ofrece la oportunidad de apreciar los porcentajes de cada tipo específico de documento con respecto a los criterios que se describen más adelante.

 

Autonomía

 

Las universidades investigadas a las que pertenecen las tesis doctorales y proyectos I+D están localizadas en 14 autonomías divididas en 4 áreas. El Área 1, representada en azul claro, incluye a la Comunidad de Madrid, Castilla y León y Castilla-La Mancha. El Área 2, en verde, comprende a Galicia, la Comunidad foral de Navarra, el País Vasco y Aragón. El Área 3, en naranja, incluye Andalucía, Extremadura y Canarias. Finalmente, el Área 4, en azul, está compuesta por Cataluña, las Islas Baleares, la Comunidad de Valencia y la Región de Murcia.

En cualquier visualización el color es un método de representación importante. Podemos identificar y diferenciar gran cantidad de tonos y gradaciones de color, lo que hace de esto la elección natural para representar tendencias (Steele y Iliinsky, 2010) y organizar la información en grupos.

En esta visualización el color permite ubicar con rapidez a qué áreas pertenecen las diferentes universidades. La gráfica de barra vertical de la izquierda da información exacta sobre el porcentaje de trabajos que pertenecen a cada universidad (Ver Imagen 1).

 

Género

 

La visualización permite conocer el porcentaje de mujeres y hombres que han escrito tesis doctorales y proyectos I+D en un determinado periodo de tiempo. Se utilizan dos colores diferentes para hacer la distinción y revelar ciertas tendencias. Por ejemplo, hasta el año 2013, 100 proyectos I+D habían sido escritos por hombres, lo que representa casi el 70% del total, mientras que 43 (30%) habían sido escritos por mujeres. En cuanto al total de documentos se refiere, no hay una diferencia importante a destacar entre los porcentajes.

Tanto para el criterio de género, como el de objetivos, técnicas y objetos de estudio, los círculos que representan a las universidades se muestran en el color que corresponde a la mayoría, permitiendo comparar las preferencias de las universidades. Hablando del criterio de género, se pueden distinguir rápidamente en el mapa cuáles son las universidades que tienen más autoras mujeres que hombres y viceversa.

 

Objetivos

 

Entre los objetivos de las tesis doctorales y proyectos I+D se encuentran describir, explicar, evaluar e intervenir, cada uno representado con un color diferente. El objetivo más utilizado es describir (55.18%) tanto a nivel general, como por universidad. El porcentaje no sólo está escrito en la gráfica de barra vertical, sino que está declarado visualmente en el tamaño de los círculos correspondientes a cada posible objetivo y en el color de cada una de las universidades.

Técnicas

Las técnicas de estudio incluidas en la investigación son documentos, conversaciones, encuestas, experimentos y observaciones. La visualización muestra inmediatamente que los experimentos son la técnica menos utilizada globalmente (1.88%) y por universidad. Sólo un par de universidades aparecen en el color que le corresponde a los experimentos.

 

Objetos de estudio

 

Para los 4 objetos de estudio principales también se consideran sus diferentes categorías, que el lector puede consultar en el Anexo 2, del informe publicado en la Web de MapCom https://mapcom.es/investigacion/:

En la visualización se puede observar de inmediato que el objeto de estudio de Masas es el más común (59.82%), mientras que el Grupal es el menos utilizado (7.5%). La información dada por la gráfica de barra se refuerza con el tamaño del círculo que corresponde al objeto de estudio de Masas y con el color en el que aparecen la mayoría de las universidades (Ver Imagen 2).

Hay una complejidad considerable en mostrar todos los objetos de estudio con sus respectivas categorías y valores al mismo tiempo, así que se decidió representar cada uno de los objetos de estudio por separado. Las categorías de cada tipo de objeto de estudio fueron representadas con botones en la esquina inferior derecha y los valores asociados a las mismas con rectángulos de diferentes colores. Por ejemplo, en el caso del objeto de estudio de masas existen 3 categorías: soporte, prácticas profesionales y prácticas sociales. Para soporte hay 14 diferentes valores. En la visualización se puede distinguir que la prensa (22.84%), el cine (17.76%) y la televisión (17.76%) son los soportes más estudiados (Ver Imagen 3).

 

Criterios de representación de la visualización de la encuesta

 

La visualización de las respuestas a la encuesta aplicada al censo de investigadores cuenta con una complejidad menor, aunque hay un número importante de preguntas y opciones de respuesta que deben ser desplegadas. Por claridad, se seleccionó mostrar las respuestas de cada pregunta, cada vez. Los porcentajes mostrados en la gráfica de barra consistentemente van de mayor a menor, lo mismo que el número de respuestas que se despliegan en los círculos de la parte inferior. El tamaño de todos los círculos es proporcional al número de respuestas recibidas. Sobre el mapa el color que se les asigna a las universidades corresponde a la respuesta que dio la mayoría. Pongamos como ejemplo las respuestas a la Pregunta 3: Acceso al Doctorado o Antigüedad como Doctor. Se puede observar en la visualización que 236 (28.16%) investigadores cuentan con una antigüedad menor a los 10 años, otro porcentaje igual cuenta con una antigüedad de 11 a 20 años, mientras que sólo 22 (2.63%) cuentan con más de 30 años de antigüedad (Ver Imagen 4).

 

Diseño e implementación de la interacción

 

Para ambas visualizaciones la interacción se diseñó para ser muy directa, sencilla y fácil de recordar. El usuario puede explorar espacialmente la información moviendo el ratón por encima de las figuras (círculos, cuadrados y rectángulos) que representan universidades o categorías. Para seleccionar criterios y tipos de documentos, así como para desplegar el detalle de una universidad o de un documento, basta con dar clic con el botón izquierdo del ratón sobre el elemento de interés. El objetivo es empoderar a las personas para que ellas mismas exploren los datos por cuenta propia (Murray, 2017).

Al pasar el ratón sobre el círculo que corresponde a las organizaciones como objeto de estudio aparecen en el mapa los círculos que representan a las universidades que tienen documentos con ese tipo de objeto de estudio. En barra horizontal se despliegan el número de universidades (25) y de documentos (181), mientras que en la gráfica de barra vertical se muestra el porcentaje correspondiente (16.16%). El color tanto de los círculos, como de la barra horizontal y vertical, es el de las organizaciones: morado (Ver Imagen 5).

La navegación va de lo general a lo específico, esto es, de explorar la información de toda España, se puede ir a la información de una universidad en particular y de ahí finalmente llegar a la información de un documento o encuesta específica. La posibilidad de explorar de manera general los datos, así como de ir al detalle, hace accesible la visualización a diferentes tipos de audiencias, los que son neófitos en el tema y los que ya están familiarizados con el mismo y buscan respuestas a preguntas específicas (Murray, 2017).

Al pasar el ratón sobre el círculo que corresponde a la Universidad Complutense de Madrid y tener seleccionado el criterio de Objetos de estudio, por ejemplo, el rectángulo horizontal despliega el número de documentos de cada objeto de estudio en esta universidad en particular, mientras que en la gráfica de barra vertical se muestran los porcentajes de cada uno. El color verde tanto del círculo, como de la barra horizontal, es el del objeto de estudio más común en la Universidad Complutense, que en este caso es De Masas (Ver Imagen 6).

Al dar clic con el botón izquierdo del ratón sobre el círculo de una universidad se desplegará una lista con todos los documentos de esa universidad. En ocasiones esta lista es larga, así que se tiene una barra del lado derecho para deslizar los renglones hacia arriba y poder ver la información completa. En la parte de abajo de la pantalla seguirán visibles todos los criterios de organización, teniendo el último seleccionado aún activo.

Por ejemplo, al dar clic sobre la Universidad Complutense aparece la lista de documentos escritos en esta universidad. Para cada uno se incluye el año, el tipo de documento y el título del mismo. Tanto la barra del tiempo, como los botones de los criterios siguen activos y la lista se modifica a tiempo real según el usuario interactúa con la visualización. Al pasar el ratón sobre los diferentes círculos que preceden cada renglón, el documento actual se sombrea en blanco y al dar clic sobre él se despliega toda la información existente para ese documento (Ver Imagen 7 y 8).

En el caso de la visualización de las respuestas de la encuesta aplicada al censo de investigadores, la interacción es muy similar.

Al pasar el ratón por encima del rectángulo blanco titulado «Mostrar el total de respuestas» se obtienen los números y porcentajes generales de las respuestas a la pregunta actual. Si se desea la información específica de una universidad, por ejemplo, la Universidad de Málaga, bastará con pasar el ratón sobre el círculo correspondiente (Ver Imagen 9).

Para pasar de una pregunta a otra de la encuesta se tienen 2 opciones: utilizar las flecha izquierda y derecha para navegar secuencialmente de una pregunta a otra o dar clic en el botón «Mostrar todas las preguntas» para desplegar la lista con todas las preguntas disponibles y seleccionar una en particular (Ver Imagen 10).

Por otro lado, se tiene la posibilidad de desplegar todas las respuestas dadas por investigadores de una universidad en particular dando clic sobre el círculo correspondiente. La encuesta es anónima, por lo tanto, sólo se cuenta con un identificador numérico único para distinguir entre una respuesta y otra (Ver Imagen 11). Al dar clic sobre un identificador, se despliegan las respuestas a todas las preguntas de la encuesta de ese investigador en particular (Ver Imagen 12).

Aun cuando la interacción en ambas visualizaciones es sencilla, se grabó un vídeo tutorial con el fin de mostrar todas las posibilidades de manipulación y navegación de la visualización de las tesis doctorales y proyectos I+D, mientras que para la segunda visualización se agregó un botón de ayuda en la pantalla principal.

 

Refinamiento de la visualización

 

El último paso en el proceso de creación de las visualizaciones para el proyecto MapCom consistió en agregar detalles sutiles como colores y filtros. También se agregó la activación y desactivación de la barra de tiempo en las diferentes secciones de la visualización.

En las listas de documentos de una universidad se puede observar que cada documento tiene un círculo del lado izquierdo que se rellena de un color diferente dependiendo del criterio activo y del valor para ese documento. Si el criterio actual es objeto de estudio, por ejemplo, los círculos verdes indican que se trata de un documento que tiene la comunicación de Masas por objeto de estudio, los naranjas corresponden a Grupal, los morados a Organizaciones y así sucesivamente (Ver Imagen 7).

En la lista de las respuestas dadas a una pregunta particular de la encuesta ocurre algo similar. Los colores corresponden a las diferentes opciones de respuesta (Ver Imagen 11). El uso de color le permite al usuario obtener información de una manera muy rápida para después decidir de qué documento o respuestas quiere más detalle.

Los filtros se agregaron para agrupar fácilmente y visualizar en bloque todos los documentos con una categoría determinada. Es suficiente pasar el ratón por encima de un círculo correspondiente a una categoría para que la lista quede filtrada. Por ejemplo, la Universidad Complutense tiene un gran número de documentos, pero sólo 4 de ellos tiene como objetivo Intervenir. Si se desea filtrarlos, lo único que debe hacerse es pasar el ratón sobre el círculo de intervenir (Ver Figura 13).

Por último, se refinó el uso de colores para hacer muy evidente qué valores para una categoría en particular están presentes en una universidad.

Por ejemplo, de los 14 soportes posibles en Comunicación de Masas, los documentos de la Universidad Autónoma de Barcelona hacen referencia sólo a cibermedios, cine, prensa, televisión y varios. Los soportes no utilizados quedan en blanco (Ver Imagen 14). El usuario sólo debe pasar el ratón por encima del círculo de la universidad para obtener esta información de manera muy rápida y sencilla.

 

Conclusión

 

La visualización interactiva de datos nos permite manipular y comprender grandes cantidades de información de una manera fácil y rápida. A través del uso de métodos de las ciencias computacionales, del diseño gráfico e interactivo se pueden obtener representaciones visuales que dan respuestas claras a preguntas específicas, en ocasiones complejas, al mismo tiempo que hacen visibles tendencias y conexiones que generalmente no son evidentes entre los datos. A diferencia de las gráficas estáticas que se pueden obtener con diversas herramientas de software, las visualizaciones interactivas de datos permiten al usuario dirigir la exploración de la información de acuerdo a sus intereses y encontrar respuesta a varias preguntas de manera simultánea.

 

1 Profesora del Instituto Tecnológico de Monterrey, mmelon@itesm.mx

Imagen 8. Información detallada de un documento en particular.

Imagen 10. Lista con todas las preguntas de la encuesta.