(0) Bienvenida


Hola, bienvenidos todos a este curso sobre representaciones gráficas. Utilizaremos este sitio, este blog, como elemento fundamental para el desarrollo del curso. 

El curso está on-line y asíncrono (salvo que decidamos organizar alguna videoconferencia). La forma en que está provisto desarrollarlo es:

- Una serie de materiales (textos, enlaces, etc.) para trabajar independientemente

- Algunos ejercicios que habrá que realizar

Además de los enlaces que iré poniendo en cada tema (entrada del blog), haré referencia de vez en cuando a un libro que escribí hace unos años. Está de libre descarga en ESTE enlace que dejo aquí y que no volveré a repetir cada vez que me refiera al libro, si os lo bajáis ya pdéis ir a las páginas que se indiquen cada vez. El libro se titula "Gramática de las gráficas. Pistas para mejorar tus representaciones de datos", y lo publico la editorial de mi universidad en 2005. 


Una visión rápida sobre lo que nos ocupa, representaciones visuales de información, de datos numéricos:

The Value of Data Visualization from Column Five on Vimeo.

(1) Presentación

Comenzamos con un vistazo general de las cuestiones que vamos a desarrollar en este curso. Para ello he preparado una presentación sobre la que he grabado una explicación en audio, así puedo transmitir mejor las ideas generales y el punto de vista personal. A partir de aquí, las demás actividades se basarán en materiales de otras personas.



(2) Convertir datos en información

 No es raro que haya estudiantes que en sus giones de prácticas conviertan unos pocos datos en  gráficas muy grandes, que busquen rellenar páginas y que parezca que hay mucho trabajo ahí. En noticias de periódico o televisión encontramos gráficas que no tienen más función que ilustrar, dar color, aligerar el texto, decoración a fin de cuentas. No parece que sean motivaciones legítimas, hay mejores formas de decorar y de demostrar que se ha trabajado.

Las buenas representaciones son las que descubren una hitoria a partir de un conjunto de datos. Puede ser una historia mínima (tipo "este valor no cambió nada con el paso del tiempo mientras se hizo el experimento") o pueden ser historias impresionantes, que no sabíamos que se escondían en esos datos o bien que sospechábamos y fuimos a buscar entre los datos disponibles.

A continuación vamos a ver un par de vídeos sobre magníficas historias basadas en datos. La primera de un periodista, la segunda de un profesor de salud pública.

 

 David McCandless, The beauty of data visualization (link en TED)

Los datos son como petróleo. Los datos son como el suelo, fértil y capaz de dar una inmensa producción. En inglés el enlace entre ambas metáforas es mucho más bonito: oil, soil. La importancia de los datos para generar una imagen coherente de los problemas, la necesidad de poner esos datos en relación para que seamos capaces de comprenderlos con propiedad. 

La importancia de la percepción visual como mecanismo de acceso a grandes cantidades de datos contextualizados. Aunque el tema esté tratado en la charla de una forma general, desde una perspectiva periodística, al observarlo desde el punto de vista científico hay dos cuestiones inexcusables: (1) los datos son la materia prima de todo y (2) su visualización revela las relaciones entre ellos. 

A la vista de esto hacer ciencia se puede prácticamente resumir en obtener datos y representarlos (en una aproximación xcesivamente minimalista, pero sugerente).



 

Hans Rosling. Gapminder (link en TED)

No es difícil encontrar datos, datos sobre casi cualquier cosa. El INE tiene montones, así como su equivalente europeo, entre otros muchos lugares. Sabiendo escoger los adecuados se puede profundizar mucho en cuestiones sencillas, pero se puede ir más allá. GAPMINDER.ORG ha desarrollado una base de datos socioeconómicos junto con una herramienta de visualización de los mismos impresionante. De una forma bastante intuitiva, los gráficos que se generan incorporan un montón de información. El usuario puede elegir los datos que representar, cómo quiere hacerlo,... fascinante. Además es conocimiento libre que cada uno puede explorar a su gusto. Para comprender su potencia nada mejor que una conferencia del padre intelectual de la criatura, Hans Rosling. (Además de la forma, el contenido merece mucho la pena los 20 minutos que dura.

 

(3) Metáforas gráficas y percepción

Como decíamos en la introducción una gráfica consiste en transformar unos datos numéricos en una representación (utilizando una metáforma gráfica) que se perciba visualmente (sacando el mejor partido de la percepción visual).

El objetivo de esta "clase" (el conjunto de materiales que os dejos a continuación) es poder profundizar en esas dos cosas:

1.- Metáforas gráficas

2.- La percepción visual de gráficas

--------------

Metáforas gráficas

Esta figura, con su obviedad autoreferencial, está generada como un chiste. De hecho procede de un un blog, ya cerrado (GraphJam) donde el autor publicaba "chistes- gráfica", como este, uno tras otro sin texto.

Las gráficas son elaboraciones construidas para hacer directamente visible información cuantitativa. Se convierten números en imágenes diréctamente percibibles por el sentido de la vista y que transmiten (cuando están bien hechas) la información que contenían los números pero prescindiendo de ellos. Para conseguir ese propósito se utilizan "metáforas visuales", un concepto que puede resultar difícil y abstracto pero que se hace obvio en la tarta de la figura. Todas las gráficas de tarta son una metáfora de una tarta real como esta (o como esta otra).

Más sobre esto, el capítulo 1, "La comunicación gráfica", y más en concreto el apartado "Estructura básica de la comunicación gráfica" (página 33) del libro Gramática de las gráficas.

Tipos de signos gráficos: icono, indicio, símbolo, pictograma, ideograma y otros. Una clasificación muy limpia de elementos de comunicación gráfica en este texto de "pensamientovisual.es" AQUÍ

------------------

Percepción visual

El problema de hacer perceptible de maneras intuitivas, o casi, conjuntos de datos es toda una disciplina académica denominada "visualización". Es sorprendente el desconocimiento general sobre esta cuestión incluso entre los que utilizamos gráficas a menudo. Las gráficas forman parte de un lenguaje gráfico, sobre el que recibimos nula formación. No como ocurre con el lenguaje verbal, sobre el que cursamos asignaturas a lo largo de toda la enseñanza obligatoria.

Esta página sobre percepción en visualización es fantástica. El texto está ilustrado con muchas figuras (y aplicaciones para que modifiques escenarios experimentales) que hacen que se pueda seguir la idea solo con ellas. Muy recomendable echar un vistazo por lo menos.

 

(9) Recursos para profundizar un poco (y pasarlo bien)

 Hasta aquí nos hemos limitado a lo más básico de una gráfica: 

1.- qué es (comunicación gráfica haciendo que se perciban por la vista datos numéricos)

2.-qué elementos son esenciales (definir bien la magnitud representada y etiquetar los ejes)

3.- y qué errores hay que evitar siempre (las representación 3D)

Pero lógicamente hay muchísimo más. Pero en vez de enrollarme yo, mejor dejo unos enlaces a algunos sitios recomendados, sitios por los que se puede "pasear" deteniéndose más en unos lugares u otros dependiendo de lo que nos llame la atenación en cada momento, aciertos, errores, gráficos famosos, históricos, excelentes, horribles...

Comienzo por ESTA galería de Michael Friendly, que lleva en la red más de 15 años, y que sigue siendo excelente para mi gusto. El que sea una "antigualla" de internet ayuda a dejar claro que los conceptos fundamentales de este tema no son cuestión de modas sino elementos clave de la comunicación y la percepción.

Podemos continuar por algo mucho más breve, seis ideas lanzadas con energía y gracia y que no dejan de ser verdades interesantes (enlace AQUÍ):


Tres enlaces más, un poco viejos, de cuando escribí el libro "Gramática de los gráficos", pero que siguen teniendo interés, y algún otro más reciente:
  • Un tutorial breve y practicón, pero preciso: http://www.alzado.org/think/graficos.html
  • La página personal de Yuri Engelhardt: http://www.yuriweb.com/
  • Eduard Tuftee, pionero y profeta de la visualización y en particular de las gráficas: http://www.edwardtufte.com/tufte/index
  • Galerías de representaciones en museos, por su valor histórico y artístico, en un hilo de twitter 
  • "Gráficas de mierda entelevisión", un análisis de algunas gráficas realmente malas, por Vary 

 

El lugar definitivo para pasar horas, una galería de galerías. Colección de 30 sitios cada uno de los cuales es una galería de visualizaciones:

http://visualoop.com/blog/11044/30-amazing-data-viz-galleries-everyone-should-follow

-----------------------------------

Y a partir de aquí más cosas, variopintas

Hands-On Data Visualization
Interactive Storytelling from Spreadsheets to Code
Jack Dougherty, Ilya Ilyankou,         2020-12-14

 

 

(4) Reglas básicas (1/2) - La variable representada y los ejes.

Lo más básico para hacer una gráfica es que se sepa lo que se está representando: qué variable y en qué ejes. Eso es lo que se pretende mostrar esqumáticamente en esta figura que sirve de "logo" para la asignatura con las letras A,B y C (que además son el comienzo del abecedario dando a entender el inicio, lo básico).

Sobre el hecho de que hay que etiquetar los ejes hay algunos chistes, y es una norma muy básica que se entiende fácilmente. Pero más importante aún, y más olvidado, es la C de la figura ¿qué estamos representando? 

------------------------

Un ejemplo de dificultad con la magnitud representada.

No siempre es tan evidente como parece, y para analizarlo vamos a ver un ejemplo reciente, tomado de El País a través de un hilo de Twitter de Kiko Llaneras:

En la gráfica lo que queda claro es que se representan "casos, ingresos y muertes" (se trata de una comparativa de la evolución de la pandemia entre países). Pero ¿como es que casis e ingresos van casi igual? Hay que ir a la "letra pequeña" de abajo para saber realmente qué es lo que se prepresenta... o para intentarlo. En principio yo de esa leyenda entiendo:

- Casos diarios notificados. ¿totales o por cada 100.000 habitantes?

- Personas ingresadas por cada 100.000 habitantes

- Muertes diarias por cada millón de habitantes

Entendemos que casos nuevos, no el acumulado, por eso pueden bajar las curvas (como hacen en algún caso). Quizá los casos diarios son totales y no una ratio, y por eso las curvas están tan próximas...

Vemos que, incluso en este caso, de un excelente periodiata de datos, en un medio muy importante, nos encontramos con que no sabemos realmente qué es lo que se representa y hemos de andar haciéndo hipótesis y suposiciones basándonos en nuestro conocimiento del problema. Esto en el periódico se puede tolerar, o al menos estamos acostumbrados a que ocurra. En mi opinión esto es intolerable en un artículo científico. Además tiene que quedar suficientemente claro con la gráfica y su pie de figura, no vale pensar que en el texto ya está la explicación detallada; los textos y sus figuras no siempre van juntos.

---------------------

Sobre los ejes,

Poco más que decir aparte de lo obvio (veanse estos dos chistes). Bueno, en realidad sí, es muy importante saber si los ejes son lineales o logarítmicos (o alguna otra variante que puediera ocurrir), y también es importantísimo que quede claro dónde está el origen, si el cero no aparece pueden generarse importantes malentendidos (ya veremos ejemplos).


-----------------

El sujeto y el predicado 

En el libro que escribí explotaba la analogía del lenguaje gráfico con el lenguaje natural, el texto. En esa analogía la variable representada es el sujeto, es aquello de lo que el resto de la gráfica dice cosas (el predicado). Que si los casos suben, bajan, se estabilizan, son más en un sitio que en otro, etc. Pero si no sabemos que la gráfica habla de "casos" (y qué son realmente) todo lo que digas de ellos carece de sentido.

Para profundizar un poco más en esta analogía, el capítulo 3, 16 páginas (de la 51 a la 67)

 

(5) Reglas básicas (2/2) - Un decálogo

 Avanzando un poco más que lo de la variable representada y los ejes, y por cambiar de autor, un decálogo:

Un artículo interesante y práctico. Con 10 ideas sencillas, cada una bien explicada e ilustrada con figuras claras. Está en libre acceso AQUÍ. La introducción y la lista de las reglas es:


Scientific visualization is classically defined as the process of graphically displaying scientific data. However, this process is far from direct or automatic. There are so many different ways to represent the same data: scatter plots, linear plots, bar plots, and pie charts, to name just a few. Furthermore, the same data, using the same type of plot, may be perceived very differently depending on who is looking at the figure. A more accurate definition for scientific visualization would be a graphical interface between people and data. In this short article, we do not pretend to explain everything about this interface; rather, see [1], [2] for introductory work. Instead we aim to provide a basic set of rules to improve figure design and to explain some of the common pitfalls.


Rule 1: Know Your Audience
Rule 2: Identify Your Message
Rule 3: Adapt the Figure to the Support Medium
Rule 4: Captions Are Not Optional
Rule 5: Do Not Trust the Defaults
Rule 6: Use Color Effectively
Rule 7: Do Not Mislead the Reader
Rule 8: Avoid “Chartjunk”
Rule 9: Message Trumps Beauty
Rule 10: Get the Right Tool 

[1] Tufte EG (1983) The Visual Display of Quantitative Information. Cheshire, Connecticut: Graphics Press.
[2]  Doumont JL (2009) Trees, maps, and theorems. Brussels: Principiae.