WonkaPistas

10.12.08

El peor gráfico que he visto en bastante tiempo

Lo he encontrado en el primer volumen del último Informe Juventud en España, la edición de 2008, cuyo texto, dividido en tomos de considerable tamaño, puede descargarse aquí.

Ese primer volumen, al menos en sus inicios, está lleno de datos (que aportan poco al conocimiento de la situación de los jóvenes, por cierto). Lo peor es que muchos de los gráficos y cuadros que los contienen están puestos porque sí, sin que formen parte de un argumento o una descripción, y sin que se mencionen en el texto. Es el caso del gráfico en cuestión, para mí, incomprensible. Vean:



No crean que al  leer el texto (el gráfico se encuentra en la página 46) lo van a comprender. No se menciona. Entiendo que su objetivo es mostrar que cada vez se dan más nacimientos de madre no casada, y que ese fenómeno varía (¿o no?) según la edad de que se trate. Pero, entonces, con los años elegidos deberían haber comparado el número de nacimientos de madre no casada en porcentaje del total de nacimientos. Así, por ejemplo, podríamos haber sabido si dicho porcentaje aumenta, entre 1996 y 2006 para, qué se yo, las mujeres de 15 años, o para las de 27 años. 

Sin embargo, lo que han hecho ha sido, primero, calcular esos porcentajes de  nacidos de madre no casada para los años 1996, 1999, 2003 y 2006 y, después, pásmense, los han colocado en barras apiladas que suman 100% para cada edad. Es decir, calculan los siguientes porcentajes para las mujeres de 15 años, por ejemplo: 85,6%, 89,2%, 94,3% y 95,2%. Y luego los suman (??) y calculan el porcentaje que cada uno de esos porcentajes representa sobre la suma total (364,4): 23,5%, 24,5%, 25,9% y 26,1%. Eso es lo que significan las barras del gráfico. O sea: no significan nada.

Imagino que un gráfico sensato, con sus mismos datos, habría sido uno como éste.


En realidad, si lo que queremos mostrar es el cambio entre 1996 y 2006, sobrarían las curvas correspondientes a 1999 y 2003 (¿por qué habrán elegido esos años?). Si nos fijamos en las curvas de 1996 y 2006 tenemos la información sincrónica y diacrónica adecuada. Sincrónica: comprobamos el patrón de nacimientos de madre no casada por edades, con porcentajes altísimos entre las madres muy jóvenes y muy bajos en las de mayor edad (aunque el porcentaje sube algo al acercanos a los 40). Diacrónica: en todas las edades aumentan los porcentajes, pero parecen hacerlo más entre los 23 y 33 años, más o menos. Por supuesto, si se incluye el gráfico, no es necesario insistir incluyendo, además, la tabla de datos aparte, pero eso es un defecto tan extendido que no merece la pena, casi, ni mencionarlo.

Etiquetas: , , ,

7.5.08

El peor gráfico que he visto en mucho tiempo

El Consejo General del Poder Judicial acaba de publicar un informe con estadísticas de una muestra de sentencias de homicidios o asesinatos de mujeres a manos de su pareja o ex-pareja. Podría ser interesante, pero no lo es mucho, por razones como las siguientes:

a) no nos cuenta casi nada relevante que no sepamos;
b) tiene algunas observaciones de perogrullo estupendas (lo del "caracter sorpresivo" de las agresiones desde el punto de vista de las víctimas es auténtico);
c) contiene intentos denodados por interpretar todo en términos de "violencia de género", sin razonamientos claros al respecto;
d) extrañamente, parece deleitarse en la descripción y cuantificación (confusa, eso sí) de los medios utilizados por los varones para matar a sus parejas, quizá porque no tienen muchos más datos que llevarse a la boca y tienen que engordar el informe como sea;
e) establece relaciones entre series de datos que no se sostienen ni a simple vista (véase la página 20, por ejemplo); y
f) lo peor, para un maniático de los datos y su presentación como yo, está apoyado en gráficos, en general, poco aclaratorios.

De todos ellos, el que casi me tira de la silla de mi despacho es el siguiente, que incluyo con el texto referido a él.


Hagan click en él para verlo mejor, aunque no se ve bien del todo porque, por alguna razón que se me escapa, el pdf del informe está protegido y no se puede copiar texto ni gráficos. Como se ve, se han hecho un gran lío con los porcentajes. Suman 100 horizontalmente. Esto es, por ejemplo, de los homicidios cometidos entre las 9 y las 14h, el 83,8% son simples y el 16,2% son mixtos. Sin embargo, en vez de apilar esos porcentajes, han apilado, por un lado los porcentajes de simples en todas las franjas horarias y, por otro, los de mixtos en todas las franjas horarias. Lo cual no significa nada.

Con esos datos, el gráfico tendría que haber sido así:


Aquí sí que se ve con claridad el porcentaje de simples/mixtos para cada franja horaria, aunque seguimos sin tener una imagen clara de cómo se distribuyen los simples y los mixtos por franjas horarias.

Con los datos de ese gráfico y otros que aparecen más arriba en el informe, puede construirse el siguiente gráfico, que es el fetén, fetén, y no es porque lo diga yo :-)



Este gráfico muestra cómo los homicidios mixtos tienden a ocurrir algo más por la noche que los simples y algo menos por la mañana. No es que importe mucho: el número de sentencias analizadas es pequeño (132) y es especialmente pequeño el de homicidios mixtos (35), de modo que, sólo con añadir los datos, digamos, de 2006 (la muestra va de 2001 a 2005), podían cambiar bastante los porcentajes, que, por otra parte, tampoco son tan distintos.

De verdad que muchos de los gráficos del informe son todo menos aclaratorios. Estoy por ofrecerles mis servicios como elaborador de gráfico, a un precio módico. Todo sea por la justicia en España y por que se "visibilicen" mejor las conclusiones de sus grupos de expertos.

Etiquetas: , ,