[OpenData] Copinage dans les hautes sphères : quand l’analyse de réseau vient en aide au journalisme d’investigation

Klicken Sie hier für die Deutschsprachige Ausgabe.

Ce dimanche 25 novembre, la cellule d’enquête du Matin Dimanche/SonntagsZeitung publie les résultats d’une étude qui met au jour les dysfonctionnements du système d’attribution des commandes de la Confédération. Il s’avère en effet que le marché public helvétique est noyauté par la très grande mobilité de ses hauts fonctionnaires, qui, au passage du public au privé (ou l’inverse), font profiter leurs entreprises de la manne gouvernementale. Conclusion, le "Data Journalisme" met à la disposition de la Confédération un outil pour lutter plus activement contre la corruption et le copinage !

Consultez les deux articles :

"Ex-Beamte profitieren vom Filz", l’article en ligne de la SonntagsZeitung

PDF

"Le copinage gangrène les commandes fédérales", du Matin Dimanche

PDF

Les infographies ont été réalisées par Martin Grandjean (historien UNIL), de Pegasus Data.

Le réseau du marché public, cartographie complète

L’infographie

Graphe francophone complet. Cliquez pour agrandir.

Quelques chiffres

Somme totale des échanges représentés : CHF 4’471’080’279 (4.47 Mia).

Nombre d’entreprises : 963

Nombre d’opérations : 1745

OpenData : Créer de l’information par le recoupement de données publiques

Consultez l’explication complète (SonntagsZeitung).

La plate-forme SIMAP recense tous les mandats fédéraux attribués suite à un appel d’offres public (n’y sont pas inclus les très fréquents mandats donnés "de gré à gré", d’ailleurs encore plus susceptibles d’être soumis au copinage). En recoupant les 1745 mandats fédéraux accordés à des entreprises entre 2009 et 2012 avec la liste des cadres des entreprises et des offices concernés pendant une période plus large, on obtient un certain nombre de correspondances qu’il s’agit d’éclaircir. L’équipe a été aidée dans ce travail par InfoCube.ch, d’Orell Füssli Wirtschaftsinformationen.

Le travail journalistique peut donc, une fois cette liste de correspondances établie, se porter sur l’étude de ces quelques cas particuliers, mettant au jour des relations d’affaire teintées de favoritisme ou de copinage. Ce travail sur les bases de données offre une vision que ni la Confédération, ni les entreprises, ni les autorités de contrôle externes n’étaient jusqu’alors en mesure d’apprécier.

Représenter le réseau de transactions sous forme de graphe

Première étape: la conceptualisation

Inutile de rappeler qu’il n’est guère possible de se lancer dans une représentation d’un réseau de milliers de relations sans en définir auparavant les variables et les principes fondamentaux.

Deuxième étape: appréhender le graphe

La visualisation de réseau que nous signons a été réalisée avec Gephi, logiciel OpenSource français.

Cliquez pour agrandir.

Il s’agit pour commencer d’introduire les milliers de données dans le logiciel pour avoir une première idée de la forme du graphe et des ajustements qui s’avéreront nécessaire (ajout de paramètres, reclassement de données, précisions dans les catégories, etc…).

Cliquez pour agrandir.

Dans les deux exemples ci-dessus, les couleurs sont attribuées pour différencier les offices fédéraux par département.

Cliquez pour agrandir.

Mais on se tournera assez vite vers des colorations plus sobres, pour ne pas se fatiguer les yeux…

Cliquez pour agrandir.

Dans ce dernier exemple, les offices varient sur des tons de bordeaux alors que les entreprises sont colorées en tons de bleu.

Troisième étape: quel type de graphe ?

Il existe de multiples façons de représenter un tel réseau, le jeu d’outils proposé par Gephi ou ses "plugins" permet de se faire une idée par l’expérimentation, une fois la structure du graphe bien comprise (en l’occurrence, un graphe très clairement structuré par quelques sommets très connectés).

Cliquez pour agrandir.

Dans un graphe, la distance entre les sommets est sans importance, ce qui permet un très grand nombre de possibilités de spatialisations.

Quatrième étape: représenter tout ou partie des informations ?

La base de données ne comprend pas uniquement une liste d’offices, d’entreprises et de personnalités susceptibles de jouer le rôle d’intermédiaires, elle contient également des informations sur toutes les personnes gravitant autour de ces structures. Faut-il les ajouter au réseau ?

Cliquez pour agrandir.

Ajout de plus de 16’000 individus.

Cliquez pour agrandir.

Ceux-ci forment une masse de sommets très faiblement connectés (généralement avec une seule entreprise ou un seul office, puisque la caractéristique des personnalités retenues est justement d’être connectée avec plusieurs institution).

Cliquez pour agrandir

Une spatialisation avec une "gravité" plus forte permet de les reléguer en périphérie, en faisant des "satellites" des principaux "corps célestes".

Cinquième étape : quelle couleur ?

Alors que la question peut sembler triviale, elle n’en est pas moins d’une importance toute particulière en raison de la diffusion de l’infographie. Il est nécessaire que cette dernière parle à son lecteur dès le premier regard.

Cliquez pour agrandir.

Un passage par le bleu tendre qui met bien en valeur l’aspect dynamique des échanges mais laisse peu de lisibilité quant à la reconnaissance des sommets (différenciation entreprises/offices).

Cliquez pour agrandir

"50 nuances de rouge", avec une spatialisation qui laisse les sommets se chevaucher… une visualisation qui a plus à voir avec le papier-peint que la communication scientifique !

Cliquez pour agrandir.

Le vert met globalement bien en valeur l’aspect très "végétal" du réseau et ses arêtes courbes.

Cliquez pour agrandir.

Définitivement, les couleurs chaudes semblent moins adaptées que les couleurs froides dans ce contexte. On préférera donc le bleu qui rend mieux l’aspect "financier" des transactions. Est-ce pour cela que les billets de banque helvétiques sont imprimés en couleurs chaudes pour les petits montants (10-20) mais froides dès les montants plus importants (50-100-200-1000) ?

Cliquez pour agrandir.

On notera que les couleurs de la version finale diffèrent de cette dernière visualisation. En effet, on privilégiera une version plus franche (moins de contrastes entre les sommets) pour l’impression papier.

Sixième étape : quelle échelle ?

Pour calculer la taille des sommets, il va de soi qu’il s’agirait d’opter pour une échelle qui tienne compte de leur surface, à savoir une échelle qui intègre une puissance. Néanmoins, comme tous les sommets ne sont pas réglés par un paramètre de taille (les sommets représentant des personnes, par exemple), nous fixons une limite minimale (CHF 500’000) en-dessous de laquelle les cercles ne peuvent rapetisser.

Cliquez pour agrandir.

Ci-dessus, un exemple de ce qu’une échelle linéaire produirait comme résultat. Dans la version définitive, on applique également une légère diminution au principal sommet (ASTRA/Ofrou) dont la taille est telle qu’il écraserait le graphe.

Considérations techniques

Sommets classés par centralité. Cliquez pour agrandir.

Bien que les interactions (mandats) soient dirigées d’un office à une entreprise, on considèrera le graphe comme "non-dirigé" dans sa structure en raison de la multiplicité des types d’arêtes (les mandats et les appartenances des individus). Il est composé de 1078 sommets et 1200 arêtes, d’une densité de 0,002. La distance moyenne est de 3.805.

Comme on s’en doute, la centralité des sommets (nombre de connexions) est très proche de leur volume financier puisque de très grandes sommes échangées signifie souvent un grand nombre de partenaires d’échange.

Cliquez pour agrandir.

Le graphe ci-dessus présente la structure avec des sommets dont la taille est fonction de leur centralité.

Conclusion

Une très belle expérience de mise en commun de compétence, on ne peut qu’espérer que la cellule enquête de la SonntagsZeitung/Le Matin Dimanche puisse continuer à produire de telles recherches !

Vos commentaires sont les bienvenus, dites-nous ce que vous pensez de cette approche et de sa visualisation !

Et n’oubliez pas de suivre les deux journalistes qui ont travaillé sur ce projet avec @GrandjeanMartin : @TitusPlattner et @JulianSchmidli !

Ces articles pourraient vous intéresser :

[OpenData] La Suisse des étudiants, cartographie de la mobilité

.

[OpenData] Péréquation financière 2013

16 réponses à “[OpenData] Copinage dans les hautes sphères : quand l’analyse de réseau vient en aide au journalisme d’investigation

  1. Et que font les acheteurs (les pros qui ont fait de l’achat leur métier) qui sont de fait, les témoins chargés d’analyser le marché fournisseurs, de minimiser les risques d’achat et de nous faire croire que l’analyse et le suivi des fournisseurs nous permet de garantir la pérennité de la place économique suisse … ?

    • Bonjour, vous avez l’air de savoir de quoi vous parlez, est-ce que vous pourriez développer un tout petit peu sur la fonction de ces acheteurs ? Sont-ils soumis à un organe de surveillance ?
      A mon sens, ils ne sont pas directement concernés par l’étude ci-dessus parce que celle-ci s’en tient aux achats et mandats octroyés sur appel d’offre public, donc des sommes importantes sans intervention d’acheteur pro.

  2. Pingback: [OpenData] Copinage dans les hautes sphères : quand l’analyse de réseau vient en aide au journalisme d’investigation | Cultures & Médias | Scoop.it·

  3. Pingback: [OpenData] Copinage dans les hautes sphères : quand l’analyse de réseau vient en aide au journalisme d’investigation | Swiss Blogs | Scoop.it·

  4. Pingback: La nébuleuse suisse des copinages public-privé » OWNI, News, Augmented·

  5. Pingback: datajournalism | Pearltrees·

  6. Pingback: La nébuleuse suisse des copinages public-privé « Geekpolitic : on Freedom, Privacy and Security·

  7. Pingback: » #ddj twitter gossip – top 10 links °november 2012·

  8. Pingback: L'entre-espace » dataviz, infographie et vigilance·

  9. Pingback: Un Data Journalisme exemplaire | L'Atelier de Cartographie·

  10. Pingback: Un Data Journalisme exemplaire » Dextre zèbre·

  11. Pingback: Des outils de visualisation en sciences sociales - Martin Grandjean·

  12. Pingback: Introduction to Network Visualization with GEPHI - Martin Grandjean·

Commenter

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s