Twitter libère ses données, qu’est-ce que cela signifie ?

Après avoir eu “gratuitement” à disposition d’abord quelques méga-octets il y a une vingtaine d’années, pour des pages internet ou des adresses emails, devenus aujourd’hui des dizaines de giga-octets, les utilisateurs d’Internet en sont venus à s’interroger sur l’utilisation de leurs données, et sur les moyens à disposition pour les récupérer.

Sans évoquer ici l’utilisation faite de données privées par des tiers, nous développons tout d’abord la problématique de la libération des données, puis présentons dans un second article le cas particulier de Twitter, de l’outil qu’ils mettent à disposition pour exploiter ses propres données, et des pistes pour aller plus loin.

TwitterDataExport

L’intérêt d’être en possession de ses données, …et de pouvoir les parcourir

Aujourd’hui, la majeure partie de la correspondance de chacun existe sur des supports informatiques, en ligne comme sur son propre ordinateur. La conservation de l’accessibilité à ces données sur le long terme est un problème complexe, auquel les gens sont très peu préparés, et qui régulièrement fait des ravages parmi les utilisateurs, via des formats de documents qui ne sont plus reconnus, des disquettes démagnétisées, des disques devenus illisibles ou des « crashs » de disque dur.

Récemment, le stockage de données en ligne par des tiers (Google, Dropbox, Apple, etc.) a semblé répondre à cette préoccupation, mais en nous contraignant à devoir faire confiance à des entreprises dont le fond de commerce est au moins partiellement l’exploitation de ces données (« Si c’est gratuit, c’est que vous êtes le produit. »). Sans parler de la transparence très relative – voire absente – sur les conditions de stockage et d’utilisation de nos données.

À ce propos, le Front de Libération des Données donne d’excellentes recommandations lors de l’inscription à un service en ligne. Rapidement :

  1. Les données doivent être exportables dans un format ouvert.
  2. L’exportation ne doit rien coûter.
  3. L’exportation ne doit pas prendre longtemps.

Enjeux

Pour l’utilisateur, l’intérêt de la récupération de ses données est de pouvoir prendre connaissance de l’information complète qu’a en sa possession le propriétaire du site à son propos. Il s’agit également de conserver une archive de ses écrits, images, et plus généralement pérégrinations sur Internet. Les tweets, emails, photos ou statuts Facebook fournissent un aperçu d’une époque de sa vie, et en sont parfois la seule trace. La récupération de ces archives est d’autant plus importante dans le cas où l’on décide de supprimer un compte ou des comptes de services en ligne.

Pour l’entreprise propriétaire du site, il est primordial d’avoir une politique d’ouverture des données pour convaincre de sa volonté de ne pas rendre prisonniers ses utilisateurs, mais au contraire de leur laisser une (relative) liberté de choix. Cette attitude faussement innocente a par exemple souvent avantagé Google par rapport à la concurrence, en misant sur le capital sympathie.

Comment les obtenir ?

TwitterDataDes (dizaines ? centaines ? de) milliers d’entreprises sont concernées par la gestion de données privées, et prennent à différents degrés de sérieux la problématique de leur mise à disposition. Parmi les premières impliquées, Google a rapidement permis d’utiliser sa messagerie électronique en ligne Gmail dans d’autres logiciels de messagerie (via des protocoles POP ou IMAP), ce que Microsoft s’est très longtemps refusé à faire avec son service concurrent Hotmail. Puis, avec l’apparition de dizaines de nouveaux produits, Google a mis en ligne une interface permettant à ses clients de superviser le plus gros de leurs archives : Google Takeout.

Autre grand gourmand en terme de données personnelles, Facebook a développé en 2010 une option permettant à chacun de récupérer une partie de ses données, c’est-à-dire (à fin 2011, date de mon départ du site) :

  • le contenu de son wall (avec les commentaires de visiteurs),
  • photos et vidéos (très compressées, avec les commentaires),
  • la liste de ses amis,
  • la liste des événements auxquels on a pris part,
  • les messages privés.

Twitter, qui nous intéresse dans la deuxième partie de l’article, s’est retrouvé confronté à la même problématique, et l’a réglé à travers un projet réalisé dans le cadre d’une formation à l’interne. En effet, en limitant la possibilité d’exploration à 3200 de ses propres tweets, les utilisateurs n’ont longtemps plus eu accès aux tweets des années précédentes. Depuis décembre 2012, et sous certaines conditions, ça n’est plus le cas.

Alors, comment on fait dans le cas de Twitter ?

Dans un premier temps réservé aux utilisateurs en langue anglaise, l’option de téléchargement de son archive personnelle est disponible en français depuis deux semaines au moment de la rédaction de cet article, et apparaît progressivement sur les comptes des utilisateurs.

2013-03-24 00.23.52

Dans les paramètres, sous l’onglet « Compte », descendre tout en bas de la page, et cliquer sur « Demander votre archive ». Un email arrive rapidement (une affaire de minutes), avec un lien vers l’archive :

2013-03-24 00.31.06

Que reçoit-on de Twitter ? À quel format ?

Une fois dézippée, l’archive apparaît sous la forme d’un dossier, dans lequel deux éléments nous intéressent. En cliquant sur le fichier « index.html », votre navigateur va s’ouvrir et afficher tous vos tweets classés par mois et dans une interface dynamique et rapide. Il est possible de faire des recherches par mot-clé, de retrouver le tweet original en ligne, ou encore de connaître la date à laquelle le compte a été créé. Sur la droite de l’écran, on remarque une description très superficielle de la distribution des tweets durant l’utilisation du compte. Malheureusement, vous ne retrouverez dans cette archive ni vos favoris, ni vos messages privés.

mars2010

Le second élément intéressant est plus discret, il se cache dans les dossiers « data -> js -> tweets ». Là au fond, vous retrouvez vos tweets, ainsi que d’autres informations qui nous intéresserons dans la partie tutoriel …

Il est où le fun dans tout ça ?

Visualisations et exploitation des données dans la seconde partie de l’article.

Advertisements

10 réponses à “Twitter libère ses données, qu’est-ce que cela signifie ?

  1. Pingback: Tutoriel : exploiter ses données Twitter | Pegasus Data Project·

  2. Pingback: Twitter libère ses données, qu'est-ce que cela signifie ? | Veille Techno et Informatique "Autrement" | Scoop.it·

  3. Pingback: Twitter libère ses données, qu'est-ce que cela signifie ? | Actualités Crédit Agricole | Scoop.it·

  4. Pingback: Twitter libère ses données, qu'est-ce que cela signifie ? | Teaupique | Scoop.it·

  5. Pingback: « VΞillEurs.info 【ツ】 » | [Tutoriel] Récupérer, visualiser & exploiter ses données Twitter (par Pegasus Data Project)·

  6. Pingback: Lyll-Twitter | Pearltrees·

  7. Pingback: [Tutoriel] Récupérer, visualiser & exploiter ses données Twitter (par Pegasus Data Project) | Veilleurs.info / MIRROR #1·

  8. Pingback: Twitter libère ses données, qu'est-ce que cela signifie ? | social networking | Scoop.it·

  9. Pingback: Traces et données personnelles | Pearltrees·

  10. Pingback: Doctorants : être ou ne pas être sur Twitter | Ressources pour la thèse·

Commenter

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s