Cours semaine 1: vidéo 3


Cours semaine 1, vidéo 3
Chapitre 1 :"Organiser des données & structurer une enquête"



Bonjour à tous nous avons vu lundi qu'elles étaient les avantages du datajournalisme et hier comment on menait une enquête de données d'abord poser une question, trouver les données pour y répondre, puis communiquer les résultats, nous passerons la semaine prochaine plus de temps sur chacune des étapes du processus, au paravent il faut s'interroger quelques minutes sur ce qu'est une donnée pour un journaliste.

Nous verrons aujourd'hui comment on peut structurer l'information et à quoi sert l'information structurée.Nous verrons ensuite comment s'organiser pour stocker, partager et publier des données en fonction des moyens disponibles     

Chapitre 1 :"Qu'est-ce qu'une donnée ?"

En 2006 le  programmeur américain ADRIAN HOLOVATY qui travaillait pour le Washington Post publiait comment les sites d'infos doivent changer. Ce qui était un post de blog est devenu un magnifeste pour les journalistes de données.Il y explique que la plupart des informations rapporté dans les sites d'actu peuvent être organisé de manière structurée. Prenons un exemple : imaginez qu'il y a un incendie on ainsi écrire un article est c'est sans doute le meilleur moyen de raconter cette histoire mais cet article va contenir de nombreuses informations qui peuvent être structurées.

Chaque incendie a une date , une heure, une adresse qui peut-être codée avec une latitude et une longitude, un nombre de victimes et de blessés, un montant de dommage en euro et un temps d'arrivée des pompiers en minutes.L'information structurée de l'information qui peut-être utilisé par un ordinateur, agrégé, analysé et republier pour trouver des tendances ou identifier les points les plus intéressant par rapport à l'ensemble. Imaginez que tous les incendies d'un territoire, ne soit pas décrit par un article mais par des données structurées, on pourrai immédiatement pour chaque incendie savoir si le temps d'arrivée des pompiers est en dessous ou en dessus de la moyenne en quelque clics, on pourrait savoir si les pompiers arrivent plus vite dans certains quartiers que dans d'autres.  C'est justement ce qu'à fait le Los Angelest  Times    qui a cartographié quartier par quartier la rapidité des services de secours.On voit en vert où les pompiers et les ambulanciers arrivent en moins de 6 minutes et en violet foncé ceux qui arrivent 10 minutes ou plus quand l'alerte a été donné, une telle application aurai été impossible à réalisée si les journaliste du Los Angelest Times n'avait eu à leur disposition que des articles sous la forme de texte. Ils ont ici utilisés un tableau ou chaque ligne était un incident et chaque colonne contenait une adresse et un temps de réaction. 
Ce qui est vrai des incendies est vrai de la plupart des faits d'actualités. Un jugement peut-être décrit par un juge, un accusé, un avocat, un procureur, une condamnation et éventuellement une peine.  Une manifestation, qui peut-être représenté par un parcours, un ou plusieurs organisateurs...en nombre de manifestants et un nombre de policiers, les événements sportifs et financiers se prêtent expressément tellement bien à une telle structuration, un cours de bourse monte ou descend, un indice se mesure en point,une action à un prix auquel il s'échange.    
L'information structurée c'est de l'information lisible par un ordinateur. Le datajournalisme permet d'utiliser l'intelligence des humains avec la puissance des machines pour communiquer l'actualité plus vite à moindre côut. Imaginez que vous avez des capteurs sismiques qui enregistrent en permanence l'activité tectonique et sont capable de d'enregistrer les tremblements de terre vous pouvez préparer un article modèle qui commence à telle heure : un séisme de magnitude de ...autant a frappé telle ville.
Si les capteurs sont reliés directement à votre site web vous pouvez programmer un ordinateur pour qu'il remplisse automatiquement les trous et publie un article dés qu'un séisme de magnitude supérieur à 4 se produit. 

On pourrai croire à de la Sciences fiction mais ces modes de fonctionnement sont déjà en place dans de nombreuses rédactions. En mars 2014 le Los Angeles Times encore une fois a publié un article automatiquement, 3 minutes seulement aprés un tremblement de terre.
Le programme utilisé createbot a été écrit par un journaliste de la rédation et leur a permis de publier l'info immédiatement, une fois les journalistes avertis et une fois les journalistes avertis et une fois sur le terrain, ils ont pu ajouter des informations de contexte non structurés à l'article. Le datajournalisme ne va pas remplacer des humains par des machines mais bien permettre aux humains de se débarrasser des tâches les plus répétitives, pour qu'ils puissent se concentrer sur des tâches plus complexes et plus intéressantes.

Chapitre 2 :Structurer une grande enquête

Dans une enquête structurer une information signifie surtout rendre les documents lisibles par les machines, pour cela le New-York TIMES Propublica un site d'enquêtes américain à but non lucratif ont développé Document Cloud qui permet d'héberger des documents, de les classr et de les annoter , le service n'est disponible qu'en anglais et les journalistes doivent être approuvés pour participer, le code source est cependant ouvert et n'importe quelle organisation peut l'installer.
Une telle solution ne permet pas de travailler avec des données chiffrées.
Retrouvons Alexandre Léchenet 


 Au Monde.fr il revient sur l'enquête qu'il a eu a dirigé jusqu'à présent, sur les dépassements d'honoraire des médecins.
Il nous explique qu'il n'a pas encore trouvé l'outil idéal pour structurer ses données.
 Comme on l'a vu lundi le datajournaliste doit savoir s'adapter.
L'enquête la plus délicate à réalisée a été l'enquête sur les dépassements d'honoraires parce que c'était la première que j'ai faite et c'était la première fois au Monde qu'on utilisait cette façon de travailler avec les bases de données et les chiffres.
La collaboration se passe souvent bien parce que on comprend d'autant bien ce que peut apporter l'un à l'autre.
Par exemple sur les dépassements d'honoraires. Moi j'avais récupéré des données, les journaliste du papier, leurs contacts, on ne pouvait pas allez voir leurs contacts. Sans la base de données on ne pouvait pas non plus comprendre la base de données sans les explications de ces contacts. Pour l'instant nous n'avons pas d'outils complétement satisfaisant pour stocker les données et surtout les journalistes du print on parfois on du mal à manipuler les tableurs. On aimerai installer un Data risopotering, quelque chose qui serait partagé avec l'ensemble de la rédaction comme Panda par exemple. 

L'idée serai que tous les journalistes puissent verser leurs données sur le Data risopotering et qu'ensuite on puisse les déposer ou les exploiter directement ou les fusionner ou les croiser.

On retrouvera Alexandre tout le long de ce Mooc et vous expliquera plus précisément comment sur les enquêtes de dépassement d'honoraire
a été réalisé.


Chapitre 3 :"organiser des données et structurer une enquête"


Ce qui fonctionne dans une grande rédaction  peut se décliner au niveau local voir individuel.

Arnaud WERY est DATAJOURNALISTE au sein du groupe l'Avenir qui publie 9 quotidiens en Belgique francophone, nous l'avons rencontré afin qu'il nous explique comment il trouve des angles dans l'actualité locale. Pour trouver des sujets de Datajournalisme, moi j'utilise 3 possibilités. La première c'est la réunion du lundi où tous les sujets de la semaine sont évoqués, à ce moment là il y a déjà moyen de voir de s'il n' y a pas moyen de travailler en binôme avec l'un de mes collègues qui a la connaissance d'un dossier et qui pourrai venir m'appuyer sur lui pour développer, c'est cela pour aller un peu plus loin dans les données. La première c'est la principale de projet pour mener de projets de data, la 2ème c'est la taille de la rédaction, on est la plus petite des rédactions du groupe , ça l'intérêt c'est qu'on est dans un  petit local, donc fatalement tout le monde est en contact avec tout le monde.
Il suffit que parfois qu'une personne ait un bon sujet au fil de la semaine et on peut rebondir dessus facilement, c'était par exemple le cas pour les jetons présents que l'avenir a mené une enquête sur les jetons de présence au sein des communes qui sont couvertes par l'ensemble de notre rédaction. C'est parti presque d'une boutade , on s'est dit que ils gagnent combien les personnes qui viennent dans les conseils qui sont élus et qui viennent parfois lever le bras, poser des questions, ses sommes là sont délimitées par les communes, les communes qui choisissent les montants.   



Il n'y a pas de cadre légal. Comme le montant d'un Bourgmestre , d'un maire ou d'un adjoint au maire. Ici c'est les communes qui décident combien on donne aux conseils communaux , à l'ancienne ou a fait le tour de toutes les communes par téléphone, cela nous a pris un certain temps.
De là on a eu une vision de l'ensemble de notre zone de couverture  et on a vu qu'il y avait une commune qui donnait énormément à ses conseillers et une autre qui était très basse.
Celle qui était au plus bas à augmenté et celle qui était au plus haut à diminué. Cela a fait débat au sein du Conseil Communal , cet article, cette approche Data a suscité un débat.
Donc cela c'est la deuxième chose. La troisième c'est de parfois travailler avec la rédaction sportive qui est juste à côté.
Et là c'est plutôt des envies ou en fonction de l'actualité , j'essaye de susciter une envie chez eux pour travailler ensemble

Chapitre 4 :"organiser des données et structurer une enquête"

La plupart des journalistes de données mettent leurs documents à disposition du publique comme le fait le journaliste du Data blog du Guardian de la nacion l'un des meilleurs media argentin ou Mother Jones un magazine américain. En 2012 Mother Jones a compilé des données sur l'ensemble des fusillades recencées aux Etats-Unis et a mis les données en ligne.
Cela a permis au Boston Globe et au Weillers deux autres journaux de publier leurs propres analyses. Publier les données sources permet aussi de vos lecteurs de vérifier, de rapporter des erreurs et d'améliorer l'ensemble. Parfois les lecteurs peuvent apporter des angles nouveaux à partir de vos données, le blog du guardian a ainsi créé un groupe flicker de permettre de partager à tous et de visualiser les données publiées par les journalistes. Avec Google Spreadsheets il vous suffit de changer les paramètres de partage de
calcul pour la rendre visible et pas éditable par tous. 

Merci d'avoir suivi ce cours;
Résumé :
Structurer l'information
1. Rendre l'information lisible par l'ordinateur
2. Permet des analyses et des visualisations
3. Augmente la productivité
4. Applicable a tout sujet d'actualité
S'organiser pour structurer l'information
1. Travailler en équipe
2. Utiliser des outils comme Documents Cloud
Panda, Google Spreedsheets
3. Mettre des données à disposition de l'audience
 
 



 
  

Aucun commentaire:

Enregistrer un commentaire