Thème "Les données structurées et leur traitement"

Publié le 7 août 2019 Modifié le : 16 juin 2022

Écrire à l'auteur

Le  mercredi 7 août 2019

Ressources SNT : Les données structurées et leurs traitements

Une visite du thème déclinée en 4 séances

  • Les données structurées, relevé, structuration, utilisation et stockage

    Le thème "Les données structurées et leurs traitements" du programme de SNT  est visité à travers 4 mises en activité, certaines pouvant être prolongées hors la classe.

     

    Préambule :

     

    Il peut être judicieux d'utiliser un navigateur avec une traduction automatique des pages, certaines ressources étant parfois en anglais.

     

     

    Séance 01 : Les tickets de caisse et leurs informations.

     

    (Directement inspiré de l'excellente ressource de M. Jean Baptiste Aubry de l'académie de Besançon)

     

    Comment, à partir de données apparemment anodines (3 tickets de caisse), on peut, en les structurant, obtenir des informations invasives ? Comment un traitement informatique, via un codage des données, peut extraire des informations sensibles de données anodines dans leur contexte ? Une mise en parallèle avec les droits offerts par le RGPD (Règlement Général de Protection des Données) permettra d'en comprendre les enjeux.

     

    Séance 02 : Où trouver des données ? Introduction à l'open data et contribution à une base de données en ligne (http://www.culture.gouv.fr/Panorama-des-festivals/).

     

    Après avoir exploré des sites de données en ligne et s'être intéressé aux différents formats de téléchargement disponibles (un lien pourra être fait avec la séance 1), il s'agira de se focaliser sur le fichier panorama des festivals qui sera téléchargé au format csv. Un traitement tableur permettra d'en extraire, tout en découvrant les fonctionnalités disponibles, les festivals de sa région, de son département ou de sa commune. Il s'agira alors de contribuer à étoffer la base de données existente avec un festival non référencé en identifiant les données à communiquer. Ce sera l'occasion d'aborder la notion de descripteurs, de valeurs, ... Une attention sera portée sur la modération de la contribution et ainsi on pourra évoquer la validation des données mises à disposition.

     

    Séance 03 : Comment documenter une playlist musicale ?

     

    Après avoir découvert les métadonnées de fichiers musicaux libres de droits, il s'agira de les compléter manuellement à partir de recherche internet, puis d'utiliser un logiciel (MP3tag) interrogeant des bases de données en ligne (musicbrainz). On poursuivra par une extraction csv de ces métadonnées afin de créer un fichier tableur de la bibliothèque de musique constituée, ainsi qu'un affichage sous python de façon à prendre conscience du traitement algorithmique de ces données. Pour finir, on explorera la base de données en ligne utilisée par le logiciel afin de prendre conscience de sa taille immense, de sa structure, ainsi que des droits qui lui sont attachés (licences creative commons). Pour finir, un parallèle pourra être fait avec les structures construites à la séance 1 (représentation de la base de données). Une évocation de l'utilisation de ces données comme set d'apprentissages pour une Intelligence Artificielle peut être faite rapidement en fin de séance - The Million Song Dataset Challenge)

     

    Séance 04 : La mise à disposition et le stockage des données, un enjeu technologique, politique, sociétal et environnemental. 

     

    Il s'agira à travers une recherche documentaire d'aborder par groupe différentes thématiques liées aux données, puis d'en faire une synthèse collective sous formes variées à la libre appréciation de chacun (exposés, journal, panneaux, ...) Les thèmes suivants peuvent être proposés :

    • Les supports de données à travers les âges
    • Les data center
    • Données et enjeux climatiques
    • L’open data, enjeux et perspectives
    • Big data et intelligence artificielle
    • Big data et protection des individus
    • Le cloud, qu’est-ce que c’est ?

     Vous trouverez en annexe des références d'articles du journal Le Monde ( séance 04 - Fiche professeur), mais il en paraît tous les jours.

     

     

    Hervé ANTOINE - Enseignant de mathématiques - Lycée Honoré Romane et Collège les Ecrins - EMBRUN

     

    Ressources disponibles au téléchargement : 

    Séance 01 - Fiche élève

    Séance 02 - Fiche élève

    Séance 02 - Fiche professeur

    Séance 03 - Fiche élève

    Séance 03 - Fiche professeur

    Séance 03 - Logiciel d'installation MP3tag

    Séance 03 - Fichiers musicaux bruts

    Séance 03 - Fichiers musicaux traités

    Séance 03 - Exploitation Python

    Séance 04 - Fiche élève

    Séance 04 - Fiche professeur