CONTACT : sophie.lebre@univ-montp3.fr

4 jours pour produire et valoriser de vraies données !


Tous les étudiants des masters MIASHS et INFOCOM "Communications numériques et organisations" participeront au marathon web du 22 au 26 mars 2021, une semaine pour créer un projet de A à Z !


Stocker des données

Base de données

Analyser des données

Statistiques, Fouille de données et Visualisations.

Communiquer

Video, Site web

Diffuser

Affiche, flyer

2 promotions

M1 MIASHS

Des spécialistes de la science des données (base de données, analyse de données, statistique, apprentissage, big data...).


M1 Information-Communication parcours CNO (Communications numériques et organisations):

Des spécialistes de la conception et de l’évaluation de stratégies de communication numériques (web, animation de communautés, graphisme, etc.) adaptées à divers contextes professionnels.



Programme

  • Lundi 9h : début du Marathon
  • Du lundi au jeudi : envoi d’un rapport journalier sur Discord par le chef de groupe avec les avancées du projet
  • Jeudi minuit : date limite de rendu du travail
  • Vendredi : démonstrations et présentations




Projets entreprises





1- Cartes interactives : géolocalisation de l’information à partir de Wikipédia et d'articles

Interlocuteur : Cédric Lopez et Jean Bort

Objectif : De nombreuses informations sont communiquées chaque jour par la presse, les sociétés, les associations, ou plus directement par des personnes. Ces informations sont couramment associées à des mentions de lieux ; c’est le cas par exemple de textes concernant un festival, un évènement sportif, un accident, le déplacement de personnalités ou un site touristique. Dans le cadre de ce projet, l’objectif est de générer automatiquement des cartes à partir de contenus textuels. Ces cartes indiqueront les lieux cités dans les textes et les informations associées. L’intérêt pour les utilisateurs peut-être de savoir en un coup d’oeil si l’ensemble documentaire considéré concerne la zone géographique qui l’intéresse ou encore de visualiser des parcours de vie. Le cas d’application proposé dans le cadre du Marathon du Web est l’étude des biographies de personnalités dans Wikipedia et/ou dans des articles journalistiques. Par exemple, à partir du texte décrivant la vie de Eli Marsden Wilson (https://fr.wikipedia.org/wiki/Eli_Marsden_Wilson), la carte devrait permettre de visualiser ses déplacements depuis sa naissance à Osset jusqu’à sa mort à Londres.

Cible :

Missions : Utiliser des APIs de reconnaissance de nom de lieux et d’évènements fournis par la société, retrouver les coordonnées géographiques des lieux, les placer sur une carte avec les informations associées (informations provenant des APIs telles que le nom des événements, des mots clés, des concepts, l’opinion et les émotions associées à un lieu etc.).

Sources et données disponibles : Wikipédia et/ou articles journalistiques



2- Territoires en transition : accompagner l'accès au logement dans l'Hérault

Interlocuteur : Deborah Soria

Objectif : Le conseil départemental est garant de la cohérence des politiques locales de l’habitat. Ses objectifs en la matière sont cadrés dans le plan départemental de l’habitat (PDH), document de référence applicable 6 ans. Afin d’évaluer la mise en œuvre de ce plan, le Département, via l’observatoire départemental de l’habitat (ODDH), se dote d’outils de connaissance et de suivi. L’objectif ici est de mettre en place un suivi temporel des enjeux territoriaux de l’habitat sur le département de l’Hérault.

Cible : les territoires de l’Hérault (EPCI et communes)

Missions : Lors de la phase de diagnostic du plan départemental de l’habitat, une méthode visant à catégoriser les territoires en fonction d’indicateurs a permis d’identifier les enjeux territoriaux de l’habitat et les territoires «en transition». Dans cette veine, le travail des étudiants proposera:

  • une sélection d’indicateurs pertinents ainsi que des corrélations d’indicateurs pour définir des catégories d’enjeux habitat
  • un système d’alertes pour identifier l’évolution catégorielle des dynamiques de peuplement à l’œuvre et leurs conséquences sur l’accès au logement
  • une plaquette de présentation du modèle
  • une visualisation des résultats territoire par territoire
L’échelle géographique de résultats privilégiée sera celle des intercommunalités (EPCI) afin de conserver la cohérence avec le Plan Départemental de l’Habitat et d’assurer une transmission constructive à nos partenaires pour la mise en œuvre des Programmes Locaux de l’Habitat. Ils livreront également une critique sur la fiabilité de ce modèle en fonction des données fournies. Ils s’attacheront également à intégrer une dimension prédictive sur le ou les scenarii les plus plausibles dans un avenir à 5 ou 10 ans à partir des objectifs des programmes locaux de l’habitat approuvés.

Sources et données disponibles :

  • Une copie du SGBD (postgreSql) de l'ODDH administré selon un modèle conceptuel de données fourni, composé de:
    • toutes les sources de «données habitat» mises à la disposition de l’ODDH dans leur millésime le plus récent
    • les indicateurs relatifs au PDH depuis 2011
  • Un dossier d’archives contenant ces mêmes «données habitat» en format excel cette fois, issues des collectes précédentes.
  • Le nouveau plan départemental de l’habitat 2021-2026
  • Les sites open-data : INSEE - PictoStat Occitanie – Hérault Data



3- Numerev : carte conceptuelle interactive au service des connaissances

Interlocuteur : Lise Verlaet

Objectif : Numerev (https://projet.numerev.com/), programme de recherche-action-développement soutenu par la MSH-Sud, se veut être un incubateur de projets d’édition scientifique (revues scientifiques, actes de colloque, ouvrages). La spécificité de l’incubateur Numerev est qu’il a été conçu pour faciliter l’ensemble du processus d’évaluation et d’édition scientifique via un workflow dédié. Après avoir fait la preuve du concept auprès de plusieurs projets, nous souhaitons promouvoir cet outil notamment en réalisant un tutoriel vidéo, lequel sera également utilisé pour une assurer une campagne de communication cross-média. Au-delà du workflow d’édition, le projet Numerev entend développer une cartographie interactive des connaissances via l’exploitation (datamining) des données issues des articles scientifiques et leur valorisation au sein d’une carte conceptuelle interactive. L’interactivité de cette carte réside à la fois dans l’exploration des données qu’elle contient, mais aussi dans sa fonction d’outil de navigation au sein du portail de ressources Numerev (data/info-visualisation).

Cible : Pôles d’édition scientifique institutionnels (Presses universitaires, MSH…), laboratoire de recherche, revues scientifiques indépendantes…

Missions :

  • Réalisation d’un tutoriel vidéo du workflow d’édition
  • Réalisation d’une campagne de communication cross-média pour promouvoir le workflow d’édition
  • Datamining des articles scientifiques issus des projets hébergés par Numerev (base de données MySQL)
  • Réalisation de la cartographie interactive des connaissances (data/info-visualisation)

Sources et données disponibles : https://projet.numerev.com/, accès backoffice donnés en temps utile.



4- Datamining et data/info-visualisation : site dédié à l'oeuvre d'Yves Jeanneret

Interlocuteur : Lise Verlaet et Sylvie Leleu-Merviel

Objectif : Le Pr Yves Jeanneret nous a quitté au printemps dernier, laissant derrière lui une œuvre scientifique très riche qu’il s’agira de valoriser à travers un site internet qui lui sera consacré. Les ressources (textuelles ou vidéos) peuvent être disponibles en libre accès ou via des éditeurs. Il s’agira d’imaginer la meilleure façon de mettre en lumière ses travaux, notamment en utilisant les data/info-visualisation

Cible : étudiants, enseignants-chercheurs, chercheurs, professionnels de l’information-communication

Missions :

  • Réalisation et référencement du site dédié à l’œuvre de Yves Jeanneret
  • Datamining des ressources en libre accès (différents formats de fichiers)
  • Réalisation de la cartographie interactive des connaissances (data/info-visualisation)

Sources et données disponibles : Fichiers PDF/DOC



5- Un plus Bio : des cantines bio et durables

Interlocuteur : Inès Revuelta et Imad Benhadid

Objectif : Approvisionner les cantines en produits bio, locaux, frais et de saison nécessite une compréhension fine du fonctionnement de la restauration collective et des systèmes alimentaires. Un Plus Bio est une association qui, depuis près de vingt ans, interroge l’évolution des approches et des métiers de la restauration collective, avec pour finalité de changer notre alimentation pour aller vers plus de bio et de local. Pour cela, elle utilise notamment les données issues de plateforme de l’observatoire national de la restauration collective bio et durable (www.observatoire-restauration-biodurable.fr). En collectant les données et les initiatives du plus grand nombre de collectivités engagées pour une alimentation de qualité, l’observatoire a pour objectif d’apporter des réponses concrètes et de créer des références sur la transition alimentaire en restauration collective. L’objectif consiste ici à créer une plateforme automatisée capable de récolter, stocker et traiter les données de l’observatoire, et à développer des fonctionalités pour générer des supports de visualisations en ligne interactifs.

Cible : Les élus, services et acteurs du territoire en charge de l’alimentation et de la restauration collective à la recherche de ressources, d’outils, d’idées et de références pour construire et animer leurs politiques alimentaires.

Missions :

  • Des fonctionnalités incontournables à développer (collecte des données): création d'un questionnaire en ligne (avec des questions à choix multiples, des questions ouvertes, des questions quantitatives uniquement, des questions « sous conditions », des questions avec une échelle de 0 à 5)
  • De nouvelles options à intégrer (analyse et valorisation) :
    • carte interactive des collectivités et des établissements participants (communes, intercommunalités, départements, régions)
    • statistiques descriptives automatiques (ex : pourcentages, moyennes)
    • projection des données par intercommunalités / départements / régions (s’il faut choisir, plutôt départements)
    • un compteur du nombre de collectivités participantes / nombre de cantines / nombre de repas par jour
    • La possibilité de faire des requêtes par : nombre de repas, type de structure (commune, département, etc.), mode de gestion (gestion directe et concédée), mode de production (cuisine centrale, cuisine sur place) et éventuellement par thématiques (santé, environnement, social, éducation, foncier, économie, culture)
  • Etude de 3 questions s'appuyant sur les données de l'observatoire :
    • Y-a-t-il une relation entre le pourcentage de produits bio et le coût du repas ? Si oui, quelle est-elle ?
    • Y-a-t-il une relation entre le pourcentage de produits bio et le % de produits locaux ? Si oui, quelle est-elle ?
    • Y-a-t-il une relation entre l’introduction de menus végétariens et l’introduction de viandes de qualité ? Si oui, quelle est-elle ?

Sources et données disponibles :

  • La liste des collectivités participantes à l’Observatoire (nom, code postale, ville, nombre de repas, mode de gestion et de production des cantines et leurs « entrées thématiques sur l’alimentation ») > pour la carte et les requêtes
  • Les données brutes (anonymes) des années 2020 > pour l'étude des 3 questions
  • Le questionnaire actuel + le nouveau questionnaire souhaité > pour la création du questionnaire



6- Faire une typologie des "Villes et Métiers d'Art", décrire leurs actions et les écosystèmes territoriaux des métiers d'art

Interlocuteur : Jean-Michel Kosianski

Objectif : L’association Ville et Métiers d’Art réunit 89 communes et intercommunalités de toute la France et de toutes tailles, qui conduisent des actions remarquables en faveur du secteur des métiers d'art : https://www.vma.asso.fr. Sur le site de l’association, chaque collectivité labellisée fait l’objet d’une page de présentation : https://www.vma.asso.fr/les-villes-labellisees/.
Les «questions de recherche» sont les suivantes:

  • 1) Quelles sont les caractéristiques des collectivités intervenant en faveur du secteur des métiers d’art ? Peut-on en dresser une typologie ? Selon quels critères principaux ?
  • 2) Quelles sont les principales actions et réalisations des collectivités en faveur des métiers d’art ?
  • 3) Quels acteurs composent les « écosystèmes territoriaux des métiers d’art » attachés à ces collectivités ?

Cible : élus et services culturels, touristiques et économiques des collectivités, artisans d'art, chercheurs

Missions : Exploiter les données obtenues auprès de 52 collectivités (communes et intercommunalités) adhérentes de l’association Ville et Métiers d’Art (VMA). Pour les questions 2) et 3), il s’agira seulement d’exploiter les (52) réponses à l’enquête. Pour la question 1), il s’agira d’aller chercher sur Internet des données complémentaires sur l’ensemble des (89) collectivités adhérentes de VMA pour:

  • d’une part, fournir un portrait statistique de cette population,
  • d’autre part, compléter la base de données (qui concerne donc seulement 52 des 89 collectivités) en vue de conduire une analyse de données multidimensionnelles.

Sources et données disponibles : Base de données (Excel) issue de l'enquête



7- Un abri qui sauve des vies : lutter contre les violences conjugales et intrafamiliales

Interlocuteur : Charlyne Péculier

Objectif : Un abri qui sauve des vies est une association de lutte contre les violences conjugales et intrafamiliales spécialisée dans l'hébergement d’urgence. Professionnels et particuliers peuvent apporter leur aide en mettant à disposition un logement temporairement. Créée pendant le premier confinement suite à la recrudescence des violences domestiques, l’association fait appel à la solidarité nationale pour pallier le manque de places pour les victimes. Elle cherche à se faire connaître auprès des personnes et des organisations susceptibles de mettre à disposition des logements. Aussi, la refonte de notre base de données est un enjeu important pour sécuriser les données personnelles et améliorer leur gestion pour gagner en réactivité. Nous travaillons avec des outils basiques qui ne répondent pas à nos besoins.

Cible :

  • Professionnels du logement, collectivités territoriales, particuliers disposant d’un logement vacant ;
  • Bénévoles potentiels (personnes sensibilisées aux violences conjugales et intrafamiliales) ;
  • Victimes de violences conjugales et intrafamiliales.

Missions :

  • Élaboration d’un plan de communication digitale ;
  • Création de contenu (visuel et écrit) pour le site internet et les réseaux sociaux afin de promouvoir nos actions ;
  • Réalisation d’un visuel à intégrer dans des journaux ou des magazines pour l’appel à logements ;
  • Réalisation d’une vidéo explicative sur nos actions (procédures mises en place pour le relogement, notamment) ; 
  • Mettre en place des outils pour la gestion de base de données (carte interactive pour les logements, recherche avancée, sécurisation des données avec plusieurs niveaux de confidentialité et des accès différents, création de fiches liées aux formulaires avec ajout, modification et suppression de données, interface ergonomique).

Sources et données disponibles : : base de données Excel (bénévoles, abritants, demandes de victimes).



8- Kalya : la sciences au service du sport

Interlocuteur : Jessica Pinaire

Objectif : Il s’agit de rendre accessible aux amoureux du sport les dernières tendances concernant leur discipline sportive, à la fois en termes d’objectifs (e.g. réduire sa fatigue, améliorer son souffle, aller plus vite…), de préparation sportive (entrainement, récupération, programme de nutrition…), mais aussi de solution santé (ou thérapie non-médicamenteuse (TNM) comme la relaxation, la consommation de jus de betterave…) pour améliorer ses performances sportives.

Cible : § Toute personne pratiquant le sport.

Missions :

  • Faire un état des lieux par discipline sportive : quelles sont les pratiques et les TNM étudiées
  • Déterminer un top 10 de ces pratiques
  • Proposer des visualisations interactives par discipline sportive permettant de relier le tryptique : pratique sportive, objectif, et TNM
  • (optionnel) déterminer un niveau d’efficacité (e.g. : efficacité significative, efficacité modérée, efficacité non significative) des TNM à partir des publications scientifiques et d’un jeu d’entraînement

Sources et données disponibles : Pour l’exercice, l’ensemble des données numériques recueillies pour alimenter Kalya Sport sera mis à disposition : une base de données avec près de 20 000 articles comportant notamment les informations suivantes : le sport, la préparation sportive, les TNM. Il sera également fourni, une base de données annotée qui pourra servir pour le modèle d’apprentissage.



9- Influenceurs et actions carritatives en Afrique : gamification du vote de l'événement

Interlocuteur : Solène Vion et Florian Bordes

Objectif : Les ABDIA résultent d’une volonté de mettre en lumière l’impact positif des influenceurs afro sur le plan mondial à travers un événement qui prendra place du 22 au 24 novembre 2021 à Accra (Ghana). L’événement met l’accent sur l’aspect caritatif afin de valoriser aussi bien les influenceurs afro sous représentés par les cérémonies classiques, que des œuvres de charité en lien avec une problématique sociale majeure du pays hôte.

Cible : La partie “vote” cible les fans des influenceurs, tandis que la partie “com” caritativevise le grand public anglophone et francophone.

Missions :

  • Dans le cadre de la partie “cérémonie de récompense”, l’Abdia cherche à concevoir pour le site web de l’événement, un module de vote permettant au public de soutenir son influenceur favori dans chaque catégorie ;
  • La création du module de vote peut s’accompagner de toute forme de système de visualisation de données, que ce soit pendant la phase de vote (pour enflammer la compétition) ou après (pour dévoiler les résultats) : par exemple, on peut permettre au public de visualiser en temps réel sur le site les catégories les plus mobilisatrices, les pays qui votent le plus, ou encore créer des graphiques originaux d’affichage des vainqueurs. Toute originalité dans l’exploitation des données est bienvenue !
  • L’Abdia possède un concept de communication : le logo est un masque mêlant masque africain traditionnel et “masque” virtuel des réseaux sociaux. Toutes les déclinaisons les plus originales, que ce soit en graphisme, en vidéo, ou en stratégie virale, sont bienvenues pour enrichir le plan de communication (de la cérémonie comme du show caritatif).

Sources et données disponibles : Excel des données intermédiaires de l’Abdia (catégories, nominés, profils, certaines données sont fictives à titre indicatif si besoin…), docs de présentation du projet Abdia, doc de présentation du concept de communication.



10- Accompagner la clientèle pro du Crédit Agricole en sortie de confinement

Interlocuteur : Soraya Tatem

Objectif : La crise engendrée par le COVID-19 est une période difficile pour tout le monde mais plus particulièrement pour la clientèle professionnelle, même si le gouvernement a mis en place un vaste plan de soutien à destination des entreprises (suppression de charges, chômage partiel, Prêt Garanti par l’Etat, etc.). Les différents secteurs ne sont pas impactés de la même manière : les secteurs du tourisme et de la culture sont par exemple bien plus affectés par les mesures de restriction gouvernementales que le secteur de la grande distribution. L’intérêt est de prédire la reprise d’activité de notre clientèle professionnelle dans un contexte de sortie de confinement en mars 2021 afin de mettre en place un accompagnement bancaire personnalisé et adapté.

Cible : Les clients professionnels du Crédit Agricole Languedoc

Missions :

  • Réaliser des traitements de Data Science et des visualisations associées pour :
    • Estimer le chiffre d’affaires 2020
    • Et prédire le chiffre d’affaires 2021, au regard des données historisées depuis 2018, telles que les flux créditeurs, le solde du compte courant, des éléments comptables, le code APE permettant d'identifier la branche d'activité, ou encore la zone géographique.
  • Catégoriser les différentes situations et définir des pistes d'accompagnement bancaire adapté à chaque situation.
  • Créer une plateforme d'accueil à destination des professionnels dont l’intérêt est de :
    • Mettre à disposition une vision de notre positionnement sur le marché
    • Et de faire de l’acquisition digitale

Sources et données disponibles : Fichiers de données fournis



Contact