Banque Finance Assurances

Industrie

Énergie

Services

Santé

Secteur public

Suivi de la production d’énergie verte (Energie, Architecture)

Notre client dispose de nombreuses fermes solaires et éoliennes tout autour du globe.
Chaque dispositif (éolienne ou panneau solaire) est équipé de capteurs, remontant des informations à intervalle de temps régulier.
Objectifs :

Les données de l’ensemble des capteurs sont rassemblées et traitées – notamment – pour :

  • Suivre la production effective de chaque dispositif (panneau solaire ou éolienne) et l’opposer aux données constructeur
  • Anticiper des opérations de maintenance
  • Affiner sa connaissance des infrastructures Projet
  • Déploiement des briques définitives, suite à une première phase de MVP
  • Ingestion, nettoyage et normalisation des données
  • Industrialisation de la brique d’ingestion (sources de données hétérogènes)

Module de validation automatique de conformité juridique pour les publicités (Banque, Analyse de texte, Analyse d’image)

Le client souhaite disposer d’une solution permettant de valider automatiquement la conformité juridique des publicités qu’il émet.

  • Typographie
  • Présence de mentions textuelles fixes
  • Présence de mentions textuelles variables, c’est-à-dire dont la formulation précise peut varier Ces vérifications étaient effectuées manuellement auparavant

Objectif

Développer une solution d’analyse de texte et de traitement du langage qui permet de détecter certaines non conformités juridiques. Projet Reconnaissance et extraction automatique des différentes parties composant une publicité (en-tête, accroche, corps de publicités, etc.)

Implémentation de règles typographiques complexes : présence d’un texte obligatoire, validation de la taille du texte en fonction de sa position dans le document et la présence d’autre mentions, etc.

Machine Learning pour l’analyse sémantique: détection des différentes formulations possibles correspondant à un même message et de concepts abstraits, sujets à interprétation humaine

Prédiction du manque à gagner au sein des universités (Service Restauration, Interprétabilité des modèles, Model as a code)

Notre client est un groupe leader de la restauration collective souhaitant comprendre et prioriser l’impact de ses stratégies commerciales au sein des universités dans lesquelles il est implanté.

Objectifs:

  • Prédire la part de marché réellement captée et en déduire le manque à gagner afin de prioriser la stratégie commerciale. Projet Prédiction de la part de marché captée et des revenus sur le campus
  • Collecte de données au travers d’API
  • Analyse des données internes : Enquêtes détaillées de consommation, Enquêtes de satisfaction, Caractéristiques des consommateurs et universités
  • Etude de l’impact de différentes sources de données externes : Yelp, Google Places, données climatiques
  • Pré-industrialisation du code : architecture de code utilisant le Domain Driven Design
  • Etudes d’intelligibilité des modèles prédictifs (Shap, etc.)

Analyse de fiches médicales de patientes atteintes du cancer du sein (Service Public Hôpital, Analyse de texte)

Les hôpitaux publics accumulent de nombreuses informations sur les patient qu’ils traitent. La structuration de ces fiches représente un enjeu important pour l’amélioration du fonctionnement d’un service, et plus généralement pour la recherche médicale

Analyse de ces fiches (fichiers Word sous forme de texte non-structuré) par des méthodes de Traitement Automatique des Langues et réalisation d’études statistiques sur des cohortes très importantes, permettant par exemple de déterminer l’influence d’un traitement donné sur l’évolution d’une pathologie.

Projet :

  • L’anonymisation et la dé-identification des données
  • La structuration des fiches médicales par extraction d’entités nommées
  • L’analyse statistique de la cohorte de patientes
  • La recherche de corrélation par des méthodes de Traitement Automatique des Langues

Logiciel d’optimisation de la qualité du service (Transport, data visualisation, model as a code)

Collaboration ANOVA – Opérateur mondial du transport urbain

  • Co-construction d’un logiciel de visualisation et d’optimisation de l’offre de service de transport
  • Déploiement du logiciel dans plusieurs villes
  • Élément différenciant pour gagner de nouveaux marchés Projet
  • Mise en qualité de sources de données multiples (validations voyageurs, horaires théoriques et réels, variabilité des formats entre les villes)
  • Mise en place d’un environnement de développement robuste et scalable
  • Application web interactive pour représenter des indicateur métier

Définition et implémentation d’une Stratégie Data (Mutuelle, Stratégie Data)

Notre client est un acteur offrant des services variés aux professionnels de santé et institutions, à travers une multitude d'entités. Nous l’avons accompagné dans la construction de sa Stratégie Data, pour relever les défis et exploiter les synergies existantes au niveau du groupe.

L’objectif est double : lancer une dynamique de projets au niveau du groupe et bâtir les conditions de l’innovation (organisation, gouvernance,…) afin que la dynamique soit pérenne et réponde aux enjeux des différentes entités en exploitant le patrimoine de données.

Projet : Cartographie des données et des initiatives existantes

  • Liste priorisée de 110 use cases pour alimenter la feuille de route
  • Organisation d’un Data Day pour acculturer et lancer la dynamique
  • Mise en place d’un centre de services Data au niveau du groupe pour répondre aux besoins des entités (Organisation et gouvernance des données)