Data Engineering
Le Data Engineering (ingénierie des données) désigne l’ensemble des pratiques permettant de collecter, transformer, organiser et distribuer les données afin qu’elles puissent être utilisées efficacement.
Dans un contexte où les données proviennent de sources multiples, souvent brutes et non structurées, le CATIE joue un rôle clé en assurant leur récupération, leur nettoyage, leur transformation et leur stockage, pour les rendre accessibles et exploitables.
Déploiement des modèles d’IA
Le déploiement de modèles d’IA consiste à mettre un modèle machine learning ou deep learning en production, afin qu’il puisse être utilisé de manière opérationnelle dans des environnements réels : applications web, applications mobiles, systèmes embarqués, etc.
L’objectif est de permettre aux utilisateurs ou systèmes d’obtenir des prédictions en temps réel ou à la demande, tout en garantissant performance, sécurité et scalabilité.
Un déploiement efficace repose sur une infrastructure robuste et sécurisée, adaptée aux contraintes du projet :
-
Cloud computing (AWS, GCP, Azure) : flexible, évolutif, idéal pour les projets à grande échelle.
-
Edge AI / systèmes embarqués : utile pour les traitements en local avec faible latence.
-
On-premise : pour des cas exigeant un haut niveau de confidentialité (secteur médical, industriel…).
Pour optimiser le déploiement, le CATIE travaille sur le réduction de la taille du modèle (quantization, pruning, distillation), la minimisation de la latence (modèles optimisés pour l’inférence) et la limitation des coûts d’infrastructure via le bon choix de hardware (GPU, TPU, CPU) et la scalabilité dynamique.