🔥
Blend Bilalli
Expert IA (Expert LLM & Agentic AI)
📑Stratégie • 💻Architecture • 💡Infra • Delivery (Idea/POC → Prod) • 📔Formation/Intervention
J'accompagne des organisations (grands comptes & secteur public) dans la conception, le déploiement et l'industrialisation de solutions d'IA générative : architectures LLM / RAG / agents, intégration au SI (APIs, data, IAM, réseau, outils métiers), sécurité & gouvernance, passage POC → production et montée en compétence des équipes.
🚩Parcours
IA conversationnelle et IA d'analyse data dès 2017/2018 (chatbots acquisition / SAV, etc.), puis GenAI / LLM / Agentic AI en environnements entreprise (consulting) à partir de 2021-2022/2023.
📍Europe, France: Paris / Sud de la France • Remote : OK
💡Mon expertise
Je conçois la stratégie, je définis les architectures, je fais tourner les POC, et j'aide les équipes à passer en production.
Stratégie IA & feuille de route GenAI
Co-construction de roadmaps IA / GenAI : identification et priorisation des cas d'usage, estimation du ROI, analyse des risques (techniques, sécurité, réglementaires), définition de la gouvernance (rôles, process, outils), arbitrage build vs buy et cadrage des jalons POC → pilote → production.
Cadrage fonctionnel & avant-vente IA
Animation de workshops de cadrage avec les métiers, l'IT et la direction (use-cases, contraintes, datasets, outils existants). Production de dossiers de décision : architectures cibles, scénarios d'implémentation, choix de plateformes (LLM, vector DB, orchestrateurs, no-code), chiffrage et plan de delivery.
Architecture cible & design de solutions GenAI / Agentic AI
Conception d'architectures de bout en bout autour des LLM : APIs, pipelines RAG, agents métier, bases vectorielles, orchestrateurs, intégration au SI (auth, IAM, data, réseau, applications métiers). Prise en compte explicite des contraintes de latence, SLO, résilience, coût et périmètre d'impact.
Delivery : du POC à la mise en production
Pilotage ou co-pilotage de la mise en œuvre : POC exploratoires, prototypage rapide, consolidation en MVP, durcissement infra / sécurité, mise en production progressive (pilote, montée en charge). Mise en place de patterns réutilisables (templates RAG, patterns d'agents, guidelines d'intégration).
Infra & intégration cloud / SI existant
Déploiement de ces solutions en environnements cloud, hybrides ou on-prem, en s'appuyant sur les briques déjà en place (conteneurs, serverless, queues, schedulers, vaults, monitoring). Intégration avec les systèmes d'identité (IAM / RBAC), les réseaux internes (VNet/VPC, endpoints privés) et les outils métiers (CRM, M365, etc.).
Gouvernance, sécurité & acculturation des équipes
Mise en place de garde-fous (prompt injection, data leakage, abus), règles de data handling et pratiques LLMOps (versionning, évaluation, observabilité). Acculturation des équipes (IT, data, métiers) via ateliers et formations, pour qu'elles comprennent quoi faire, comment le faire et où sont les limites.
📝Formation & interventions
Formations GenAI / LLM / Agents (IT, data, métiers, parfois direction)
Conception et animation de formations (½ journée à 2 jours) sur : fondamentaux LLM, RAG, agents, patterns d'intégration, risques (prompt injection, data leakage), gouvernance, bonnes pratiques d'industrialisation.
Ateliers d'acculturation (grands comptes & secteur public)
Workshops "use-cases GenAI", identification des quick wins, cadrage de POC, priorisation des cas d'usage. Co-animation avec DSI, directions métier, innovation.
Coaching & montée en compétence
Accompagnement de développeurs, data engineers et product sur les patterns modernes GenAI / Agentic AI, mise en place de playbooks, templates, checklists pour rendre les équipes autonomes.
🚩Parcours (2017 → aujourd'hui)
2017–2020
IA conversationnelle (chatbots acquisition & SAV)
  • Conception et déploiement de chatbots NLP "classiques" (intents, règles, flows) pour l'acquisition, la qualification et le support client.
  • Intégration avec CRM, outils métiers, APIs, déploiements en production chez des clients, dont certains grands comptes.
2021–2022
IA appliquée à l'acquisition (startup avec clients grands groupes)
  • Mise en place de pipelines IA pour la génération & qualification de leads (texte / vocal), automatisation de la prise de RDV.
  • Gestion de volumétries élevées (jusqu'à des millions de leads), intégrations avec CRM et outils commerciaux dans un contexte startup servant des clients grands groupes.
2022/2023–aujourd'hui
Consulting GenAI / LLM / Agentic AI (grands comptes & secteur public)
  • Interventions comme expert IA : cadrage, architecture, POC → prod, acculturation, formation.
  • Conception de solutions RAG, d'agents métier et de copilotes internes dans des environnements cloud & SI existants, avec contraintes fortes de sécurité & conformité.

Certains noms de clients et détails techniques sont volontairement génériques pour des raisons de confidentialité / NDA. Des références plus précises peuvent être partagées en entretien.
💻Projets (sélections)
(Me contacter directement pour en savoir plus)
📁Asmodee, leader mondial (CA +2Mds/an)
Grand groupe
Expert IA et Cloud.
Asmodee est un grand groupe international spécialisé dans les jeux de société, cartes, jeux de rôle et jeux de plateau (CATAN, Ticket to Ride, Dobble, Dixit, 7 Wonders, Pandemic, etc.).
Fondé en 1995 en France, le groupe est aujourd’hui un leader mondial du jeu de société, avec des studios, des marques et une distribution dans de nombreux pays. Son cœur de métier :
  • Créer, éditer et distribuer des jeux de société,
  • Gérer un catalogue énorme de licences et d’IP,
  • Développer aussi des adaptations numériques et plateformes en ligne (ex. Board Game Arena).
Contexte
Conception et cadrage de l’architecture infrastructure pour les usages IA sur l’ensemble des secteurs du groupe (on-premise et multi-cloud). Définition des standards, schémas cibles et bonnes pratiques (sécurité, performance, coûts) en lien direct avec le DSI et les équipes techniques.
Objectif
Plusieurs objectifs:
Comprendre les enjeux liées au cloud
Définir une stratégie multi-cloud
Analyser les solutions IA déjà en place
Sortir des "POC isolé" et définir une architecture et infra cible + trajectoire d'industrialisation réaliste (performance, coûts, sécurité, gouvernance).
Solution
  • cadrage des cas d'usage prioritaires et des contraintes DSI/RSSI,
  • design d'une architecture GenAI modulaire (RAG, services d'inférence, orchestrateur, observabilité),
  • design d'une infra on-perm et cloud
  • définition des patterns de déploiement (environnements, IAM, secrets, réseau) & des runbooks d'exploitation.
Résultat : architecture et infra cible, plan POC → prod aligné avec les contraintes internes, analyse complètes des outils et projets IA en place.

📁Superleadweb, Génération, qualification de leads & prise de RDV à grande échelle avec IA
Clients PME à grands comptes
Expert IA et Cloud
Superleadweb a développé une plateforme d’acquisition commerciale à grande échelle qui automatise toute la chaîne prospect → qualification → rendez-vous.
Contexte
Chez Superleadweb, dans un contexte de génération et qualification à très gros volumes (PME → grands comptes), l’objectif était d’industrialiser un modèle d’acquisition quasi autonome capable de générer, qualifier et transformer des prospects en rendez-vous commerciaux sans surcharge humaine.
Pour y parvenir, j’ai conçu une architecture basée sur des agents IA spécialisés (multi-agents) qui coopèrent dans un pipeline :
  • Agent d’enrichissement : collecte/normalise les signaux (données entreprise, rôle, techno, taille, intent, etc.) et prépare un profil exploitable.
  • Agent de scoring : évalue la probabilité de conversion (fit + intent) et priorise les actions.
  • Agent de qualification (texte / vocal) : mène un échange structuré, détecte besoins/objections, récupère les critères clés et met à jour le statut MQL/SQL.
  • Agent de séquençage & orchestration : déclenche automatiquement les actions (emails, relances, messages, tâches CRM), choisit le bon canal, le bon timing et le bon script.
  • Agent “RDV” : gère la prise de rendez-vous (qualification finale, proposition de créneaux, confirmations, no-show mitigation) via intégration calendrier.
  • Agent de contrôle/guardrails : vérifie conformité, ton, règles métier, anti-hallucination et conditions d’arrêt/escalade vers un humain.
Le système s’appuie sur des outils connectés (CRM, outils de prospection, calendriers, téléphonie/voix, bases d’enrichissement), et sur une couche Cloud/MLOps : monitoring, traçabilité des conversations, evaluation des performances, A/B tests, et boucles de feedback (retours sales, outcomes RDV, conversions) pour améliorer en continu prompts, policies, modèles et stratégies d’orchestration.
Objectif
Automatiser l'acquisition, la qualification et la prise de rendez-vous commerciaux sur de gros volumes.
Solution
  • pipeline IA interne (texte / vocal) combinant scoring, qualification et orchestration d'actions,
  • intégrations avec CRM, outils de prospection, calendriers,
  • boucles de feedback pour améliorer en continu les taux de conversion.
Résultat : Génération et qualification de millions de leads et montée en charge d’un moteur d’acquisition fortement automatisé, capable de traiter des volumes massifs et de générer des millions de leads, avec une amélioration progressive des taux de qualification et de prise de RDV.

📁Relevo, Starup incubateur Microsoft.
Startup
Co-founder, Expert IA
C’est une start-up qui permet aux particuliers de louer leur propre borne de recharge pour voitures électriques. L’entreprise met en relation les propriétaires de bornes avec des conducteurs de véhicules électriques qui ont besoin de se recharger. Elle fournit une application simple pour gérer la disponibilité, les réservations et les paiements grâce à l'IA. La start-up optimise aussi les horaires et les tarifs de recharge pour garantir une utilisation maximale des bornes tout en offrant une solution pratique, économique et locale aux utilisateurs.
Objectif
Réduire le temps de recherche d'information et fiabiliser les réponses pour les clients.
Solution
  • pipeline RAG (ingestion SharePoint/PDF, embeddings, vector search),
  • agent métier capable de chaîner retrieval + raisonnement + actions via tool-calling,
  • garde-fous (filtrage, contrôle de périmètre, logs complet des interactions).
Stack : LLM (OpenAI / Azure OpenAI), vector DB (ex : Qdrant / Pinecone), intégration M365, APIs internes, monitoring.
Résultat : Intégration d'agents de gestion IA pour le SAV, base technologique pour un déploiement élargi.
🔧 Compétences techniques
Langages & développement
Langages
Python (avancé), TypeScript / JavaScript, SQL.
Développement
Développement back-end (FastAPI, Node.js/Express) & front-end léger (React / Next.js) pour interfaces de copilotes et outils internes.
Architectures
Architectures API-first, services asynchrones, intégration via REST / webhooks.
IA, LLM & Agentic AI
LLM
OpenAI / Azure OpenAI (GPT-4/4o), Claude, Mistral, modèles open-source (Hugging Face, etc.)
Patterns GenAI
RAG, QA, summarization, extraction structurée, classification sémantique, génération contrôlée.
Agentic AI
Conception d'agents métier, orchestration multi-agents, tool-calling, gestion du contexte & de la mémoire.
Frameworks & données (RAG / vector search)
Frameworks LLM / agents
LangGraph, LangChain, Semantic Kernel, etc.
Vector search & RAG
FAISS, Qdrant, Pinecone ; ingestion de contenus (PDF, web, SharePoint, bases de données), chunking, indexation avec métadonnées.
Conception de pipelines RAG avec retrieval hybride (sémantique + lexical) et logs complets pour évaluation.
Cloud, infra & automatisation
Cloud & infra
Déploiements en environnements cloud / hybrides (Azure, runpod, google, AWS, conteneurs, serverless, etc)
Sécurité & IAM
Intégration avec IAM / RBAC, gestion de secrets, isolation des environnements, exposition sécurisée de services IA (API gateway, auth applicative).
No-code/Low-code / orchestration
n8n, Make (Integromat), Kestra, pour orchestrer IA + SI métier (CRM, outils internes, calendriers).
Observabilité, gouvernance & bonnes pratiques
Observabilité
Logs structurés, métriques, traces, dashboards d'usage (latence, erreurs, consommation tokens/coûts).
LLMOps
Versionning de prompts / configurations, traces complètes des runs (prompt, contextes, tools, outputs), boucles d'évaluation offline/online.
Gouvernance & sécurité IA
Garde-fous (prompt injection, data leakage), policies de data handling, auditabilité des interactions IA.
👍Contribution à l'écosystème
Formation & acculturation
Conception et animation de formations GenAI/LLM/agents (IT, data, métiers, parfois COMEX), avec démos, labs et supports réutilisables.
Bug bounty / responsible disclosure
Contributions sécurité auprès d'acteurs majeurs de l'écosystème LLM (signalements responsables, acknowledgements partageables selon confidentialité). Faille de sécurité critique. Possibilité d'en discuter en privé.
Secteur public / gouvernemental
Interventions en contexte à fortes contraintes de sécurité & conformité (réglementation, cloisonnement, exigences d'audit).
🎓Éducation
2017–2020
KEDGE, Master in Business Engineering
Double compétence business & technique, orientée stratégie, produit et exécution.
2015–2017
CPGE MPSI/PSI (math sup/math spé)
Formation scientifique intensive (maths, physique, informatique).
Langues
Anglais
Français
Albanais
Espagnol
📞 Contact & Disponibilité
France
Paris / Sud de la France
Remote
OK

Références clients, détails techniques et exemples de livrables peuvent être partagés en entretien.