Pour gérer vos consentements :
Actualités: ENTREPRISE

OpenShift AI 2.20 : Red Hat déploie un catalogue de modèles IA validés

Red Hat étoffe son offre en matière d’intelligence artificielle en entreprise avec une série de mises à jour techniques et de nouvelles intégrations. Le composant Red Hat AI Inference Server est désormais intégré à Red Hat OpenShift AI et Red Hat Enterprise Linux AI (RHEL AI), et peut également être utilisé comme solution indépendante. Il vise à simplifier l’inférence à grande échelle sur des infrastructures hybrides, en apportant cohérence et performance aux déploiements.

Un serveur d’inférence pour uniformiser les déploiements IA

« Le nouveau critère de décision pour l’innovation en matière d’IA générative se situe dans l’émergence de solutions d’inférence de modèles plus rapides et plus efficaces. Grâce à ses capacités d’inférences renforcées avec Red Hat AI Inference Server et le nouvel ensemble de modèles validés par des tiers, Red Hat AI donne aux entreprises les moyens de déployer des applications intelligentes à l’endroit où elles en ont besoin, de la manière dont elles le souhaitent et à l’aide des composants qui répondent le mieux à leurs besoins spécifiques », déclare Joe Fernandes, vice president and general manager, AI Business Unit, Red Hat.

Les modèles disponibles via Red Hat AI sont hébergés sur Hugging Face et validés par des tiers. Ils sont testés pour fonctionner efficacement sur les plateformes Red Hat, et certains bénéficient d’optimisations par compression afin de réduire leur taille, d’accélérer l’inférence et de limiter la consommation de ressources. Ce processus de validation continue vise à renforcer la reproductibilité et la fiabilité des résultats obtenus.

Llama Stack et MCP au cœur de l’IA générative chez Red Hat

Pour répondre aux enjeux d’interopérabilité, Red Hat intègre désormais les API Llama Stack et Model Context Protocol. Llama Stack propose une interface unifiée autour des capacités de génération augmentée par récupération (RAG), d’évaluation de modèles, de garde-fous et d’agents. Quant à MCP, il offre un moyen standardisé de connecter les modèles à des APIs, des plug-ins ou des sources de données dans des workflows agentiques.

Selon Michele Rosen, research manager chez IDC, « les entreprises sont en train de terminer la phase d’exploration initiale de l’IA et se concentrent sur les déploiements concrets. […] Pour les entreprises qui cherchent à mettre à l’échelle leurs projets d’IA et à créer de la valeur métier, cette flexibilité constitue un critère indispensable. »

OpenShift AI 2.20 et RHEL AI 1.5 : de nouvelles capacités d’entraînement et de monitoring

La version 2.20 de Red Hat OpenShift AI introduit plusieurs évolutions en avant-première, comme :

  • Un catalogue de modèles validés, accessible depuis la console en ligne, facilitant leur déploiement sur les clusters OpenShift AI.

  • L’intégration du KubeFlow Training Operator, qui permet un entraînement distribué sur GPU avec accélération réseau RDMA.

  • Un magasin de fonctionnalités basé sur Kubeflow Feast, pour centraliser la gestion des données utilisées lors de l’entraînement et de l’inférence.

Côté RHEL AI, la version 1.5 apporte des fonctions multilingues étendues pour l’espagnol, le français, l’allemand et l’italien, ainsi qu’un support prévu pour le japonais, le coréen et le hindi. Les utilisateurs peuvent personnaliser leurs modèles en combinant leurs propres jeux de données avec la technologie InstructLab.

La disponibilité de RHEL AI sur Google Cloud Marketplace vient s’ajouter aux options AWS et Azure, pour faciliter la gestion de workloads IA sur cloud public. Par ailleurs, Red Hat AI InstructLab est désormais proposé sur IBM Cloud pour un accès simplifié à la personnalisation des modèles à grande échelle.

RETEX : « La formation est au cœur de notre métier », ou comment StartX accompagne les entreprises face aux enjeux de l’IA

À propos de ChannelBiz : 

ChannelBiz.fr est le média des partenaires de distribution IT & Tech en France : Intégrateurs, revendeurs, et MSP/MSSP. Chaque semaine, nous proposons à nos 9000 abonnés 2 newsletters autour des actualités et des enjeux majeurs du Channel : infra & Cloud, Cybersécurité ; Workspace & AV ; Telecom; et Business Apps. Nous éditons également chaque trimestre « ChannelBiz : Le Mag » : un magazine de 60 pages, pour prendre du recul sur les tendances fortes du marché. Et pour ne rien rater de l’actualité du Channel au quotidien, rejoignez notre page Linkedin ChannelBiz


Guilhem Therond

Articles récents

MSP : Hermitage Solutions distribuera Cybershen, plateforme SaaS pour la cybersécurité des PME

Les entreprises de taille intermédiaire font face à des exigences croissantes en matière de protection…

17 heures années

“Nous fournissons un SOC pragmatique aux infogérants français” : Cyna structure un modèle pensé pour les prestataires IT de proximité

Les PME attendent de leurs infogérants des réponses concrètes en cybersécurité. Mais peu disposent de…

23 heures années

Outils dispersés et surcharge humaine, la double peine des SOC

Alors que les menaces externes s’intensifient et que les solutions d’IA s’invitent dans les processus,…

2 jours années

CRM et MarTech : efficy nomme Pierre Thauron Responsable Partenaires France

efficy, éditeur européen de plateformes CRM et MarTech, continue d’étoffer sa stratégie de distribution indirecte…

2 jours années

Guide cybersécurité 2025 : le CYBIAH, hub francilien, référence Mailinblack parmi les solutions souveraines

La solution de protection de messagerie Protect, conçue par l’éditeur français Mailinblack, figure désormais dans…

2 jours années

Acronis connecte 300 outils pour réduire la complexité des environnements MSP

Acronis annonce avoir franchi le cap des 300 intégrations technologiques au sein de sa plateforme…

3 jours années