« Faire plus avec moins » : pourquoi les services de cloud public sont essentiels pour l’IA et le HPC dans une année 2023 incertaine
Cet article fait partie d’une série VB Lab Insights sur l’IA sponsorisée par Microsoft et Nvidia.
Ne manquez pas les articles supplémentaires de cette série fournissant de nouvelles informations, tendances et analyses du secteur sur la façon dont l’IA transforme les organisations. Retrouvez-les tous ici.
Dans un contexte d’incertitude généralisée, les entreprises en 2023 seront confrontées à de nouvelles pressions pour innover de manière rentable et améliorer la durabilité et la résilience, pour moins d’argent. Pour les organisations de toutes tailles et de tous les secteurs, prudent Suites C – préoccupés par la récession, l’inflation, les valorisations, la politique budgétaire, les coûts de l’énergie, la pandémie, les chaînes d’approvisionnement, la guerre et d’autres problèmes politiques – ont fait «faire plus avec moins» à l’ordre du jour.
Après deux ans d’investissements massifs, de nombreuses entreprises réduisent leurs dépenses d’investissement dans la technologie et examinent de plus près les dépenses informatiques et le retour sur investissement. Pourtant, contrairement à de nombreuses périodes passées de restriction, le malaise actuel n’a pas encore conduit à des coupes généralisées et généralisées dans les budgets technologiques.
Les services de cloud public et d’infrastructure d’IA sont les principaux postes budgétaires
Au contraire, les récentes enquêtes et prévisions du secteur indiquent clairement une forte volonté des chefs d’entreprise de continuer à financer, voire d’accélérer, l’optimisation et la transformation stratégiques. Cela est particulièrement vrai pour les initiatives stratégiques d’IA, de durabilité, de résilience et d’innovation utilisant des clouds et des services publics pour prendre en charge des charges de travail critiques telles que la découverte de médicaments et la détection de fraude en temps réel.
Gartner prévoit que les dépenses mondiales en services de cloud public atteindront près de 600 milliards de dollars en 2023, en hausse de plus de 20 % d’une année sur l’autre. L’infrastructure en tant que service (IaaS) devrait être le segment à la croissance la plus rapide, avec des investissements en hausse de près de 30 %, à 150 milliards de dollars. Il est suivi par Platform as a Service (PaaS), à 23 %, à 136 milliards de dollars.
“Les pressions inflationnistes et les conditions macroéconomiques actuelles ont un effet d’entraînement et d’attraction sur les dépenses liées au cloud”, écrit Sid Nag, vice-président analyste chez Gartner. “Le cloud computing continuera d’être un bastion de sécurité et d’innovation, soutenant la croissance en ces temps incertains en raison de sa nature agile, élastique et évolutive.” L’entreprise prévoit une baisse continue de la croissance des dépenses de la technologie traditionnelle (sur site) jusqu’en 2025, lorsqu’elle sera éclipsée par le cloud (Figure 1). D’autres chercheurs constatent une croissance similaire dans des domaines connexes, notamment l’infrastructure d’IA (Figure 2).

Omar Khan, directeur général de Microsoft Azure, déclare que les budgétistes avisés des entreprises continuent de montrer une forte croyance stratégique dans les avantages et l’économie du cloud public, notamment l’élasticité des conditions de marché volatiles et la réduction des coûts de gestion et des frais généraux informatiques, ainsi qu’une appréciation plus sophistiquée pour nouvelles capacités “multidimensionnelles” telles que le traitement accéléré de l’IA.
Pourquoi le cloud public a désormais un sens commercial
Tirer parti des clouds publics pour faire progresser de manière rentable les initiatives commerciales et technologiques stratégiques est logique sur le plan historique, présent et futur, déclare Khan. Les services cloud d’aujourd’hui s’appuient sur une économie éprouvée, offrent de nouvelles capacités pour les impératifs actuels des entreprises et fournissent une base flexible et réutilisable pour demain. C’est particulièrement vrai pour l’infrastructure cloud et pour la mise à l’échelle de l’IA et du HPC en production, et voici pourquoi :
1. L’infrastructure et les services de cloud public offrent une rentabilité supérieure
Au cours de la décennie qui s’est écoulée depuis que le cloud a commencé à gagner du terrain, c’est devenu clair : le cloud offre des avantages économiques bien plus favorables que sur site.
Une analyse approfondie de 2022 par IDC sponsorisée par Microsoft a révélé un large éventail d’avantages financiers et commerciaux spectaculaires de la modernisation et de la migration avec le cloud public. Cela comprenait une baisse de 37 % des coûts d’exploitation et un retour sur investissement de 391 % en trois ans, ainsi qu’une augmentation des revenus de 139 millions de dollars par an et par organisation.
Bien qu’ils ne soient pas spécifiques à l’IA, des résultats aussi spectaculaires devraient impressionner même les directeurs financiers et les comités technologiques les plus exigeants. Comparez cela à une enquête récente qui a révélé seulement 17 % des personnes interrogées signalent une utilisation élevée de ressources matérielles, logicielles et cloud valant des millions – une grande partie pour l’IA.
Khan dit que lors de la présentation du cas, évitez les comparaisons simplistes de la charge de travail des coûts de A à B. Au lieu de cela, il conseille de se concentrer sur le chiffre important : TCO (coût total de possession). Dave Salvator, directeur du marketing produit chez Nvidia’s Accelerated Computing Group, note que le traitement de modèles d’IA sur de puissants systèmes chronométrés permet d’économiser de l’argent car il est plus rapide et donc moins coûteux. La faible utilisation des ressources informatiques, ajoute-t-il, signifie que les organisations sont assises sur des capacités inutilisées et affichent un retour sur investissement et un coût total de possession bien meilleurs en redimensionnant correctement le cloud et en n’utilisant que ce dont ils ont besoin.
2. L’infrastructure cloud et les supercalculateurs spécialement conçus répondent aux exigences élevées de l’IA
L’infrastructure est de plus en plus perçue comme un point d’étranglement fatal pour les initiatives d’IA. Pierre Ruthenvice-président de la recherche d’IDC et responsable de la recherche mondiale sur les solutions de calcul intensif de performance, déclare : “(Nos) recherches montrent systématiquement qu’une le manque de capacités d’infrastructure spécialement conçues est souvent la cause de l’échec des projets d’IA.Il conclut : « L’infrastructure d’IA reste l’une des décisions d’infrastructure les plus importantes mais les moins matures que les organisations prennent dans le cadre de leur future entreprise.
Les raisons, bien que complexes, se résument à ceci : les exigences de performances pour l’IA et le HPC sont radicalement différentes des autres applications d’entreprise. Contrairement à de nombreuses charges de travail cloud conventionnelles, des modèles d’IA de plus en plus sophistiqués et énormes avec des milliards de paramètres nécessitent des quantités massives de puissance de traitement ainsi qu’une mise en réseau et un stockage ultra-rapides à chaque étape pour les applications en temps réel allant du traitement du langage naturel (NLP) à l’automatisation robotique des processus ( RPA) à l’apprentissage automatique et à l’apprentissage profond, à la vision par ordinateur et autres.
“L’accélération est vraiment le seul moyen de gérer un grand nombre de ces charges de travail de pointe. Ce sont des enjeux de table », explique Salvator de Nvidia. « Notamment pour la formation, car les réseaux continuent de croître massivement en termes de taille et de complexité architecturale. La seule façon de suivre le rythme est de s’entraîner dans un délai raisonnable mesuré en heures ou peut-être en jours, par opposition à des semaines, des mois ou peut-être des années.
Ces demandes ont conduit au développement de nouvelles façons innovantes de fournir des infrastructures spécialisées de mise à l’échelle et de mise à l’échelle capables de gérer les énormes demandes de grands modèles de langage (LLM) ou alors modèles de transformateur et d’autres approches à évolution rapide dans un environnement de cloud public. Ces architectures spécialement conçues intègrent des GPU et des accélérateurs à cœur de tenseur avancés avec des logiciels, des interconnexions à large bande passante et à faible latence et des méthodes de communication parallèles avancées, entrelaçant le calcul et les communications sur un grand nombre de nœuds de calcul.
Un signe encourageant : Une récente enquête IDC auprès de plus de 2 000 chefs d’entreprise a révélé une prise de conscience croissante que une architecture spécialement conçue sera cruciale pour le succès de l’IA.
3. L’optimisation du cloud public répond à un large éventail de besoins pressants des entreprises
Au début, note Khan de Microsoft, une grande partie des avantages du cloud provenaient de l’optimisation des dépenses technologiques pour répondre aux besoins d’élasticité (“Ne payez que pour ce que vous utilisez”.) Aujourd’hui, dit-il, les avantages sont toujours enracinés dans le passage d’un un modèle à coût variable. Mais, ajoute-t-il, « de plus en plus d’entreprises réalisent que les avantages vont au-delà de cela » en faisant avancer les objectifs de l’entreprise. Considérez ces exemples :
Everseen a développé une solution propriétaire d’IA visuelle capable de surveiller, d’analyser et de corriger les problèmes majeurs des processus métier en temps réel. Rafael Alegre, directeur de l’exploitation de Cork, Irlande constructeur de solutions, affirme que la capacité aide à réduire la « démarque inconnue » (terme utilisé dans l’industrie de la vente au détail pour désigner les stocks non comptabilisés), à augmenter les ventes mobiles et à optimiser les opérations dans les centres de distribution.
Mass General Brigham, le partenariat de soins de santé basé à Boston, a récemment déployé un service d’imagerie médicale fonctionnant sur une plate-forme cloud ouverte. Le système met pour la première fois à grande échelle des outils de diagnostic basés sur l’IA entre les mains des radiologues et d’autres cliniciens et fournit des informations sur les patients, de l’imagerie diagnostique aux flux de travail cliniques et administratifs. Par exemple, un modèle d’IA de densité mammaire a réduit le délai d’attente des résultats de plusieurs jours à seulement 15 minutes. Les femmes peuvent désormais parler à un clinicien des résultats de leur examen et discuter des prochaines étapes avant de quitter l’établissement, plutôt que d’endurer le stress et l’anxiété d’attendre le résultat.
4. L’énergie est une préoccupation à trois volets pour les entreprises du monde entier
Les prix de l’énergie ont explosé, notamment en Europe. Les réseaux électriques de certains endroits sont devenus instables en raison de phénomènes météorologiques violents et de catastrophes naturelles, de surcapacité, d’attaques terroristes, d’un mauvais entretien, etc. Une étude influente de Microsoft en 2018 a révélé que l’utilisation d’un La plate-forme cloud peut être près de deux fois plus économe en énergie et en carbone que les solutions sur site. De nouvelles bonnes pratiques pour optimiser l’efficacité énergétique sur les clouds publics promesse d’aider les entreprises et d’atteindre les objectifs de durabilité — même (et surtout) dans un environnement électrique en pleine mutation.
À venir : le supercalcul de l’IA basé sur le cloud
IDC prévoit que d’ici 2025, près de 50 % de toutes les infrastructures accélérées pour le calcul intensif (y compris l’IA et le HPC) seront basées sur le cloud.
À cette fin, Microsoft et Nvidia ont annoncé une collaboration pluriannuelle pour construire l’un des supercalculateurs IA les plus puissants au monde. Le système basé sur le cloud aidera les entreprises à former, déployer et faire évoluer l’IA, y compris de grands modèles à la pointe de la technologie, sur des machines virtuelles optimisées pour la formation et l’inférence distribuées par l’IA.
“Nous travaillons ensemble pour apporter le supercalcul et l’IA aux clients qui, autrement, ont une barrière à l’entrée”, explique Khan. “Nous travaillons également à faire des choses comme rendre des fractions de GPU disponibles via le cloud, afin que les clients aient accès à ce qui était auparavant très difficile à acquérir par eux-mêmes, afin qu’ils puissent tirer parti des dernières innovations en matière d’IA. Nous repoussons les limites du possible. »
Dans le meilleur des cas, les services de cloud public ont un sens économique évident pour l’optimisation, la transformation, la durabilité, l’innovation et l’IA de l’entreprise. En période d’incertitude, c’est une décision encore plus intelligente.
En savoir plus sur Faites de l’IA votre réalité.
#MakeAIYourReality #AzureHPCAI #NVIDIAonAzure
Le contenu de VB Lab Insights est créé en collaboration avec une entreprise qui paie pour la publication ou qui a une relation commerciale avec VentureBeat, et ils sont toujours clairement indiqués. Pour plus d’informations, contactez [email protected]
« Faire plus avec moins » : pourquoi les services de cloud public sont essentiels pour l’IA et le HPC dans une année 2023 incertaine