Ce que signifie vraiment le stockage à grande échelle

Soyons clairs: Hyperscale ne dépend pas de votre taille.

Les organisations n'ont pas besoin d'être énormes pour tirer parti des solutions à grande échelle. Mais c'est exactement ce que pensent de nombreux professionnels de l'infrastructure informatique, des opérations et des devops lorsqu'ils découvrent l'hyperscale pour la première fois.

La croyance dominante est que l'architecture hyperscale est destinée à des infrastructures extrêmement grandes - comme celles exploitées par LinkedIn, Amazon ou Netflix - car elle s'adapte à des milliers d'instances et de pétaoctets de données. En fin de compte, il vaut mieux considérer l'hyperscale comme décrivant une approche plutôt que par sa taille . Il s'agit d'automatisation, d'orchestration et de développement informatique qui évolue intelligemment au fur et à mesure que l'entreprise en a besoin. Les déploiements à grande échelle peuvent et doivent commencer petit, puis évoluer indéfiniment. Ils devraient également vous permettre de mettre à l'échelle de manière indépendante uniquement la partie de l'infrastructure qui en a besoin, ce qui va à l'encontre d'une autre tendance émergente des datacenters d'entreprise, l'hyperconvergence.

Confus encore? Si c'est le cas, vous n'êtes pas seul. Plongeons un peu plus profondément.

Définition de l'hyperscale

Le concept de construction d'une architecture à grande échelle est brouillé par de nombreux termes tangentiels. En particulier, nous voyons des clients confus au sujet de l'infrastructure hyperconvergée, hyperscale (ou à l'échelle du Web), convergée, définie par logiciel et basée sur les produits de base.

Prenons un moment pour clarifier les définitions de ces termes d'ingrédients:

  • Définie par logiciel: Infrastructure où la fonctionnalité est complètement découplée du matériel sous-jacent et est à la fois extensible et programmatique. Lisez cet article pour notre élaboration sur le stockage défini par logiciel en particulier.
  • Basée sur les produits de base: Infrastructure construite sur une infrastructure standard ou standard, généralement un serveur x86 monté en rack ou lame. Comme nous l'avons écrit dans le passé, ne confondez pas les produits de base avec les produits bon marché.
  • Convergée: une architecture évolutive où les composants de serveur, de stockage, de réseau et de virtualisation / conteneurisation sont liés ensemble en tant que solution pré-testée et pré-intégrée. Les composants sont toujours distincts dans cette architecture.
  • Hyperconvergée: une architecture évolutive qui pousse l'infrastructure convergée encore plus loin en combinant des composants définis par logiciel au-dessus du matériel de base, emballé comme une solution unique - souvent une seule appliance. Les composants ne sont plus distincts.
  • Hyperscale: Une architecture évolutive qui est également définie par logiciel et basée sur les produits de base, mais où le serveur, le stockage, le réseau et les ressources de virtualisation / conteneurisation restent séparés. Chaque composant est distinct et peut être mis à l'échelle indépendamment.

En résumé, considérez l'infrastructure hyperconvergée comme l'extrême logique et moderne des systèmes convergents, alors que l'hyperscale est l'extrême moderne et logique de la façon dont nous construisons des centres de données depuis 30 ans. Les deux ont du sens pour des environnements spécifiques, comme indiqué ci-dessous.

Hyperscale et hyperconvergée

Chez Hedvig, nous nous efforçons de fournir une solution de stockage qui peut être adaptée de manière flexible à toute charge de travail, des clouds privés, y compris Docker et OpenStack, aux déploiements Big Data exécutant Hadoop ou NoSQL en passant par la virtualisation de serveur plus traditionnelle, la reprise après sinistre, la sauvegarde et l'archivage. La plate-forme de stockage distribué Hedvig virtualise et agrège le disque flash et le disque rotatif dans un cluster de serveurs ou un cloud, le présentant comme un système de stockage unique et élastique accessible par des interfaces de fichier, de bloc ou d'objet.

La plate-forme de stockage distribué Hedvig se compose de trois composants:

  • Hedvig Storage Service: un moteur de systèmes distribués breveté qui fait évoluer les performances et la capacité de stockage avec des serveurs x86 et ARM standard. Le service de stockage Hedvig peut être exécuté sur site ou sur des clouds publics comme AWS, Azure et Google. Il offre toutes les options et capacités de stockage requises pour un déploiement en entreprise, y compris la déduplication en ligne, la compression en ligne, les instantanés, les clones, le provisionnement léger, la hiérarchisation automatique et la mise en cache.
  • Proxy de stockage Hedvig: VM ou conteneur léger qui permet d'accéder au service de stockage Hedvig via des protocoles standard de l'industrie. Hedvig prend actuellement en charge NFS pour les fichiers et iSCSI pour les blocs, ainsi que les pilotes OpenStack Cinder et Docker. Le proxy de stockage Hedvig permet également la mise en cache et la déduplication côté client avec des ressources flash SSD et PCIe locales pour des lectures locales rapides et des transferts de données efficaces.
  • API Hedvig: API REST et RPC pour le stockage d'objets et les opérations Hedvig. Hedvig prend actuellement en charge Amazon S3 et Swift pour le stockage d'objets. Les développeurs et les administrateurs des opérations informatiques peuvent utiliser les API de gestion pour permettre l'accès à toutes les fonctionnalités de stockage Hedvig afin d'automatiser l'approvisionnement et la gestion avec des portails, des applications et des clouds en libre-service.

Hedvig prend en charge l'hyperconvergence en regroupant le proxy de stockage Hedvig et le service de stockage Hedvig en tant qu'appliance virtuelle s'exécutant sur un serveur standard avec un système d'exploitation hyperviseur ou de conteneur. Pour l'hyperscale, le service de stockage Hedvig est déployé sur des serveurs bare-metal pour former un niveau de stockage dédié tandis que le proxy de stockage Hedvig est déployé en tant que VM ou conteneur sur chaque serveur au niveau de calcul.

Pourquoi choisir l'hyperscale pour le stockage

Les données augmentent beaucoup plus rapidement que les budgets de stockage. L'économie est paralysante pour les entreprises qui ne disposent pas des ressources des goliaths Internet comme Amazon, Google et Facebook. Ainsi, les entreprises doivent adopter le stockage défini par logiciel et basé sur les produits de base pour réduire les coûts et conserver la flexibilité et l'évolutivité nécessaires pour répondre aux besoins de l'entreprise.

Chez Hedvig, nous avons remarqué qu'environ 80% du temps, les clients choisissent une architecture hyperscale plutôt que hyperconvergée, malgré le fait que nous prenons en charge les deux. Ce qui est encore plus intéressant, c'est que beaucoup de nos clients viennent nous voir en pensant exactement le contraire. Environ 80% demandent initialement une solution hyperconvergée, mais après avoir fait leurs devoirs, ils optent pour l'approche hyperscale.

Pourquoi? En un mot, car ils privilégient avant tout la flexibilité (ou l'agilité, si vous devez utiliser ce terme) lors de la conception de leur infrastructure. Considérer ce qui suit:

  • Un système hyperconvergé offre une approche informatique simplifiée «élémentaire». Pour les organisations informatiques allégées qui cherchent à réduire les frais généraux liés au déploiement et à l'expansion d'une infrastructure de type cloud, l'hyperconvergence constitue une bonne solution. Mais cela nécessite un ensemble de charges de travail relativement prévisible où la «localité des données» est une priorité absolue, ce qui signifie que l'application ou la machine virtuelle doit être située aussi près que possible des données. C'est pourquoi VDI a été un enfant d'affiche de l'hyperconvergence. Les utilisateurs veulent leur «lecteur C: virtuel» local. Mais ce n'est pas flexible, car cela implique la mise à l'échelle de tous les éléments en même temps.
  • Un système hyperscale maintient le stockage indépendant du calcul, ce qui permet au service informatique de l'entreprise de faire évoluer la capacité lorsque l'entreprise le souhaite. L'approche hyperscale de l'infrastructure du centre de données et du cloud offre un haut niveau d'élasticité, aidant les entreprises à répondre rapidement aux besoins changeants en matière d'applications et de stockage de données. C'est également une architecture qui correspond mieux aux charges de travail modernes telles que Hadoop et NoSQL, ainsi qu'à celles conçues avec des plates-formes cloud comme OpenStack et Docker. Tous ces éléments sont des exemples de systèmes distribués qui bénéficient d'un stockage partagé mis à l'échelle indépendamment.

Ce que nous avons vécu avec nos clients est une confirmation de ce que nous constatons depuis un certain temps maintenant: l'hyperconvergence est une réponse et non la réponse lors de l'exploration des architectures de stockage modernes. Pour être sûr, l'industrie voit un grand balancier vers l'hyperconvergé en raison de sa simplicité. Mais si vos données augmentent de manière exponentielle et que vos besoins de calcul ne le sont pas, vous avez une discordance d'impédance qui n'est pas bien adaptée à l'hyperconvergence.

Hyperscale ou hyperconvergé?

L'hyperconvergence peut être une approche plus simple et plus rentable. Cependant, ce que nos clients découvrent avec Hedvig, c'est que nous prenons en charge une fonctionnalité qui rend l'hyperscale appropriée pour presque toutes les charges de travail: la mise en cache côté client. Hedvig peut tirer parti des périphériques SSD et PCIe locaux de votre niveau de calcul pour créer un cache en écriture immédiate. Cela améliore considérablement les performances de lecture et, plus important encore, résout le problème de localisation des données. Le stockage est toujours découplé et s'exécute dans son propre niveau dédié et hyperscale, mais les applications, les machines virtuelles et les conteneurs peuvent bénéficier des données mises en cache localement au niveau de calcul. Cela résout également le problème de la croissance de votre niveau de mise en cache, mais c'est un sujet pour un autre article.

À titre d'exemple de cet avantage, un client a choisi l'approche hyperscale de Hedvig pour VDI, une charge de travail traditionnellement réservée aux solutions hyperconvergées comme indiqué ci-dessus. Dans ce cas, le client avait des «utilisateurs expérimentés» qui nécessitaient 16 processeurs virtuels et 32 ​​Go de mémoire dédiés à chaque poste de travail hébergé. En conséquence, la société a été contrainte de déployer un grand nombre de nœuds hyperconvergés pour prendre en charge les besoins de traitement et de mémoire, tout en augmentant inutilement la capacité de stockage en même temps.

Avec la plate-forme Hedvig, le client a pu créer des nœuds dédiés pour exécuter la ferme Citrix XenDesktop sur des serveurs lames robustes avec un processeur et une RAM adéquats. Les données ont été conservées sur un cluster Hedvig hyperscale séparé sur des serveurs montés en rack, les données étant remises en cache sur les serveurs XenDesktop dans des disques SSD locaux. Le résultat? Une solution nettement moins chère (60% de moins). Plus important encore, il a également fourni un environnement plus flexible dans lequel l'entreprise pouvait appliquer la loi de Moore et acheter les serveurs les plus puissants nécessaires pour améliorer les performances de son bureau sans avoir à mettre à niveau les serveurs de stockage.

Sur la base de notre expérience, il existe quelques règles empiriques simples pour déterminer quelle architecture vous convient.

  • Choisissez l'hyperscale lorsque… votre organisation compte 5 000 employés ou plus, plus de 500 téraoctets de données, plus de 500 applications ou plus de 1 000 VM.
  • Choisissez hyperconvergée lorsque… vous êtes en dessous de ces chiffres de filigrane, que cinq employés ou moins gèrent votre infrastructure virtuelle ou que vous êtes dans une succursale ou à distance.

La bonne nouvelle est que cela ne doit pas être une décision soit / soit. Vous pouvez commencer dans un environnement hyperconvergé, puis passer à hyperscale, ou vous pouvez mélanger et faire correspondre les deux. Notre philosophie est que vos applications dictent celle que vous devez utiliser. Et comme les besoins de votre application évolueront avec le temps, votre déploiement devrait également évoluer.

Dans les entreprises modernes, le changement et la croissance sont obligatoires. De plus en plus, il n'y a aucun moyen de résoudre cette énigme sans l'architecture hyperscale dont les géants du Web ont été les pionniers. Ce qui a changé, c'est que toute entreprise peut désormais bénéficier de l'approche hyperscale.

Rob Whiteley est le vice-président du marketing chez Hedvig.

Le New Tech Forum offre un lieu pour explorer et discuter des technologies d'entreprise émergentes avec une profondeur et une ampleur sans précédent. La sélection est subjective, basée sur notre choix des technologies que nous pensons importantes et qui intéressent le plus les lecteurs. n'accepte pas les supports marketing pour la publication et se réserve le droit de modifier tout le contenu fourni. Envoyez toutes vos demandes à [email protected]