Les 8 erreurs de l'informatique distribuée deviennent hors de propos

En 1969, le département américain de la Défense a créé ARPANET, le précurseur de l'Internet d'aujourd'hui. À peu près à la même époque, le protocole SWIFT utilisé pour les transferts d'argent a également été mis en place. Ce sont tous les deux des exemples précoces de systèmes distribués: un ensemble d'ordinateurs indépendants qui apparaissent aux utilisateurs comme un système cohérent unique.

Beaucoup apprennent qu'ils ont un système distribué lorsque la panne d'un ordinateur dont ils n'ont jamais entendu parler affecte l'ensemble du système. C'est souvent le résultat d'hypothèses que les architectes et les concepteurs de systèmes de distribution sont susceptibles de faire.

En 1994, Peter Deutsch, qui travaillait chez Sun Microsystems, a écrit sur ces hypothèses pour explorer ce qui peut mal tourner dans les systèmes distribués. En 1997, James Gosling a ajouté à cette liste pour créer ce que l'on appelle communément les huit erreurs de l'informatique distribuée. Les approches traditionnelles, qui utilisent la réplication basée sur le temps pour concevoir et construire des systèmes distribués, souffrent de bon nombre de ces erreurs et aboutissent à des systèmes inefficaces, peu sûrs et coûteux à entretenir. Les approches modernes, utilisant des mathématiques complexes telles que l'algorithme de Paxos, surmontent bon nombre de ces obstacles importants.

1.  Le réseau est fiable

2. La  latence est nulle

3. La  bande passante est infinie

4.  Le réseau est sécurisé

5. La  topologie ne change pas

6.  Il y a un administrateur

7.  Le coût du transport est nul

8.  Le réseau est homogène

Conclusions

Cela fait plus de 20 ans que les erreurs de l'informatique distribuée ont été rédigées pour la première fois et plus de 40 ans que nous avons commencé à construire des systèmes distribués. La technologie a continué d'évoluer depuis lors, rendant ces erreurs de moins en moins pertinentes.

Google Spanner, par exemple, surmonte de nombreuses erreurs en utilisant la réplication basée sur Paxos, ainsi que de nombreuses fibres noires, pour surmonter les problèmes de latence et de synchronisation de l'heure assistée par matériel liés à l'utilisation de satellites dédiés, d'horloges GPS et d'horloges atomiques.

L'algorithme Paxos peut également être étendu pour assurer une cohérence globale grâce à la réplication active des données transactionnelles sans matériel supplémentaire ni exigence de bande passante supplémentaire. En conséquence, les réseaux WAN d'aujourd'hui sont de plus en plus sûrs, rentables et, avec la bonne technologie brevetée, peuvent fonctionner sans temps d'arrêt ni interruption, ce que l'informatique a passé de nombreuses années à dire qu'il était impossible.