J'ai géré le basculement DNS RR sur un site web de production modérément fréquenté mais critique pour l'entreprise (sur deux zones géographiques) pendant de nombreuses années.
Cela fonctionne bien, mais il y a au moins trois subtilités que j'ai apprises à la dure.
1) Les navigateurs basculeront d'une IP non fonctionnelle à une IP fonctionnelle après 30 secondes (la dernière fois que j'ai vérifié) si les deux sont considérées comme actives dans le DNS mis en cache disponible pour vos clients. C'est fondamentalement une bonne chose.
Mais le fait que "la moitié" de vos utilisateurs attendent 30 secondes est inacceptable. Vous voudrez donc probablement mettre à jour vos enregistrements TTL pour qu'ils soient de quelques minutes, et non de quelques jours ou semaines, afin qu'en cas de panne, vous puissiez rapidement supprimer le serveur hors service de votre DNS. D'autres ont fait allusion à ce point dans leurs réponses.
2) Si l'un de vos serveurs de noms (ou l'une de vos deux géographies) qui dessert votre domaine round-robin tombe en panne, et si le principal d'entre eux tombe en panne, je me souviens vaguement que vous pouvez rencontrer d'autres problèmes en essayant de supprimer ce serveur de noms en panne du DNS si vous n'avez pas défini votre TTL/expiration SOA pour le serveur de noms à une valeur suffisamment basse également. Je peux me tromper dans les détails techniques, mais il n'y a pas qu'un seul paramètre TTL à prendre en compte pour vraiment se défendre contre les points de défaillance uniques.
3) Si vous publiez des API Web, des services REST, etc., ceux-ci ne sont généralement pas appelés par les navigateurs, et donc, à mon avis, le basculement DNS commence à présenter de réelles failles. C'est peut-être la raison pour laquelle certains disent, comme vous le dites, "ce n'est pas recommandé". Voici pourquoi je dis cela. Tout d'abord, les applications qui consomment ces URL ne sont généralement pas des navigateurs, et ne disposent donc pas des propriétés/logiques de basculement en 30 secondes des navigateurs courants. Deuxièmement, le fait d'appeler ou non la deuxième entrée DNS ou même de relancer le DNS dépend beaucoup des détails de programmation de bas niveau des bibliothèques de mise en réseau dans les langages de programmation utilisés par ces clients API/REST, ainsi que de la manière exacte dont elles sont appelées par l'application cliente API/REST. (Sous la couverture, la bibliothèque appelle-t-elle get_addr, et quand ? Si les sockets se bloquent ou se ferment, l'application rouvre-t-elle de nouveaux sockets ? Y a-t-il une sorte de logique de temporisation ? etc etc)
C'est bon marché, bien testé, et ça marche en général. Donc, comme pour la plupart des choses, votre kilométrage peut varier.