Problème de latence de l'ELB d'AWS

Question

Problème de latence de l'ELB d'AWS

Demandé el 7 de Mars, 2016: Quand la question a-t-elle été
1201 affichage: Nombre de visites la question a
1 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'ai deux machines EC2 c3.2xlarge avec un environnement Ubuntu, toutes deux situées à us-west-2a AZ. Les deux contiennent le même code avec une base de données mySQL de AWS RDS (db.r3.2xlarge). Les deux instances sont ajoutées à un ELB. Les deux instances ont un cron programmé qui s'exécute deux fois par jour.

ELB a été configuré pour déclencher l'alarme dès que le seuil dépasse 5,0. L'utilisation du CPU des deux instances est en moyenne de 30 à 50. Aux heures de pointe, elle atteint 100 % pendant une minute ou deux, puis revient à la normale. Mais ELB déclenche constamment l'alarme trois fois par jour. À ce moment-là, les deux instances ont

CPU     - ~50%
Memory  - total - 14979
          used  - ~6000
          free  - ~9000
RDS CPU - ~30%
          Connections - 200 to 300 /5,000

D'après ce document https://aws.amazon.com/premiumsupport/knowledge-center/elb-latency-troubleshooting/ Je n'ai rien trouvé à redire aux instances. Mais la latence atteint toujours des sommets et les deux instances ne répondent pas.

Jusqu'à présent, j'enlève une instance de l'équilibreur de charge, je redémarre l'apache, je la charge à nouveau et je fais de même pour l'autre instance. Cela fait parfaitement l'affaire et les instances et l'ELB fonctionnent bien pendant les 6 à 10 heures suivantes. Mais ce n'est pas acceptable car, chaque jour, deux ou trois fois, il faut s'occuper du serveur, il faut le redémarrer.

J'ai besoin de savoir s'il y a un problème ou si des mesures doivent être prises pour résoudre ce problème.

L'état du serveur Apache contient trop de processus de ce type (~200/250 processus) :

7-0 23176   1/2373/5118 C   30.95   3986    0   0.0 7.01    15.78   127.0.0.1   ip-xxx-xxx-xxx-xxx.us-west-2.comp   OPTIONS * HTTP/1.0

Demandé el 7 de Mars, 2016 par Thamilhan

Answer 1

1 Réponses

Answer 2

2voto

GioMac Points 4331

UNITÉ CENTRALE utilisation (%) n'est pas la clé, la clé est le CPU moyenne de la charge (file d'attente) et les métriques de réseau, les métriques d'Apache, les tampons, etc. Les équilibreurs de charge sont des dispositifs très simples. Les problèmes liés à l'implication des équilibreurs de charge dans l'architecture ne sont généralement pas liés aux équilibreurs de charge, mais à la nature du fonctionnement des autres éléments.

Pour déterminer où se situe le problème, il convient de suivre les étapes suivantes :

Vérifiez si apache répond aux requêtes locales, si ce n'est pas le cas, le problème n'est PAS l'ELB.
Vérifier l'état des travailleurs d'Apache (i.e. mod_status), ajuster les paramètres MPM en conséquence.
Vérifiez la charge moyenne de l'unité centrale, si la charge moyenne dépasse le nombre d'unités centrales et si le nombre d'unités centrales augmente, vous avez un problème avec l'IO.
Vérifiez si la persistance de la connexion est activée et si elle est vraiment nécessaire, si vous utilisez vraiment des sessions sur des serveurs web qui ont besoin d'accéder à la même instance web.
Vérifiez les paramètres de keepalive pour apache, désactivez-les ou définissez une valeur de timeout très faible.
Vérifiez si iptables est activé sur l'instance et si les paramètres du noyau nf_conntrack_max et nf_conntrack_count sont configurés avec des valeurs plus élevées. Si vous n'en avez pas besoin, désactivez les modules et ne les chargez pas du tout.
Test de stress d'instances uniques avec des requêtes http (hint : ab, jmeter)

Vérifier et ajuster les paramètres du noyau en conséquence :

net.core.wmem_max
net.core.rmem_max
net.core.netdev_max_backlog

net.core.somaxconn
net.ipv4.tcp_rmem
net.ipv4.tcp_wmem
net.ipv4.tcp_no_metrics_save
net.ipv4.tcp_timestamps
net.ipv4.tcp_fin_timeout
net.ipv4.tcp_max_tw_buckets
net.ipv4.tcp_tw_recycle
net.ipv4.tcp_synack_retries
net.ipv4.tcp_keepalive_time

net.netfilter.nf_conntrack_acct
net.netfilter.nf_conntrack_generic_timeout
net.netfilter.nf_conntrack_tcp_timeout_syn_sent
net.netfilter.nf_conntrack_tcp_timeout_syn_recv
net.netfilter.nf_conntrack_tcp_timeout_established
net.netfilter.nf_conntrack_tcp_timeout_fin_wait
net.netfilter.nf_conntrack_tcp_timeout_close_wait
net.netfilter.nf_conntrack_tcp_timeout_last_ack
net.netfilter.nf_conntrack_tcp_timeout_time_wait
net.netfilter.nf_conntrack_tcp_timeout_close
net.netfilter.nf_conntrack_tcp_timeout_max_retrans
net.netfilter.nf_conntrack_tcp_timeout_unacknowledged
net.netfilter.nf_conntrack_icmp_timeout
net.netfilter.nf_conntrack_events_retry_timeout
net.ipv4.netfilter.ip_conntrack_generic_timeout
net.ipv4.netfilter.ip_conntrack_tcp_timeout_syn_sent
net.ipv4.netfilter.ip_conntrack_tcp_timeout_syn_sent2
net.ipv4.netfilter.ip_conntrack_tcp_timeout_syn_recv
net.ipv4.netfilter.ip_conntrack_tcp_timeout_fin_wait
net.ipv4.netfilter.ip_conntrack_tcp_timeout_close_wait
net.ipv4.netfilter.ip_conntrack_tcp_timeout_last_ack
net.ipv4.netfilter.ip_conntrack_tcp_timeout_time_wait
net.ipv4.netfilter.ip_conntrack_tcp_timeout_close
net.ipv4.netfilter.ip_conntrack_tcp_timeout_max_retrans
net.ipv4.netfilter.ip_conntrack_icmp_timeout
net.netfilter.nf_conntrack_tcp_loose
net.netfilter.nf_conntrack_max net.nf_conntrack_max
net.netfilter.nf_conntrack_count

Apache ne répond plus après cela ? Ce n'est pas du tout la faute d'ELB.

Répondu el 12 de Mars, 2016 par GioMac (4331 Points )

Problème de latence de l'ELB d'AWS

Réponse

Questions en vedette

Top Tags

SistemesEz.com

Powered by:

Problème de latence de l'ELB d'AWS

Réponse

Questions en vedette

Top Tags

Dans notre réseau

SistemesEz.com

Powered by: