3 votes

Comment visualiser/graphier un ensemble massif de données ?

J'ai un fichier CSV de données collectées à l'aide de Performance Monitor. Il a recueilli l'utilisation du CPU à des intervalles de 5 secondes pendant deux semaines.

Je dois être capable de représenter les données sous forme graphique ou visuelle de manière à pouvoir déterminer la fréquence à laquelle le processeur est sollicité au maximum par rapport à la marche au ralenti.

Excel a une limite de 32 000 points de données dans un graphique, et j'en ai beaucoup plus. J'ai donc besoin d'une autre méthode de représentation graphique des données ou d'un moyen de filtrer les données dans Excel, par exemple en calculant la moyenne sur des blocs de 10 minutes.

2voto

user33038 Points 1

Je dirais que vous devez regarder dans quelque chose comme R à cette fin, et pas seulement Microsoft Excel. Je ne l'ai pas encore utilisé moi-même mais il a été beaucoup utilisé par les étudiants de mon université, il devrait être capable de gérer de telles quantités.

0voto

Mike108 Points 752

Si vous cherchez simplement à filtrer les moments où les données atteignent leur maximum, une solution rapide pourrait être d'importer les données de 32 000 éléments à la fois dans plusieurs feuilles Excel et de filtrer chacune d'entre elles pour trouver le moment où le CPU atteint son maximum.

Pour ma part, je fais normalement ce genre de choses avec Python, Numpy et Matplotlib, mais il est évident que si vous n'avez pas de solution préférée, il peut être un peu difficile d'apprendre quelque chose de nouveau pour tracer les données une seule fois.

0voto

momobo Points 176

Vous pourriez échantillonner sur (disons) une minute, faisant passer le point de données de 241920 à 4032. Pour ce faire, vous devez ajouter une colonne à vos données et créer une fonction qui marque uniquement le début de la minute. Ensuite, l'échantillon peut être pris avec un simple VLOOKUP(). Si vous voulez de l'aide pour la fonction d'exemple, postez des détails sur le format des données (en particulier la colonne date/heure).

Bien sûr, au lieu d'échantillonner, vous pouvez faire une moyenne ou prendre le maximum et/ou le minimum.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X