72 votes

Combien de passages sont suffisants avec Memtest ?

Aujourd'hui, mon ordinateur se bloque de manière aléatoire à plusieurs reprises et sous différents systèmes d'exploitation, ce qui m'oblige à appuyer sur le bouton de réinitialisation. Je soupçonne qu'il s'agit d'un problème de mémoire et j'ai fait une recherche de mémoire. memtest con memtest86 .

Il a subi deux passages sans erreur. Est-ce suffisant, ou dois-je passer toute la nuit jusqu'à ce que je voie une erreur ?

Et si c'était un problème de carte mère ou de CPU ? Comment puis-je le savoir sans acheter une nouvelle carte mère ?

Spécifications du système :

  • Mémoire : 2.0GiB
  • Processeur Pentium(R) Dual-Core CPU E5300 @ 2.60GHz x 2
  • Carte mère : ASUS P5KPL-AM EPU

7voto

user254993 Points 71

J'ai vu de la RAM passer les 6 premières passes de memtest et ensuite échouer les passes suivantes, et lors de l'exécution d'un OS Linux avec cette RAM, il y avait un blocage après 6-8 heures. D'autres RAM sur la même carte mère fonctionnaient bien, donc apparemment la RAM défaillante était sensible à la température.

Lorsque je soupçonne un problème de RAM (par exemple, sur les ordinateurs Dell avec des voyants de diagnostic), je lance memtest sur un module de RAM à la fois dans le premier emplacement pendant 8 à 16 heures. S'il passe, cela confirme que l'emplacement et le module de RAM sont bons et je peux utiliser cet emplacement pour tester d'autres modules de RAM (avec plus de confiance).

7voto

Mon expérience avec le memtest86+ diffère un peu de celle de la plupart des gens ici. Le memtest86 m'a beaucoup aidé au fil des ans, mais malheureusement il ne parvient pas toujours à détecter les erreurs.

Bien que memtest fonctionne la majorité du temps, il m'a fait échouer quelques fois. La première fois qu'il n'a pas détecté d'erreurs, j'avais un PC avec 1x 4GB DDR3 qui me donnait des BSODs liés à la mémoire. J'ai lancé memtest pendant une journée entière, nous parlons de 15+ passes mais aucune erreur. Je l'ai ensuite testé sur un ordinateur complètement différent, même chose, aucune erreur. Le système d'exploitation était complètement instable mais aucune erreur sur memtest. J'ai ensuite utilisé un autre logiciel nommé "PC-Check" d'Eurosoft qui est très similaire au memtest mais utilise des algorithmes différents. Il est également amorçable et ne nécessite pas de système d'exploitation. Il a détecté les erreurs en moins de 5 minutes. J'ai alors pu envoyer le module à Corsair RMA et obtenir un remplacement.

Donc, le memtest est très bon mais pas toujours suffisant. J'utilise actuellement memtest et PC-check pour vérifier la mémoire. Si memtest ne parvient pas à détecter les erreurs, PC-check le fera certainement et vice versa. Et croyez-moi, cela arrive plus souvent qu'on ne le pense.

2voto

Diejmon Points 111

Je dirais 3 passes est généralement suffisant. Si vous voulez être encore plus sûr, faites 8 ou 9 passes, car @Jeff a vu des erreurs dans un cas seulement lors de sa 7ème passe ou plus. mais cela peut prendre une éternité ! Donc, pour être plus pratique, vous pouvez peut-être vous limiter à une séance de 8 heures pendant la nuit, à condition d'obtenir au moins 3 passages, ou à une séance de 24 heures de jour et de nuit, à condition d'obtenir au moins 3 passages.

En règle générale, je pense que @LAwLz l'a bien compris ici quand elle a dit (c'est nous qui soulignons) :

Dans la plupart des cas, memtest commencera à cracher des erreurs dans la minute qui suit si la clé de RAM est mauvaise. Si vous me demandez, je dirais qu'après 1 minute sans erreur, vous pouvez être sûr à 50 %. que la RAM est bonne. Après 5 minutes, c'est 70%. Après un seul passage, c'est 90%. Après 3 passes, c'est 99,9%. et ainsi de suite.

@LAwLz poursuit en disant qu'il n'y a aucune garantie, peu importe le nombre de passes que vous faites :

Voici cependant quelque chose à garder à l'esprit. Memtest prouvera seulement que votre RAM a des problèmes, mais il ne prouvera pas qu'elle n'en a pas (même après 10 heures de tests). Même si vous exécutez le test 100 fois, vous ne pouvez pas être sûr qu'il ne crachera pas une erreur après la 101e exécution.

Et elle croit aussi 8 heures, c'est suffisant (mais j'ajouterais : à condition qu'au moins 3 passages soient réalisés pendant cette période). --Sinon, continuez jusqu'à ce que vous obteniez au moins 3 passes) :

Comme je suis actuellement en attente d'un nouveau kit de mémoire vive (RAM), puisque le dernier avait un bâton mort, j'ai l'intention d'exécuter memtest sur le nouveau kit de RAM. Je vais l'exécuter pendant la nuit, donc cela fera environ 8 heures.

Si vous voulez être aussi sûr que possible, je dirais de le laisser tourner toute la nuit. Si vous n'obtenez pas d'erreurs après 8 heures de recherche intensive d'erreurs, alors il est assez sûr de dire que tout va bien.

2voto

Ray Points 11

J'ai un point de vue contraire.

Cela dépend de votre tolérance à la floculation et aux accidents. Sur mes ordinateurs principaux, j'utilise Linux, et j'ai une tolérance zéro. Mes machines restent généralement en place pendant plus d'un an avant que je ne les redémarre ou qu'il y ait une panne de courant. Il y a eu des cas où cela a duré plusieurs années. Puis quelque chose d'étrange se produit pour la deuxième ou troisième fois, je passe à une autre plateforme et je commence à diagnostiquer. Il s'agit presque toujours de la RAM (une fois, c'était une carte Ethernet et une fois, un commutateur, qui n'avait besoin que de nouveaux condensateurs).

Compte tenu de cette perspective, j'ai un point de vue différent sur le nombre de passes. Lorsque j'achète une nouvelle machine (littéralement ou nouvelle pour moi sur ebay), je la fais tourner pendant 1 à 3 ou 4 semaines, selon ma patience. Après cela, elle a toujours fonctionné indéfiniment. Les seules mauvaises machines que j'ai prises en charge étaient deux Apple XServes de 2009 avec 24 Go de mémoire que j'ai obtenus gratuitement. Chacun d'entre eux avait une banque de DIMM défectueux et, après avoir été retirés, ils ont fonctionné pendant plusieurs semaines avant que je ne les éteigne. Avec 8 cœurs XEON physiques fonctionnant simultanément, cela représentait un certain nombre d'itérations. Il a fallu une semaine environ pour que memtest86 échoue. Puis j'ai répété l'échec ( Un autre plusieurs jours ! Quelle galère...), puis j'ai remplacé les DIMMs défectueux.

Pourquoi ? À trois reprises, j'ai eu une machine qui n'était plus fiable, c'est-à-dire qu'elle faisait quelque chose de bizarre ou se bloquait après quelques semaines ou quelques mois.

Avec une machine Linux, lors de ma première utilisation prolongée, une erreur a été détectée au bout de 3 semaines, j'ai remplacé la carte DIMM et la machine ne s'est plus jamais plantée. De même un incident de 2 semaines.

J'avais un ordinateur portable Toshiba sous Windows qui fonctionnait pendant des périodes variables, de quelques heures à quelques semaines. J'ai découvert qu'il manquait de composé thermique et qu'il utilisait plutôt une sorte de mousse entre le CPU, le GPU et le caloduc. Je l'ai remplacé par de la graisse thermique (bien qu'elle ne soit pas mécaniquement étanche puisque la conception mécanique suppose un tampon thermique d'une épaisseur non nulle) et cela m'a considérablement aidé, mais il continuait à se planter à l'occasion. Je l'ai jeté.

Oui, si un problème est très grave, il sera trouvé au premier passage, mais cela prend généralement quelques dizaines d'heures. Les machines dont je parle prennent toutes environ une heure ou une heure et demie pour effectuer un seul passage, ce qui représente quelques dizaines de passages.

J'avais quelques cartes mères qui échouaient toutes systématiquement à memtest86 après quelques mois de fonctionnement, et pourtant memtest86 ne trouvait rien (je ne me souviens pas de la patience que j'avais avec le run-time). Je suis passé de 4 à 3 banques de mémoire et elles n'ont plus jamais planté. Mes cartes mères ASUS avec le même chipset exact ont toujours fonctionné correctement avec 4 banques. Les deux utilisaient de la mémoire Crucial.

J'avais l'habitude d'utiliser la fonction de contrôle de l'horloge du BIOS pour réduire l'horloge d'un cran, en pensant que cela rendrait la machine plus fiable si la synchronisation de la DRAM était un problème, mais lorsque j'ai eu un problème, cela n'a jamais aidé, et l'incident ci-dessus est la seule fois où j'ai trouvé que réduire la charge sur les lignes communes avait aidé.

Avec les machines Windows, je constate que souvent elles passent encore le test memtest86 pendant quelques semaines, mais la machine reste peu fiable sous Windows. Parfois, une machine imparfaite est soudainement fiable après une limite de version de Windows. J'ai eu un problème avant et pendant Covid avec une résolution sur la quatrième version semestrielle de Windows - trois versions avec le problème ! La même machine était soudainement solide comme un roc.

Donc, si vous redémarrez tous les jours, ou si vous vous contentez de dire "Oh, je dois redémarrer", et si vous n'êtes pas paranoïaque à l'idée qu'un jour le problème se trouve dans vos données plutôt que dans les instructions, alors I je dirais d'exécuter memtest86 pendant au moins une journée entière. Dans mon expérience, la plupart des choses sont trouvées en plus de quelques passages et moins d'une journée. L'information sur le fait que le premier passage est moins approfondi a du sens - je pense que c'est le cas. toujours ont réussi à passer le premier ou le deuxième passage. Mais un jour complet n'est en aucun cas concluant. Je suis persuadé qu'un mois complet l'est, et je fais souvent un compromis et le fais fonctionner pendant 2 ou 3 semaines parce que je suis impatient.

Enfin, les vendeurs d'ordinateurs d'occasion échangent généralement des éléments, voire les démontent pour en faire des bacs de pièces détachées, puis les réassemblent en fonction des besoins du client, parfois sans se soucier de la statique. L'un d'entre eux m'a dit que le problème de l'électricité statique avait été résolu dans les années 2000 et qu'il ne se posait plus. La vérité est que l'électricité statique peut détruire une pièce, mais la plupart du temps, elle est juste assez chaude pour dégrader légèrement un transistor et se manifester plus tard. Si vous avez une machine qui fonctionne depuis quelques années et que personne ne l'a démontée, il y a de bonnes chances qu'elle fonctionne à peu près éternellement. Les transistors faibles sont causés par des impuretés dans le réseau cristallin du silicium, et les champs électriques les poussent à dériver vers l'endroit où ils font le plus de mal. À des températures plus élevées, ils dérivent plus rapidement. Lorsqu'il y a une décharge à fort courant (une étincelle), les impuretés et les dopants qui font du transistor un transistor sont libres de se déplacer et de modifier le profil de dopage (pente de la falaise). Imaginez une boîte de crème glacée napolitaine avec des limites bien nettes entre la vanille et le chocolat, insérez maintenant une petite bobine de ni-chrome d'un pouce à l'intérieur, juste à la limite, et chauffez-la à blanc pendant quelques secondes. Que va-t-il se passer ? J'avais un ordinateur portable acheté chez un recycleur local qui échouait au memtest86 ou se plantait tous les quelques jours. Je l'ai ramené et quand j'ai exprimé mon inquiétude au sujet de l'électricité statique (en regardant son processus), il m'en a tendu un autre en disant "Ici, je n'ai pas touché à celui-ci. Il appartenait au responsable informatique de , c'est de là que viennent toutes ces machines et il m'a donné sa dernière." C'était en 2013. Il fonctionne toujours (2021), ne s'est pas encore planté. Presque sans valeur par rapport aux normes d'aujourd'hui, mais il sert son objectif actuel.

J'espère que cela vous sera utile ! Ce n'est pas une bonne nouvelle, mais c'est ma réalité. Pour référence, tout ceci est basé sur quelque chose de plus que les 20 machines que je peux compter rapidement.

1voto

Robert Niestroj Points 683

Je fais un passage pour voir s'il y a des erreurs évidentes.

S'il y a une erreur, aucune autre passe n'est nécessaire.

Si le problème avec l'ordinateur est étrange, je le laisse passer la nuit ou la journée pendant ~10 heures, juste pour être sûr.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X