Carte graphique nVidia qui chauffe

Salut,

Je me suis inscrit sur le forum suite à une recherche concernant les problèmes de surchauffe des cartes nVidia j’ai trouvé ce topic mais comme il date un peu, plutôt que de le déterrer, je préfère ouvrir un nouveau topic.

Donc, mon souci est le suivant j’ai une carte graphique Zotac GeForce GTX260 AMP!², elle commence à dater et il existe plus puissant, mais moi je l’aime beaucoup, j’en suis très content, et elle est largement assez puissante pour mes besoins.

Je ne prend pas la peine de détailler le reste de ma config, puisque en fait, mon souci dure depuis des années et s’est produit avec d’autres cartes-mères, procos, ram, distros et drivers, sur et avec laquelle/lesquels la carte a fonctionné.

Mon souci est que la carte monte sans raison en température lorsque je fais un redémarrage à chaud (warm boot) c’est systématique, je m’explique:

J’allume le PC en appuyant sur le bouton marche/arrêt, j’attends le chargement du système, je me log et je lance NVIDIA X Server Settings, la section Thermal Setting me donne 40/41°C pour la BOARD et 47/48°C pour le GPU en ce moment avec le driver 260.19.44 x86_64 que j’ai récupéré sur le site nVidia et que j’ai compilé par la procédure d’installation normale.

Bon.

J’utilise XFCE comme WM, donc maintenant si je fais Menu/Déconnexion/Redémarrer, le bazar mouline, le PC redémarre, je me log je lance NVIDIA X Server Settings, le PowerMizer redescend au level 0 et dans la minute qui suit, ça monte doucement, mais la carte atteint rapidement 70, puis 80 degrés pour le GPU et à l’avenant pour la BOARD alors que je n’ai aucune autre application de lancée.

Et donc si maintenant je fais Menu/Déconnexion/Éteindre, le PC s’éteint, j’attends 1 seconde, j’appuie sur le bouton marche/arrêt, quand la machine a redémarré que je me suis loggué et que j’ai relancé NVIDIA X Server Settings, la carte a déjà perdu 10 degrés et dans les minutes qui suivent la température est redescendu au niveau le plus bas, tout est terminé, elle fonctionne nickel.

Et le pire c’est ça, si je ne fais aucun redémarrage à chaud, elle ne chauffe jamais, et ça m’agace cette histoire!!!

J’ai posté un topic similaire sur le forum nVidia, mais j’ai l’impression d’être chez teubé-land, à part battlefield, call of duty et windows 8, personne n’a l’air de calculer mon topic.

Donc, je tente sur des forums un peu plus sérieux, vous pouvez peut-être m’aider à confirmer que le problème ne vient pas de ma carte mais du driver qui réinitialise pas la carte correctement lors d’un warm boot ou au contraire que c’est ma carte qui bugge complètement.

En fait, c’est tout ce que je demande, je cherche des possesseurs de carte nVidia avec le driver nVidia qu’ils ont compilé, et pas le nv ni le nouveau.

Si vous pouviez essayer la manip, càd allumer votre machine, faire un redémarrage à chaud, vérifier si ça grimpe et si c’est le cas, éteindre puis rallumer et vérifier si ça se calme.

Ça serait sympa.

A priori non sur la mienne, j’ai fait pas mal d’essais cet été en sautant à chaque fois, justement, sur le nvidia-settings pour looker ferme les températures (deux GPU, je voulais être vraiment clair là-dessus).

Ceci dit, il faudrait savoir si après ce redémarrage à chaud qui fait monter à quatre-vingts degrés, elle y reste réellement, mettons dix minutes après, ou au contraire finit par retomber. Ce qui m’arrive parfois, c’est qu’elle s’émeuve toute seule alors que je suis en pleine 3D fixe (modélisation), donc rien de bien méchant mais surprenant quand même. Seulement cela (le ventilo CG) s’arrête immédiatement, je prends donc l’affaire comme une sorte de réinitialisation et tout marche bien comme cela (six mois pour l’instant).

Salut,

A moins d’avoir sauté des lignes, je n’ai vu ni l’un ni l’autre nous dire quel driver il utilise et comment il l’installe :slightly_smiling:

Salut,

Sauf erreur de ma part (et cas particuliers) la procédure d’installation “normale” sur debian est d’utiliser les dépôts avec module-assistant ou dkms…

Pour info en sid le driver actuel est 295.20. As-tu essayé avec un driver plus récent ? Avec un driver des dépôts debian ?

Re,

Merci Jul, l’autre solution est d’aller voir sur le wiki comment les fainéants (comme moi) font :laughing:

Yop,

Hum, pour moi, la procédure normale d’installation du driver nVidia, c’est récupérer l’archive sur leur site, càd un fichier du style “NVIDIA-Linux-x86_64-260.19.44.run” et faire comme expliqué sur ce site par exemple.

Le driver nVidia étant de plus en plus mou du genou avec tout les rajouts qu’ils font (et qu’on ne peut pas désactiver) que je préfère installer et compiler (comme indiqué dans le document que je cite plus haut, je trafique rien, je me contente de suivre la procédure) le bazar spécifiquement pour mon PC histoire d’en tirer le max de puissance si on peut dire.

Et donc, comme je le disais dans mon premier post, faire autre chose qu’un halt avec cette carte graphique la fait chauffer énormément lors du redémarrage.

Oui je vois où tu veux en venir, tu penses qu’elle mouline pour faire quelque chose puis s’arrête lorsqu’elle aurait fini, mais en fait non, c’est justement comme cela que je me suis aperçu de ce souci, mon PC faisait un bruit pas possible et c’est en regardant les températures dans x server settings que j’ai compris que la carte délirait (bien souvent depuis plusieurs dizaines de minutes en fait, je me rendais pas trop compte), d’autant plus que le mode PowerMizer càd le mode adaptatif qui monte les fréquences en fonction de l’utilisation reste au minimum, donc c’est très bizarre.

J’ai déjà essayé avec plein de drivers dont le fameux 195.36.15 sans succès jusqu’à présent.

Et pour éviter de me prendre le chou j’ai décidé de remplacer la commande reboot par halt dans /etc/rc6.d comme ça, vu que je me trompe de temps en temps et que je fais redémarrer au lieu d’éteindre, il n’y aura pas de conséquence. C’est une solution très très laide qui a le mérite de fonctionner et de régler mon souci tout de suite.

Merci pour votre aide. :023

Salut,

J’ai moi aussi eu certains problèmes de surchauffe et de ventilateurs du ma carte (GTX460).
Les problèmes ont été résolus en installant les derniers drivers en utilisant la méthode préconisée sur le wiki :
isalo.org/wiki.debian-fr/ind … %C3%A9ants

ou bien (si tu maîtrises le pinning) en installant les paquets issus des dépôts Debian, en SID (et pas directement via le .run du site Nvidia).

[quote=“nico”]Les problèmes ont été résolus en installant les derniers drivers en utilisant la méthode préconisée sur le wiki :
isalo.org/wiki.debian-fr/ind … %C3%A9ants[/quote]

ouaip où là : http://www.isalo.org/wiki.debian-fr/index.php?title=Installer_les_pilotes_nVidia_privateur

Ce n’est pas la première fois que je lis cela, qu’en penses-tu exactement ? Que l’on perdrait en performances, ou encore en possibilités, en installant le driver autrement que par le .run ?

D’un autre côté, si c’est en performances, je me dis qu’après tout plus la carte est sous-utilisée, mieux c’est, n’ayant que Flightgear et aussi de la 3D fixe. Si c’est en possibilités, cela vaudrait peut-être le coup de creuser…

Wouhou! Très intéressant tout ça, mais bon, là c’est une machine de prod, et je suis en plein rush donc, j’attendrais un peu pour tester ce genre de manip…

Ce n’est pas la première fois que je lis cela, qu’en penses-tu exactement ? Que l’on perdrait en performances, ou encore en possibilités, en installant le driver autrement que par le .run ?[/quote]
Pas tout à fait. En fait, le driver proprio nVidia (qui sert aussi pour les drivers “libres” est constitué de 2 sous-ensembles; une partie “presque libre” dont le code source est d’ailleurs intégré dans le .run pour permettre la compilation d’un driver propre et adapté à la config sur laquelle tu l’installes, ainsi que plusieurs .so dont on n’a pas le code source et que la partie libre utilise à l’instar des .dll sous windows.

Et ce sont ces fichiers .so qui posent problème. Ils intègrent toutes les fonctions vitales qui permettent de gérer les entrée/sorties, OpenGL, CUDA, OpenCL, PhysX, etc… ainsi que la presque totalité des cartes de la gamme nVidia (excepté les plus anciennes qui sont retirées régulièrement).

D’une part ces fichiers sont compilés certainement pour l’architecture x86 ou x86_64 de base sans aucune optimisation (afin d’être compatibles avec toutes les configs) et d’autre part, ils deviennent de plus en plus boulimiques, à titre d’exemple, le 173.14.30 (correspondant à l’ancienne génération de drivers d’après ce que j’ai compris) pèse 18 mégas, le 260.19.29 c’est 45.8 mégas et le petit dernier 295.20 c’est 55.6 mégas compressés.

Donc le bazar gère de plus en plus de choses, fait de plus en plus de tests au détriment de la disponibilité pour calculer les images en 3D et nous permettre par exemple de calculer les zolis zimages d’un Quake3 à plus de 1000 FPS :laughing:

Il y a quelques années quand j’avais passé un peu de temps à chercher pourquoi cette foutu carte arrêtait pas de chauffer, j’avais installé plusieurs drivers et fait des tests avec glxgears. Je sais c’est pas forcément le meilleurs choix pour être sûr, mais compte tenu du fait que je faisais mes tests juste après un démarrage à froid et sur la même distro, je pense que ça indique quand même quelque chose et donc avec le 185.18.36 j’obtenais 29xxx FPS, avec le 190.53 ça tombe à 28xxx et ainsi de suite avec le 195.30, 27xxx et pour finir, je viens de tester avec le 260.19.44 en x86_64 (tout les autres sont en 32 bits) et j’obtiens aux alentours de 23700 sur 10 mesures successives et tout ça sur la même carte!

Donc, je suis d’accord que glxgears n’est pas le meilleurs choix pour faire un benchmark, mais bon ça montre quand même que les perfs diminuent au fur et à mesure de l’ajout de fonctionnalités.

C’est la raison principale pour laquelle je préfère faire compiler le module pour mon architecture afin de perdre le moins possible si on peut dire…

@yang : désolé de te contredire, mais ce que tu dis à propos de “compiler le .run soi-même pour optimiser au mieux” n’a AUCUN sens. Les paquets DKMS ou la méthode SGFXI font exactement la même chose du point de vue de la compilation (la partie libre du module NVidia est toujours compilée localement, c’est pour ça que même avec DKMS ou SGFXI il faut les headers du kernel), la seule différence réside dans la manière dont les fichiers sont installés. Le .run installe les fichiers à l’arrache on ne sait pas trop comment, alors que DKMS ou SGFXI le font correctement à la sauce Debian ce qui permet des mises à jours et désinstallations propres.

Oui, mes connaissances concernant l’installation du driver nVidia datent un peu, celle que j’utilise actuellement et dont je parle est jusqu’à présent la plus efficace pour moi, mais comme tu le soulignes très justement les méthodes ont dû évoluer.

Je te remercie pour cette info, j’en tiendrais compte lorsque je voudrais mettre à jour le driver que j’utilise actuellement.

Hé bien le .run est un script bash avec un tar.gz ajouté à la fin du fichier, donc la procédure d’install est connue il suffit de regarder dans le fichier.

PS: Cela dit, je n’utilise pas une Debian, mais un fork :wink:, bon en même temps les paquets DKMS sont dipos.

C ya.

Trente mille frames par seconde ça fait quand même pas mal, avec la mienne jamais pu dépasser les dix-sept mille. Maintenant pour voir une différence entre les trois ou quatre drivers que j’ai essayés, honnêtement, rien de bien décisif, ni même tout au début (juin dernier) avec celui que j’avais installé en .run.

Salut,

Si un modérateur a jugé ma réponse hors-sujet qu’il ait l’amabilité de me le faire savoir. Je cherchais juste à prouver que la méthode wiki n’était pas la plus mauvaise.
Ci joint la copie du message disparu :

[quote]gerard@debian:~$ glxgears
30115 frames in 5.0 seconds = 6022.813 FPS
30812 frames in 5.0 seconds = 6162.306 FPS
30804 frames in 5.0 seconds = 6160.793 FPS
30802 frames in 5.0 seconds = 6160.253 FPS
30598 frames in 5.0 seconds = 6119.431 FPS
30788 frames in 5.0 seconds = 6157.548 FPS
33903 frames in 5.0 seconds = 6780.503 FPS
42121 frames in 5.0 seconds = 8424.024 FPS
^Z
[1]+ Stoppé glxgears
[/quote]

Hop hop hop! Pas si vite. Là je te parle de la fenêtre par défaut de glxgears qui fait à tout casser 256x256, ce nombre de FPS est totalement bidon, il donne une mesure à la pelle mécanique mais ne correspond en rien à une réalité efficace et utilisable dans la réalité pour une appli en 3D.

Tout ce que ça montre c’est que les modules proprios de nVidia deviennent de plus en plus lents et rien d’autre.

Maintenant pour ce qui concerne la compilation et pour aller dans le sens de syam, effectivement, je viens de vérifier entre les .deb et le .run, leurs contenus sont quasiment les mêmes et des deux cotés, c’est l’interface (et uniquement l’interface) entre le kernel et les modules proprios qui est compilé.

C’est bien pour ma culture personnelle que je le sache. Lorsque j’ai commencé à utiliser des GPU nVidia en 2001/2002 avec une Mandrake à l’époque :laughing:, je pensais que les paquets fournissaient un système prêt à l’emploi, mais en fait non.

Edit: Pour ggoodluck47:

Ça c’est avec le driver 185.18.36 en 32 bits à l’époque:

[quote]Running synchronized to the vertical refresh. The framerate should be
approximately the same as the monitor refresh rate.
147572 frames in 5.0 seconds = 29514.330 FPS
147608 frames in 5.0 seconds = 29521.482 FPS
143094 frames in 5.0 seconds = 28618.759 FPS
147830 frames in 5.0 seconds = 29565.811 FPS
147719 frames in 5.0 seconds = 29543.770 FPS
147659 frames in 5.0 seconds = 29531.765 FPS
147585 frames in 5.0 seconds = 29516.976 FPS
147608 frames in 5.0 seconds = 29521.441 FPS
147717 frames in 5.0 seconds = 29543.300 FPS
141895 frames in 5.0 seconds = 28378.886 FPS
147417 frames in 5.0 seconds = 29483.300 FPS
147807 frames in 5.0 seconds = 29561.299 FPS[/quote]
Ça c’est avec le 260.19.44 en x86_64 là maintenant:

[quote]Running synchronized to the vertical refresh. The framerate should be
approximately the same as the monitor refresh rate.
118044 frames in 5.0 seconds
118269 frames in 5.0 seconds
118283 frames in 5.0 seconds
118283 frames in 5.0 seconds
117954 frames in 5.0 seconds
117821 frames in 5.0 seconds
117943 frames in 5.0 seconds
117882 frames in 5.0 seconds
118032 frames in 5.0 seconds
118036 frames in 5.0 seconds
114277 frames in 5.0 seconds
^C[/quote]
Soit une moyenne de 23542 FPS sur 11 valeurs, mais comme je disais plus haut ça n’est pas pertinent, c’est une fenêtre de 256x256 dans un coin de l’écran, ce n’est pas un nombre de FPS valide pour un jeu en 3D par exemple.

Cela dit ça ne solutionne pas mon souci, je ne sais toujours pas si cela vient de ma carte, donc si quelqu’un fait chauffer sa carte un jour et qu’il solutionne avec ma manip, faites-moi le savoir.

Salut,

j’aie le 295-20, compilé avec dkms, j’obiens à quelque chose près les valeurs de GGoodluck47.glxgears 40834 frames in 5.0 seconds = 8166.633 FPS 40892 frames in 5.0 seconds = 8178.379 FPS 40895 frames in 5.0 seconds = 8178.893 FPS 40906 frames in 5.0 seconds = 8181.091 FPS 40894 frames in 5.0 seconds = 8178.681 FPS 40376 frames in 5.0 seconds = 8075.029 FPS 60247 frames in 5.0 seconds = 12049.294 FPS
Je tourne en moyenne à 55°, j’aie un ecran de 18.4 pouces, je me demande si la taille de l’écran ne joue pas dans ton souci ? Quand je passe sur mon plasma, j’ai un pic puis ça se stabilise…

Je dit ça, j’en sais pas plus, j’aie pas trop creusé, j’suis trop feignant :laughing:

Salut tetrix,

Je ne vois pas trop où toi et ggoodluck47 voulez en venir, mais si tu parles du boost de puissance après quelques itérations, ça vient certainement du fait que le code est passé dans le cache et qu’à mon avis vous utilisez tout les deux de procos intel qui s’overclockent automatiquement, technologie introduite avec la série core quelque chose et qui fait croire que les procos amd sont moins puissants car les procos amd restent à des fréquences stables en permanence sauf pour les modèles récents qui utilisent une technologie similaire si je ne me trompe pas.

[quote]40376 frames in 5.0 seconds = 8075.029 FPS
60247 frames in 5.0 seconds = 12049.294 FPS[/quote]
Bon!

Suite (et peut-être fin) de mes péripéties dignes d’un mauvais épisode de Dallas :laughing:

Je viens d’installer le dernier pilote disponible pour ma distro dans les dépôts (estampillés 195.36.24) avec dkms tout ça, j’ai remplacé le halt par reboot dans /etc/rc6.d, et sur 2 ou 3 reboot, ça semble s’être stabilisé la carte et le GPU restent stables à 41 et 48°C en idle.

Je vais tester ça pendent 48/72 heures et si ça se confirme, je marquerais le souci comme réglé.