URG interface eth5 UP mais pas RUNNING ! help

debian lenny 2.6.26-2-686…

je dispose de huit interfaces réseau gigabit sur un serveur, sur deux carte distinctes (mais de fabrique identique) bien reconnues par le kernel. La première carte réseau fonctionne parfaitement. la seconde me pose des problemes sur cetains ports qui sont ( en apparence aléatoirement choisi pour ne plus fonctionner correctement ).
Historiquement j’ai utilisé un broadcom qui ne fonctionnait pas correctement, je l’ai désactivé au bios puis remplacé par la même carte que la première.

initialement UDEV à gardé la config de la broadcom et ajouter à la suite les nouveau ports (eth9,10,11,12), j’ai du éditer le fichier 70-persitent-net.rules, afin de supprimer les lignes en trop, et de renommer les interfaces de la nouvelle carte en eth4,5,6,7.

depuis lors, certains interface fonctionnent mal sur la seconde carte. puis se mettent a fonctionné, jusqu’a ce que je me rende compte qu’un autre interface en est victime… je ne comprend pas du tout d’ou ca viens.
Les routes sont bon…
L’ifconfig ne révèle pas d’interface fantôme, et montre bien l’interface comme étant UP… mais:

eth5 Link encap:Ethernet HWaddr 00:1b:21:41:ff:a5 inet adr:172.16.1.1 Bcast:172.16.1.255 Masque:255.255.255.0 adr inet6: fe80::21b:21ff:fe41:ffa5/64 Scope:Lien UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:0 errors:0 dropped:0 overruns:0 frame:0 TX packets:21 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 lg file transmission:1000 RX bytes:0 (0.0 B) TX bytes:1098 (1.0 KiB) Mémoire:de3e0000-de400000
pas de dialogue du tout. impossible de pinguer un noeud externe, et ne répond pas de l’extérieur, par contre il réagit très bien au ping interne de l’interface en elle même.

ps: ca a fonctionné hier… skreugneugneu

SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="xx:xx:xx:xx:f1:a8", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0"

SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="xx:xx:xx:xx:f1:a9", ATTR{type}=="1", KERNEL=="eth*", NAME="eth1"

SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="xx:xx:xx:xx:f1:ac", ATTR{type}=="1", KERNEL=="eth*", NAME="eth2"

SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="xx:xx:xx:xx:f1:ad", ATTR{type}=="1", KERNEL=="eth*", NAME="eth3"

SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="xx:xx:xx:xx:ff:a0", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth4"

SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="xx:xx:xx:xx:ff:a5", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth5"

SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="xx:xx:xx:xx:ff:a4", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth6"

SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="xx:xx:xx:xx:ff:a1", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth7"

1- quelqu’un saurais ce que ca signifie exactement: ATTR{dev_id}==“0x0”.

2- est ce que quelqu’un saurait quelle commande permet de reconstruire le fichier udev pour les interfaces réseaux.

3- y a moyen de retrouver le numero de device de chacune des carte réseau ?

Je ne connais pas la signification de cet attribut dev_id. Faut dire qu’udev n’est pas ma spécialité, je l’évite autant que possible… Se pourrait-il que les interfaces eth0 à eth3 de la première carte aient été configurées avec une version antérieure d’udev qui n’utilisait pas cet attribut, d’où les différences ? En comparant avec une de mes machines, je vois que ma ligne pour eth0, qui a dû être créée lors de l’installation de la version précédente Etch, contient encore moins de paramètres. Si je la commente, udev la recrée avec les mêmes paramètres que tes interfaces eth4-eth7.

Pour réinitialiser le fichier de règles udev, il suffit de le supprimer, et udev le reconstruira au prochain démarrage. Mais attention, les noms des interfaces pourront être différents de ce qu’il étaient auparavant, en fonction de l’ordre de détection.

Cependant je doute qu’udev soit en cause dans le problème décrit. Sauf erreur, son rôle se borne à détecter les périphériques présents, charger les pilotes correspondants et nommer les interfaces, ce qu’il semble faire correctement.

Qu’entends-tu exactement par “numéro de device” ?

Concernant l’absence de réception, je n’ai pas d’idée mais je pense à quelques vérifications.

  1. A quel moment une interface donnée se met à mal fonctionner ou à refonctionner ? Au démarrage ou n’importe quand ?
  2. Quel est l’état du port du switch en face de l’interface qui fonctionne mal ? Des deux côtés du câble, les voyants “liaison” sont-ils allumés, les voyants “activité” clignotent-ils en cas d’émission et réception (même si l’interface dit ne rien recevoir) ?
  3. Quand l’interface fonctionne mal, les paquets censés être émis sont-ils bien reçus par le(s) destinataires ? (tester avec un broadcast ARP, vérifier avec tcpdump ou wireshark)
  4. Y a-t-il des messages suspects dans les logs du noyau (dmesg) concernant ces interfaces ?
  5. Quel est le type de contrôleur ethernet et le pilote ?
  6. J’observe qu’ifconfig ne mentionne pas de numéro d’interruption, est-ce normal (comparer avec les autres interfaces) ?

Par numero de device, j’entend l’identification du device qui pourrait allez à la place du “0x0” ({dev_id}).
J’ai supprimé le ATTR{dev_id]=“0x0” de toute les interfaces… et rebooté, tout fonctionne bien quand même.
sauf mon petit interface eth5…

les interfaces=LSPCI

06:00.0 Ethernet controller: Intel Corporation 82575GB Gigabit Network Connection (rev 02) 06:00.1 Ethernet controller: Intel Corporation 82575GB Gigabit Network Connection (rev 02) 07:00.0 Ethernet controller: Intel Corporation 82575GB Gigabit Network Connection (rev 02) 07:00.1 Ethernet controller: Intel Corporation 82575GB Gigabit Network Connection (rev 02) 0a:00.0 Ethernet controller: Intel Corporation 82575GB Gigabit Network Connection (rev 02) 0a:00.1 Ethernet controller: Intel Corporation 82575GB Gigabit Network Connection (rev 02) 0b:00.0 Ethernet controller: Intel Corporation 82575GB Gigabit Network Connection (rev 02) 0b:00.1 Ethernet controller: Intel Corporation 82575GB Gigabit Network Connection (rev 02)

J’ai essayé de supprimer le fichier de règle UDEV pour le net uniquement… et au demarrage suivant le fichier n’a pas été recréé, et donc plus d’interface réseaux disponibles… heureusement que j’en avait une copie de sauvegarde.

  1. aucune idée, la dernière foi c’était les eth1, puis2, puis apres moulte et moultes essais sans succès, le week end passe, et hop ca marche…non comment. hier hop eth5 marche plus.

  2. le switch fonctionne bien je ping les noeuds du même réseau entre eux, le port précis est actif, mais en affichage continue, pas de scintillement donc pas d’activité(quelque soit l’endroit ou je le branche sur le switch). la carte elle même signale qu’un lien est actif en gigabit… mais pas de scintillement.

  3. l’interface ne fonctionne toujours pas du tout, c’est stabilisé au moins.

  4. j’ai un seveur 2003, avec un dhcp sur ce même réseau, les clients renouvelle leurs bail et s’y connectent parfaitement bien.

  5. Le pilote est inclus au noyaux, et semble avoir été configuré à l"installation du systeme (pour la première carte). il utilise le module noyau “IGB”.

  6. en effet je n’ai pas relevé certains détails, mais il se trouve qu’il y a bien un souci. les zone de mémoire ne se chevauchent pas, donc c’est pas ca. Je ne vois pas s’afficher l’interruption sur aucun des interfaces.

(interface non raccordé au réseau physiqpuement)
eth3 Link encap:Ethernet HWaddr 00:xx:xx:xx:f1:xx
inet adr:10.0.x.x Bcast:10.0.x.x Masque:255.255.255.248
UP BROADCAST MULTICAST MTU:1500 Metric:1
RX packets:0 errors:0 dropped:0 overruns:0 frame:0
TX packets:0 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 lg file transmission:1000
RX bytes:0 (0.0 B) TX bytes:0 (0.0 B)
Mémoire:defe0000-df000000

(raccordé et lien détecté)
eth4 Link encap:Ethernet HWaddr 00:xx:xx:xx:xx:a0
inet adr:192.168.x.x Bcast:192.168.x.x Masque:255.255.255.0
adr inet6: fe80::x:x:x:x/64 Scope:Lien
UP BROADCAST [size=150]RUNNING[/size] MULTICAST MTU:1500 Metric:1
RX packets:664973 errors:0 dropped:0 overruns:0 frame:0
TX packets:439317 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 lg file transmission:1000
RX bytes:58908868 (56.1 MiB) TX bytes:220315485 (210.1 MiB)
Mémoire:de9c0000-de9e0000

(raccordé et lien détecté mais pas RUNNING ??? et pourtant UP ?)
eth5 Link encap:Ethernet HWaddr 00:1b:x:x:x:a5
inet adr:172.16.x.x Bcast:172.16.x.x Masque:255.255.255.0
adr inet6: fe80::x:x:x:x/64 Scope:Lien
UP BROADCAST MULTICAST MTU:1500 Metric:1
RX packets:0 errors:0 dropped:0 overruns:0 frame:0
TX packets:57 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 lg file transmission:1000
RX bytes:0 (0.0 B) TX bytes:2610 (2.5 KiB)
Mémoire:de3e0000-de400000
[/code]

GLOUPS! ( ca sent pas bon ) … une idée lumineuse ?

/etc/interface

j’ai changé de câble mais rien n’y fait…
ifdown ,ifup ip address… rien ne change… toujours HORS FONCTION…

[quote]#~/>ip address add 172.16.1.1/24 brd + dev eth5
RTNETLINK answers: File exists
[/quote]

LSPCI -V

Le port qui pose problème n’a pas de conflit IRQ avec les autres…
HEELP ouinnnnnn :12

[code]
[ 3.185224] igb 0000:06:00.0: Intel® Gigabit Ethernet Network Connection
[ 3.185224] igb 0000:06:00.0: eth0: (PCIe:2.5Gb/s:Width x4) 00:1b:21:41:ff:a0
[ 3.185224] igb 0000:06:00.0: eth0: PBA No: d96950-006
[ 3.185224] igb 0000:06:00.0: Using MSI-X interrupts. 4 rx queue(s), 1 tx queue(s)
[ 3.185224] ACPI: PCI Interrupt 0000:06:00.1[B] -> GSI 37 (level, low) -> IRQ 37

[ 3.407033] igb 0000:06:00.1: Intel® Gigabit Ethernet Network Connection
[ 3.407113] igb 0000:06:00.1: eth1: (PCIe:2.5Gb/s:Width x4) 00:1b:21:41:ff:a1
[ 3.407266] igb 0000:06:00.1: eth1: PBA No: d96950-006
[ 3.407339] igb 0000:06:00.1: Using MSI-X interrupts. 4 rx queue(s), 1 tx queue(s)
[ 3.407458] ACPI: PCI Interrupt 0000:07:00.0[A] -> GSI 34 (level, low) -> IRQ 34

[ 3.614916] igb 0000:07:00.0: Intel® Gigabit Ethernet Network Connection
[ 3.614996] igb 0000:07:00.0: eth2: (PCIe:2.5Gb/s:Width x4) 00:1b:21:41:ff:a4
[ 3.615149] igb 0000:07:00.0: eth2: PBA No: d96950-006
[ 3.615222] igb 0000:07:00.0: Using MSI-X interrupts. 4 rx queue(s), 1 tx queue(s)
[ 3.616548] ACPI: PCI Interrupt 0000:07:00.1[B] -> GSI 44 (level, low) -> IRQ 44

[ 3.833549] igb 0000:07:00.1: Intel® Gigabit Ethernet Network Connection
[ 3.833629] igb 0000:07:00.1: eth3: (PCIe:2.5Gb/s:Width x4) 00:1b:21:41:ff:a5
[ 3.833781] igb 0000:07:00.1: eth3: PBA No: d96950-006
[ 3.833855] igb 0000:07:00.1: Using MSI-X interrupts. 4 rx queue(s), 1 tx queue(s)
[ 3.833976] ACPI: PCI Interrupt 0000:0a:00.0[A] -> GSI 45 (level, low) -> IRQ 45

[ 4.045394] igb 0000:0a:00.0: Intel® Gigabit Ethernet Network Connection
[ 4.045474] igb 0000:0a:00.0: eth4: (PCIe:2.5Gb/s:Width x4) 00:1b:21:3e:f1:a8
[ 4.045627] igb 0000:0a:00.0: eth4: PBA No: d96950-006
[ 4.045700] igb 0000:0a:00.0: Using MSI-X interrupts. 4 rx queue(s), 1 tx queue(s)
[ 4.047401] ACPI: PCI Interrupt 0000:0a:00.1[B] -> GSI 47 (level, low) -> IRQ 47

[ 4.255162] igb 0000:0a:00.1: Intel® Gigabit Ethernet Network Connection
[ 4.255242] igb 0000:0a:00.1: eth5: (PCIe:2.5Gb/s:Width x4) 00:1b:21:3e:f1:a9
[ 4.255394] igb 0000:0a:00.1: eth5: PBA No: d96950-006
[ 4.255468] igb 0000:0a:00.1: Using MSI-X interrupts. 4 rx queue(s), 1 tx queue(s)
[ 4.255582] ACPI: PCI Interrupt 0000:0b:00.0[A] -> GSI 35 (level, low) -> IRQ 35

[ 4.467553] igb 0000:0b:00.0: Intel® Gigabit Ethernet Network Connection
[ 4.467633] igb 0000:0b:00.0: eth6: (PCIe:2.5Gb/s:Width x4) 00:1b:21:3e:f1:ac
[ 4.467786] igb 0000:0b:00.0: eth6: PBA No: d96950-006
[ 4.467859] igb 0000:0b:00.0: Using MSI-X interrupts. 4 rx queue(s), 1 tx queue(s)
[ 4.469426] ACPI: PCI Interrupt 0000:0b:00.1[B] -> GSI 46 (level, low) -> IRQ 46

[ 4.676525] igb 0000:0b:00.1: Intel® Gigabit Ethernet Network Connection
[ 4.678520] igb 0000:0b:00.1: eth7: (PCIe:2.5Gb/s:Width x4) 00:1b:21:3e:f1:ad
[ 4.678520] igb 0000:0b:00.1: eth7: PBA No: d96950-006
[ 4.678520] igb 0000:0b:00.1: Using MSI-X interrupts. 4 rx queue(s), 1 tx queue(s)
< pas d’int ? >

[ 4.705584] udev: renamed network interface eth6 to eth2
[ 4.737542] udev: renamed network interface eth2_rename to eth6
[ 4.780498] udev: renamed network interface eth4 to eth0
[ 4.785540] udev: renamed network interface eth5 to eth1
[ 4.794338] udev: renamed network interface eth7 to eth3
[ 4.829319] udev: renamed network interface eth0_rename to eth4
[ 4.829319] udev: renamed network interface eth3_rename to eth5
[ 4.841638] udev: renamed network interface eth1_rename to eth7

[ 9.210573] ADDRCONF(NETDEV_UP): eth0: link is not ready
[ 9.224372] igb 0000:0a:00.0: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
[ 9.225980] ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready
[ 9.306801] ip_tables: © 2000-2006 Netfilter Core Team
[ 9.504568] nf_conntrack version 0.5.0 (16384 buckets, 65536 max)
[ 9.873698] ADDRCONF(NETDEV_UP): eth1: link is not ready
[ 9.881145] igb 0000:0a:00.1: NIC Link is Up 100 Mbps Full Duplex, Flow Control: RX/TX
[ 9.882821] ADDRCONF(NETDEV_CHANGE): eth1: link becomes ready
[ 9.990967] ADDRCONF(NETDEV_UP): eth2: link is not ready
[ 9.992367] igb 0000:0b:00.0: NIC Link is Up 100 Mbps Full Duplex, Flow Control: RX/TX
[ 9.993185] ADDRCONF(NETDEV_CHANGE): eth2: link becomes ready
[ 10.076782] ADDRCONF(NETDEV_UP): eth3: link is not ready
[ 10.137648] ADDRCONF(NETDEV_UP): eth4: link is not ready
[ 10.144544] igb 0000:06:00.0: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX
[ 10.145338] ADDRCONF(NETDEV_CHANGE): eth4: link becomes ready
[ 10.212209] ADDRCONF(NETDEV_UP): eth5: link is not ready
[ 10.283514] ADDRCONF(NETDEV_UP): eth6: link is not ready
[ 10.286545] igb 0000:07:00.0: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX
[ 10.286545] ADDRCONF(NETDEV_CHANGE): eth6: link becomes ready
[ 10.339378] ADDRCONF(NETDEV_UP): eth7: link is not ready
[ 10.344773] igb 0000:06:00.1: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX
[ 10.344849] ADDRCONF(NETDEV_CHANGE): eth7: link becomes ready
[ 20.909945] eth2: no IPv6 routers present
[ 20.917725] eth0: no IPv6 routers present
[ 21.082138] eth7: no IPv6 routers present
[ 21.418112] eth1: no IPv6 routers present
[ 21.757300] eth4: no IPv6 routers present
[ 21.929536] eth6: no IPv6 routers present
[ 275.595933] ADDRCONF(NETDEV_UP): eth5: link is not ready
[ 280.258287] ADDRCONF(NETDEV_UP): eth5: link is not ready
[ 730.327498] ADDRCONF(NETDEV_UP): eth5: link is not ready[/code]
Alors là , le dmesg, il est pas du tout en accord avec les paramètres vu plus haut, y a vraiment du méli-mélo dans tout les sens… Quelqu’un saurrait m’aider à refaire de l’odre dans tout ca ? j’ai l’impression qu’il va me faloir repartir de 0 pour le nommage des cartes. comment tout remettre à ZERO ?

:arrow_right: un pti UP!

l’adresse ipv6 de l’interace eth5 est vide, comment faire pour en générer une vu qu’apparement toute les autres qui fonctionnent en on une ?

Est ce que le fait que l’interface ne détecte pas le lien veux dire que le ports de la carte est HS ? (voir dmesg plus haut : link not ready… mé si!!! mé si!!!..)

bon… bha g trouvé, c’était pas évident d’éplucher tout ca mais bon l’erreur était vraiment bénigne:

en fait il fallait trouver les MAC de chaque interface dans ifconfig, et mettre en comparaison avec le contnenu de UDEV. une piste aussi se trouve dans le renommage des interfaces dans dmesg.

dans mon cas l’interface eth5 était monté dans udev sur l’adresse mac de l’interface eth7 et vice versa.

  • J’ai déplugué le câble sur eth5 et pluguer sur eth7 pour contrôler mon pronostique.
  • puis réinitialiser l’interface (ifdown/ifup)
  • pis tester avec des ping de contrôle… de l’intérieur et de l’extérieur… ca marche…

:041 en même temps … quelle tristesse… :blush:

CONCLUSION:
Lorsque vous remplacez une carte défectueuse, contôlez vos fichiers udev au niveau des adresses mac / interfaces après installation d’une nouvelle carte. les ports ne sont pas forcément installés dans le bon ordre dans le fichier udev à la détection.