Wir haben seit langem eine relativ hohe Zahl an sporadisch inaktiven Knoten, und versuchen derzeit auf verschiedenen Wegen, die Hintergründe zu ergünden.

Neben dem schon bekannten Phänomen, daß Knoten eventuell ihr »WLAN verlieren«, haben wir jüngst ein weiteres Problem, was primär meshende Knoten betrifft, entdeckt.

Screenshot
ESSID „unknown“?!

Bei einem Knoten mit einer Uptime von über 50 Tagen ist jüngst aufgefallen, daß er die Offline-SSID (»FF_OFFLINE_xxxxxxxxxxxx«) ausstrahlte. Bei näherer Betrachtung (Login mit statischer IP, ssh auf den Knoten über die »thisnode«-IP) fiel dann auf, daß für das Mesh-Netzwerk keine SSID gesetzt war — somit konnte dieser nur per Mesh angebundene Knoten natürlich nicht funktionieren.

Verglichen mit dem anderen Fehlerbild – »Verlust« des W­LAN-Interfaces – haben wir hier augenscheinlich »nur« eine eingeschleppte Fehlkonfiguration. Allerdings: nach einem »wifi restart« war auch alles wieder im Lot — Fehlkonfiguration scheidet somit aus.

Screenshot
»wifi restart« und alles wieder gut.

Hintergründe und Auslöser sind derzeit unbekannt, aber effektiv gibt es offensichtlich die Möglichkeit, daß sich vermaschte Knoten selbst abhängen, ohne daß das AP-WLAN inaktiv wird. Ein Workaround allerdings ist relativ einfach zu realisieren, und wird im nächsten Firmwareupdate entsprechend auch drin sein.

Wir können den Ausfall insofern also nicht verhindern, aber wir können wohl die Situation erkennen und für Abhilfe sorgen — insofern immerhin etwas besser als bei dem anderen Problem, dem wir noch auf den Grund gehen müssen.

Kurzum: wir werden versuchen, diesen besonderen Fehlerfall abzufangen und automatisiert zu beheben; unklar ist derzeit noch, in welchem Umfang und wie häufig das Problem auftritt.

Neues Fehlerbild (FW 0.7.4)