Wenn man einen Cluster unter Sever 2008 zu einem File Server macht und dann nach und nach die Ressourcen freigibt, dann kommt es zu einem eigenartigen Phänomen, dass das Cluster alle freien Ressourcen des RAM beschlagnahmt und diesen dann nicht mehr freigibt. Je nach Belastung des Clusters (I/O und Sessions) dauert es dann bis zu 48 Stunden und jeder Node bleibt mit einem Blue Screen stehen!
Zuerst dachte ich, dass es sich um einen Hardware Defekt handelt, dem war aber nicht so, da ja beide aktiven Knoten mit einem Blue Screen beendet worden sind. Das Ganze wurde auch durch die Reproduzierbarkeit des Verhalten bestätigt.
In Zusammenarbeit mit dem Microsoft Support wurde das Problem als Bug im TCPIP.sys typisiert. Als Workaround hat sich ein einfacher Trick erwiesen. Über die Verwaltung navigiert man zu der Verwaltung des virtuellen Speicher und öffnet diese Registerkarte. Ohne Einstellungen zu verändern klickt man auf ok. Das System muss nicht neu gestartet werden! Nach kurzer Zeit (ca. 30 Sekunden) gibt jeder Node das RAM frei und das Spielchen beginnt von Vorne.
Die erste Version des private Patch, welches von MS geliefert worden ist, zeigt Besserung jedoch hatte es einen kleinen Konflikt mit einem Security Patch. Eine Update zum Update scheint das Problem in den Griff zu bekommen.
Zumindest ist der File Server wieder stabil und man kann auch die Cluster Ressourcen ohne Bedenken schwenken.
Sollte ich neue Erkenntnisse haben, dann werde ich dazu weiter berichten.