Richtlinien für eine optimierte Kühlung
Temperaturvorgaben für Rechenzentren
Die American Society of Heating, Refrigeration and Air-Conditioning Engineers kurz ASHRAE hat Richtlinien für Rechenzentrumsverantwortliche entwickelt, in denen sie zwei wesentliche Punkte anspricht: Zum einen wie man hohe Ausfallsicherheit gewährleisten kann und zum anderen wie man das Rechenzentrum so energieeffizient wie möglich betreibt. Die folgenden Empfehlungen eigenen sich für Rechenzentren jeder Größe und unabhängig von der Branche.
Das Festlegen der optimalen Temperaturvorgaben für ein Rechenzentrum ist nicht trivial, denn jeder Hersteller von IT-Geräten veröffentlicht seine eigenen Temperaturspezifikationen zum Betrieb von IT-Systemen und Appliances. Um Rechenzentrumsverantwortliche bei der Definition der für sie passenden Werte zu unterstützen, hat die American Society of Heating, Refrigeration and Air-Conditioning Engineers (ASHRAE) Richtlinien für eine optimierte Kühlung sowie Informationen zur Anpassung von Umgebungsparametern wie Temperatur und Luftfeuchtigkeit zusammengestellt.
Die von der ASHRAE in den „Thermal Guidelines for Data Processing Environments – Expanded Data Center Classes and Usage Guidance“ vorgestellten Konzepte basieren auf dem Wissen der IT-Hersteller zur tendenziellen Entwicklung der Ausfallsicherheit und der Stromaufnahme der Server in Abhängigkeit von der Temperatur (als eine Funktion der Zulufttemperatur). Im Folgenden werden diese beschrieben und zusätzlich Aspekte wie Serverleistung, Geräuschniveau, Korrosion und Kosten versus Raumtemperatur und Luftfeuchtigkeit diskutiert.
Serverausfallsicherheit versus Serveransaugtemperatur
In den ASHRAE-Richtlinien von 2008 wurden gegenüber jenen von 2004 die zulässigen Temperatur- und Feuchtebereiche erweitert. Die Richtlinien von 2011 führten zusätzlich eine weitere Differenzierung der Rechenzentrumsklassen (A1 bis A4) ein. Dadurch ist es Rechenzentrumsbetreibern jetzt möglich, den Fokus auf die Senkung der Ausfallrate der IT-Komponenten zu richten oder durch die volle Ausschöpfung der nach oben erweiterten Temperaturbereiche, die Energieeffizienz des Kühlsystems zu optimieren.
Wenn ein Rechenzentrum permanent im empfohlenen Temperaturbereich (Serveransaugtemperatur 18 bis 27 °C) betrieben wird, sind keine negativen Auswirkungen auf die Ausfallrate zu erwarten.
Da in unserer Klimazone die Außentemperaturen gelegentlich deutlich höher liegen, können diese Richtwerte nur durch den temporären Einsatz von Kältemaschinen (Kompressions- oder Absorptionskälte) das ganze Jahr über erreicht werden. Für Rechenzentren der Klasse A1 ist in Deutschland der Einsatz von Kältemaschinen deshalb unerlässlich. Auch wenn die heute erhältlichen Freikühlungs-Chiller sehr effizient sind (die Kompressoren werden nur im Bedarfsfall geregelt zugeschaltet), sind ein gewisser Energieaufwand und zusätzliche Investitionskosten unvermeidlich.
Bei Rechenzentren der Klasse A2 (und höher) ist in den meisten Gegenden Deutschlands hingegen ein ganzjähriger Betrieb ohne Kältemaschinen möglich. Dabei muss allerdings mit mäßig erhöhten Ausfallraten der IT-Geräte und zeitweisen Temperaturen von bis zu 35 °C in den Kaltgängen und 50 °C in den Warmgängen gerechnet werden.
Direkte freie Kühlung
Die Kühlung dieser Rechenzentren kann mit zwei verschiedenen Kühlsystemen erfolgen:
Die erste Alternative ist die direkte freie Kühlung mit Frischluft. Erfahrungsgemäß erwärmt sich dabei die Außenluft um etwa 1 bis 2 K, bis sie die IT-Geräte erreicht. Die Temperatur bleibt damit in vielen Gegenden Deutschlands auch an den heißesten Tagen knapp unter der zulässigen Höchsttemperatur von 35 °C.
Indirekte freie Kühlung
Die wegen vielerlei Problemen der Frischluftkühlung wesentlich bessere Alternative ist die indirekte freie Kühlung in Verbindung mit Verdunstungskühlung. Da die maximale Feuchtkugeltemperatur in Deutschland selbst an den heißesten Tagen bei 22 °C liegt, eignet sich solch ein Kühlsystem sogar für Rechenzentren der Klasse A1. Denn bei ausreichender Dimensionierung der Wärmetauscher wird die maximale Betriebstemperatur von 32 °C zu keiner Zeit überschritten.
Nicht geeignet für den Einsatz in Deutschland ist hingegen die indirekte freie Kühlung in Verbindung mit einer Trockenkühlung. Denn bei dieser Kühlmethode liegt die Kühllufttemperatur im Rechenzentrum um 10 bis 12 K über der Umgebungstemperatur. Das geht nur, wenn die Außentemperatur ganzjährig unter etwa 22 °C liegt.
Serverenergieverbrauch versus Serveransaugtemperatur
Ziel der Erweiterung des zulässigen Temperaturbereichs ist es also, vermehrt freie Kühlung einsetzen zu können und in gemäßigten Klimazonen ganz auf den Einsatz von Kompressoren zu verzichten. Daraus ergibt sich eine erhebliche Energieeinsparung seitens des Kühlsystems.
Allerdings nimmt bei steigender Ansaugtemperatur der Strombedarf der Server zu. Um dafür genaue Daten zu gewinnen, hat ASHRAE zu einer breiten Produktpalette Daten verschiedener IT-Hersteller zusammengestellt. Wie das Papier zeigt, ist der Anstieg des Stromverbrauchs auf die Lüfter, die Elektronikkomponenten sowie auf die Verluste der Netzteile und Spannungswandler zurückzuführen. Wenn ein Rechenzentrum normalerweise mit einer Zuluft von 15 °C betrieben wird und diese auf 30 °C erhöht werden soll, so kann man davon ausgehen, dass der Energieverbrauch der Server um 4 bis 8 % ansteigt. Bis 25 °C ist aber kaum ein Anstieg des Stromverbrauchs zu beobachten. Wird die Temperatur der Zuluft auf 35 °C erhöht, steigt der Energieverbrauch der IT-Geräte zwischen 7 und 20 % im Vergleich zum Betrieb mit einer Kühlluft von 15 °C. Dazu kommt ein erhöhter Luftbedarf der Server, der wiederum zusätzlichen Energiebedarf für die Luftumwälzung im Raum nach sich zieht.
Dieser gegenläufige Effekt kann die Energieeinsparung beim Kühlsystem aufheben oder sogar den Gesamtstromverbrauch erhöhen. Es muss also sehr sorgfältig abgewogen werden, ob sich eine höhere Ansaugtemperatur tatsächlich energetisch rechnet.
Geräuschpegel versus Raumtemperatur
Eine Ausweitung des Temperaturbereichs kann sich nachteilig auf das Geräuschniveau im Rechenzentrum auswirken. In Hochleistungsrechenzentren hat der Geräuschpegel in den vergangen Jahren immer weiter zugenommen und ist vielerorts bereits zu einem Problem geworden. Diese Entwicklung ist das Ergebnis gestiegener Kühlanforderungen. Empirische Untersuchungen haben gezeigt, dass der Geräuschpegel bei Kühlgeräten mit Luftumwälzung um ein Fünftel höher liegt. Das bedeutet, dass eine Drehzahlerhöhung der Lüfter um 20 % einen Anstieg des Geräuschniveaus um 4 dB verursacht. Es lässt sich im Vorfeld nicht mit Bestimmtheit sagen, welche Auswirkungen ein Anstieg der Umgebungstemperatur von 2 K im Rechenzentrum auf das Geräuschniveau haben wird, ein Anstieg von 3 bis 5 dB ist jedoch realistisch. Die Steigerung der Geräuschkulisse ist abhängig von der Rackkonfiguration, dem zugehörigen Kühlungsschema und den Algorithmen, die die Lüftergeschwindigkeit steuern.
Rechenzentrumsbetreiber sollten deshalb genau abwägen, ob sich Energieeinsparungen zum Preis eines höheren Geräuschniveaus lohnen, denn sie tragen Verantwortung für ihre Angestellten und müssen klare Richtlinien für die „Lärmbelästigung“ am Arbeitsplatz einhalten. Modellversuche haben gezeigt, dass in einem Gang zwischen zwei durchgängigen Rackreihen mit typischer IT-Ausstattung der höchste gesetzlich zulässige Schallpegel von 85 dB erreicht wird, wenn jedes Rack einen gemessenen Schallpegel von ungefähr 84 dB verursacht.
Ausfallsicherheit versus Feuchtigkeit, Luftverschmutzung und Temperatureffekte
Neben der Temperatur können Faktoren wie Luftverschmutzung oder Luftfeuchtigkeit einen Ausfall der IT-Geräte begünstigen. Beim Einsatz von direkter Frischluftkühlung sollten deshalb Luftqualität und Baumaterialien überprüft werden. Sie könnten als Quelle für Luftverschmutzung, Ausgasungen und Staub in Frage kommen und den zusätzlichen Einbau von Luftfiltern erfordern.
Neuere Untersuchungen haben beispielsweise gezeigt, dass Temperatur und Luftfeuchtigkeit die Signalstärke von Leiterplatten beeinflussen können. Mit der zunehmenden Integration von Hochgeschwindigkeitssignalen in Leiterplatten nehmen diese Probleme weiter zu. Fällt bei hoher Luftfeuchtigkeit die Umgebungstemperatur sehr stark ab oder läuft ein Kühlgerät plötzlich auf Hochtouren, besteht außerdem die Gefahr, dass durch den Temperaturunterschied Wasser an elektrischen und mechanischen Geräten kondensiert und Kurzschlüsse verursacht. Auch die Korrosionsgefahr nimmt infolgedessen zu. Das gilt vor allem bei hoher Luftverschmutzung. Denn Ausgasungen, die Schwefeldioxid, Schwefelwasserstoff oder ionische Stoffe enthalten, können den Korrosionsprozess erheblich beschleunigen.
Dies ist dann der Fall, wenn die relative Luftfeuchtigkeit so hoch liegt, dass Korrosionsprodukte oder der auch bei bester Filterung unvermeidliche Staub hygroskopisch wirken und Wasser aus der Luft aufnehmen.
Um unternehmenskritische Hardware zu schützen, sollte deshalb die relative Luftfeuchtigkeit unter 60 % gehalten werden. Zudem sollten Luftverschmutzung und Staubablagerungen derart begrenzt werden, dass die Korrosionsrate von Silber und Kupfer unter 300 Ångström/Monat liegt. Vor allem, wenn an heißen oder schwülen Tagen der Economiser zum Einsatz kommt, müssen Rechenzentrumsverantwortliche besonders auf die Luftfeuchtigkeit achten.
Serverleistung versus Temperatur
Das thermische Design sollte deshalb bereits bei der Konzeption eines Rechenzentrums berücksichtigt werden. Zusätzlich gilt es, Managementmethoden für die IT-Ausstattung und die Energieinfrastruktur einzuführen, die eine ganzheitliche Optimierung ermöglichen. Dabei gilt es zu berücksichtigen, dass jede IT-Komponente thermischen Beschränkungen unterworfen ist. Während Prozessoren relativ gut gesteuert werden können, besitzen andere Komponenten keine thermischen Sensoren oder erweiterten Steuerungsmöglichkeiten. Ungünstige Veränderungen des Klimas im Rechenzentrum können somit zu einem Verlust an Datenintegrität führen.
Ferner sollte darauf geachtet werden, für welche Rechenzentrumsklasse eine Komponente gefertigt wurde. Je nach Auslastung kann eine Komponente aber auch in einem Rechenzentrum einer anderen Klasse verwendet werden. Die meisten IT-Komponenten bieten bezüglich ihrer Performance in extremen Umgebungen einen gewissen Puffer. Angesichts der engen Margen bei der Produktion ist es allerdings gut möglich, dass die Hersteller künftig auf diese Puffer verzichten.
Die Rechenzentrumsbetreiber müssen sich auf diese neue Situation einstellen und dafür sorgen, dass ihre Einkäufer in enger Kooperation mit den Herstellern die tatsächliche Leistungsfähigkeit der IT-Geräte verstehen.
Serverkosten versus Temperatur
Manche Komponenten, wie zum Beispiel Prozessoren, lassen sich bei höheren Temperaturen betreiben, verursachen dann aber höhere Kosten oder bieten weniger Leistung. Andere Komponenten lassen sich für den Betrieb bei höheren Temperaturen nachrüsten. Der Leistungsgewinn wiegt die Kosten aber häufig nicht auf. Eine Verbesserung der Kühlkörper in Verbindung mit einer Verbesserung der Luftströme kann deshalb die bessere Option sein.
Eine Erhöhung der Luftströme ist allerdings nur dann notwendig, wenn die Zulufttemperatur bereits sehr hoch ist. Wird die Leistungsfähigkeit durch die Verbesserung der Kühlung beibehalten, steigen die Kosten pro Server um 1 bis 2 % bei einer Temperatur von 40 °C in einem A3- und bei 35 °C in einem A2-Rechenzentrum. Benötigen die Server jedoch zusätzliche Komponenten, um die Klasse A3 oder A4 zu erreichen, können die Kosten um 10 bis 15 % steigen.
Fazit
Trotz der Energieeinsparung seitens des Kühlsystems durch intensive Nutzung von freier Kühlung ist die Entscheidung für eine möglichst hohe zulässige Serveransaugtemperatur nicht immer die richtige Wahl. Denn gegenläufige Effekte, wie der Anstieg des Stromverbrauchs der IT-Komponenten, können die Einsparungen sogar überwiegen. Zudem sind negative Effekte auf die Ausfallrate, die Geräuschemission, die Leistung der Server und erhöhte Anschaffungskosten für IT-Komponenten zu erwarten. Eine sorgfältige Abwägung aller technischen und wirtschaftlichen Faktoren ist deshalb bei der Planung eines Rechenzentrums unumgänglich. Dazu bietet das ASHRAE-Whitepaper detaillierte Richtlinien.
Das Workingpaper finden Sie unter folgendem Link: www.eni.com/green-data-center/it_IT/static/pdf/ASHRAE_1.pdf