Weitere GPU-Partitionen für LISE

Lenovo erweitert das HPC-Cluster des Zuse Institut Berlin

11. Dezember 2023, 12:04 Uhr | Lukas Steiglechner
© ZIB

Das Zuse Institut Berlin bietet mit seinem HPC-System LISE Forschern und Wissenschaftlern die Möglichkeit, rechenintensive Anwendungen auszuführen. Die Nachfrage steigt, darum erweitert Lenovo nun das System um weitere Partitionen – mit einer möglichst positiven Energieeffizienz.

Lenovo erweitert das HPC-System „LISE“ am Zuse Institut Berlin (ZIB), einer interdisziplinären Forschungseinrichtung für angewandte Mathematik und datenintensives High Performance Computing (HPC). Seit Ende März 2023 sind die GPU-Partitionen bereits für Nutzer zugänglich, während die Installation der CPU-Partition für Anfang nächsten Jahres geplant ist. Besonderer Fokus liegt dabei auf der Verbesserung der Energieeffizienz. Lenovo setzt dafür auf Technologien wie die Neptune-Warmwasserkühlung, während der HPC-Partner Pro-com für eine nahtlose Integration in das bestehende System sorgt. Diese Erweiterung versorgt Forschende mit der nötigen Leistung, um rechenintensive Anwendungen wie Künstliche Intelligenz und maschinelles Lernen auszuführen.

„Wir freuen uns, dass uns das Zuse Institut Berlin gemeinsam mit der Pro-com für die Erweiterung ihres HPC-Clusters LISE ausgewählt hat, um die Forschung in Deutschland weiter voranzubringen“, kommentierte Andreas Thomasch, Director HPC & AI DACH, France, UKI bei Lenovo. „Diese Wahl unterstreicht unser Engagement für technologischen Fortschritt durch den warmwassergekühlten Einsatz neuester Intel GPUs und Nvidia GPUs sowie AMD und Intel CPUs, verbunden mit unserer Verpflichtung zu nachhaltigen und effizienten Lösungen im Bereich des High Performance Computing. Durch unsere innovative Neptune-Warmwasserkühlung steigern wir die Rechenleistung des Clusters für einen noch schnelleren Erkenntnisgewinn der Wissenschaftler und reduzieren gleichzeitig die Umweltbelastung.“

Das LISE-System wurde Ende 2019 in Betrieb genommen und im Laufe dieses Jahres aufgrund gestiegener Anforderungen an GPU-Ressourcen um Partitionen mit GPUs von Nvidia und Intel erweitert. Die Nvidia-GPU-Partition besteht aus 42 Rechenknoten, von denen jeder vier Nvidia A100/80 GPUs enthält. Die Intel GPU-Partition hingegen umfasst acht Rechenknoten, von denen jeder mit vier Intel MAX GPUs (frühere Bezeichnung „Ponte Vecchio“) ausgestattet ist. Bei beiden Partitionen kommt Lenovo-Hardware zum Einsatz.

Als Host-CPUs werden Intel IceLake beziehungsweise Sapphire Rapids in einer Dual-Socket-Konfiguration verwendet. Die GPU-Rechenknoten sind über InfiniBand (200 Gb/s) vernetzt und greifen über Gateway-Knoten auf die globalen parallelen Dateisysteme HOME und WORK im Omni-Path-Netzwerk zu.

Die Nvidia GPU-Partition ist seit Ende März für die Nutzer zugänglich, während die Intel-Partition aktuell für den Betrieb vorbereitet wird. Beide GPU-Partition sollen für vier bis fünf Jahre genutzt und ab 2025 um neue heterogene Prozessorarchitekturen erweitert werden.

Energieeffizienz im Fokus

Des Weiteren ist die Installation einer energieeffizienten CPU-Partition mit 168 Knoten für Ende 2023 beziehungsweise Anfang 2024 geplant. Zum Einsatz kommt das ThinkSystem SD665 V3 von Lenovo mit AMD EPYC Prozessoren der 4. Generation (frühere Bezeichnung „Genoa“) und eingebauter Neptune Warmwasserkühlung. Abhängig von Workload, Vorlauftemperatur und Umgebungstemperatur liegt der Effizienzwert des Systems bei 85 bis 90 Prozent. Durch den Einsatz der Lenovo-Extreme-Heat-Recovery-Lösung mit wassergekühlten Netzteilen und isolierten, wassergekühlten Rücktüren der HPC-Racks wird die Effizienz noch weiter gesteigert und mehr als 97 Prozent der Wärme sollen in den Warmwasserkreislauf statt ins Rechenzentrum abgeführt werden. Dies steigert die Energiebilanz des Rechenzentrums, da eine zusätzliche Raumkühlung überflüssig wird.

„Für das Zuse Institut Berlin ist seit Jahren der energieeffiziente Betrieb seiner leistungsfähigen HPC-Ressourcen von besonderer Wichtigkeit und treten gleichberechtigt neben hohe Rechenleistung und effizienten Betrieb“, ergänzte Thomas Steinke, Leiter der Abteilung Supercomputing am ZIB. „Mit Hinblick auf die Nachhaltigkeit und die Energiekostenentwicklung haben wir uns für technologische Lösungen von Lenovo entschieden, mit denen wir unsere Ansprüche sowohl an starker Rechenleistung durch neueste Prozessorgenerationen als auch an hoher Energieeffizienz der CPU- und GPU-Plattformen aufgrund der direkten Warmwasserkühlung erfüllen können. Wir freuen uns, dass wir mit Lenovo und der Pro-com starke Partner bei der Umsetzung unserer Pläne gefunden haben.“

Gegenwärtig wird außerdem in einer Machbarkeitsstudie die Nachnutzung der Abwärme für das Fernwärmenetz oder die lokale Nutzung im ZIB geprüft.

Anwendungen

Auf dem LISE-System des ZIB werden vielfältige Anwendungen aus verschiedenen Wissenschaftsdisziplinen betrieben. Insbesondere unterstützt das ZIB Forschungsinitiativen in den Bereichen Lebenswissenschaften, Chemie- und Materialwissenschaften, Erdsystemwissenschaften und Ingenieurswissenschaften (CFD).

Die GPU-Ressourcen spielen eine zentrale Rolle in den Projekten, die Methoden der Künstlichen Intelligenz und des maschinellen Lernens in Simulationen und der Methodenentwicklung einsetzen. Zwei Beispiele, die traditionelle Simulationsmethoden mit KI-Ansätzen verknüpfen, sind die Medikamentenentwicklung sowie die Untersuchung der Dynamik von Proteinstrukturen.

Finanzierung und Netzwerk

Das ZIB ist eines von neun NHR-Zentren im Verbund für Nationales Hochleistungsrechnen. Dieser zielt darauf ab, die Hochleistungsrechenkapazitäten für Forschung und Entwicklung in Deutschland weiter auszubauen. Durch die Zusammenarbeit und Vernetzung von Hochleistungsrechenzentren im NHR-Verbund wird die Effizienz und der Zugang zu leistungsstarker Recheninfrastruktur für Wissenschaftler und Forscher in ganz Deutschland erhöht. Der HPC-Cluster LISE nimmt eine bedeutende Rolle in diesem Netzwerk ein und hilft dabei, Deutschland als Innovationskraft im Bereich des Hochleistungsrechnen zu etablieren. Im Zuge dieses Programmes und durch die finanzielle Unterstützung durch Bund und Länder wird LISE nun weiter ausgebaut.


Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Lenovo Deutschland

Weitere Artikel zu CPU

Weitere Artikel zu IT-Infrastruktur/Rechenzentrum

Matchmaker+