Biomedical Cluster at King Juan Carlos University

D-Link Enterprise Switches in the computational cluster to deliver maximum computing power to biomedical research focused on unravelling the mechanisms of ageing and cellular reprogramming in humans.

Biomedical Cluster at King Juan Carlos University

D-Link Enterprise Switches in the computational cluster to deliver maximum computing power to biomedical research focused on unravelling the mechanisms of ageing and cellular reprogramming in humans.

Scarica come PDF

Il progetto, realizzato in collaborazione con il nostro partner SIE, ha visto l’integrazione degli Switch Enterprise in un nuovo cluster computazionale, installato presso l’Universidad Re Juan Carlos, per offrire la massima potenza di calcolo alla ricerca biomedica, incentrata sulla scoperta dei meccanismi di invecchiamento e riprogrammazione delle cellule nell’uomo.

La sfida

Questa ricerca utilizza tecniche di deep learning e di intelligenza artificiale, con algoritmi di apprendimento automatico che richiedono più nodi CPU (per l’elaborazione in parallelo), più GPU (per i modelli di simulazione dello spazio temporaneo) e uno storage condiviso ad alte prestazioni. È stato quindi necessario costruire un nuovo cluster computazionale in grado di far fronte all’enorme potenza di calcolo aritmetica e grafica richiesta dalla ricerca, che è stata coinvolta anche in varie azioni COVID-19. Il progetto del nuovo cluster computazionale è stato finanziato sia dall’Unione europea che dalla Comunità di Madrid.

La soluzione

Lo sviluppo del nuovo cluster computazionale, guidato da Sergio Muñoz, PhD in machine learning e professore di ingegneria biomedica presso l’Universidad Re Juan Carlos, ha visto la SIE (Sistemas Informaticos Europeos), azienda specializzata in soluzioni HPC (High Performance Computing), come fornitore dell’infrastruttura IT. SIE ha già installato più di 60 cluster computazionali presso università e centri di ricerca, sia pubblici che privati. L’azienda è un VIP+, partner ufficiale del programma di canale di D-Link e si è affidata agli switch di livello enterprise di D-Link sia in questo che in progetti precedenti, come il cluster presso l’Istituto di Chimica Teorica e Computazionale dell’Università di Barcellona.

 

Il nuovo cluster computazionale, chiamato TALOS, offre 512 thread di esecuzione nelle CPU e 221,184 core GPU. La potenza totale supera i 20.000 Tflop, mentre la memoria ammonta a 576 TB. È integrato con componenti Gigabyte, nVidia e AMD, tra cui D-Link per la parte di commutazione Ethernet LAN necessaria per la gestione e l’accesso ai cluster, nonché per le comunicazioni IPMI. Il tutto è gestito tramite l’ecosistema HPC Ladon OS 8.

Il cluster dispone di una scheda a doppia porta per i server di gestione e archiviazione, con una porta che consente la connessione a Infiniband e l’altra collegata a una delle porte da 100 Gigabit dello switch D-Link DXS-3610-54T/SI Managed Enterprise. È integrato in una rete connessa in fibra da 100 Gigabit per l’uplink alla rete principale dell’Universidad Re Juan Carlos per garantire la massima larghezza di banda per l’accesso dai computer e dalle workstation dei ricercatori. È stato inoltre necessario creare una rete per le comunicazioni di gestione IPMI installando uno switch managed smart D-Link DGS-1210-52, con 48 porte Gigabit e gestione completa Layer 2 e Layer 3 con routing statico.

La serie di switch DXS-3610 di D-Link è una categoria di switch managed progettati per ambienti top-of-the-rack, campus e data center, nonché per la distribuzione, che possono essere usati in modalità di stacking fino a 12 unità e presentano una densità di porte di 10 Gigabit, con modelli in rame e fibra, nonché sei porte per uplink in fibra da 40 e 100 Gigabit. Il D-Link DXS-3610 raggiunge una capacità di commutazione fino a 2,16 Tbps.

In uno schema di rete così esigente come un cluster computazionale, era necessario avere il massimo livello di capacità di commutazione per gli switch, raggiungendo 2,16 Tbps, nonché ridondanza per evitare qualsiasi interruzione di rete, che nel DXS-3610 si ottiene sia fisicamente con ventole intercambiabili e alimentatori sostituibili a caldo, sia con lo stacking fisico di switch di backup aggiuntivi. Questi sarebbero immediatamente disponibili con la gestione della rete tramite topologie ad anello utilizzando la funzionalità ERPS.

Per quanto riguarda l’implementazione della rete IP con il DXS-3610, le caratteristiche più notevoli sono l’implementazione di DHCP Server, il routing Inter VLAN, nonché il routing dinamico nello switch stesso, riducendo così gli intasamenti che potrebbero essere generati dall’utilizzo di un router convenzionale. In termini di gestione, dispongono di un’interfaccia web e di un accesso alla porta della console per la gestione utilizzando lo standard CLI per i comandi. Inoltre, per il monitoraggio completo della rete in topologie di dispositivi ad alta densità, D-Link offre D-View 8, un software di gestione della rete avanzato basato su SNMP.

Risultato Il

project manager dell’Università, Sergio Muñoz, ha commentato: “Avevamo bisogno della massima potenza di calcolo nel cluster, ma anche dell’agilità nell’accesso dai nostri computer, e la soluzione integrata ha più che soddisfatto entrambi gli aspetti.” Da parte sua, Raúl Díaz, fondatore e project manager di SIE, afferma: “In un cluster informatico di queste dimensioni, non si può trascurare la parte di commutazione IP LAN, ed è per questo che ci affidiamo agli switch D-Link, che hanno dimostrato alte performance e affidabilità, indispensabili in questi ambienti esigenti e critici”, aggiunge Raúl, “oltre a ciò, la consulenza diretta del produttore aggiunge valore aggiuntivo quando si affrontano progetti di questa portata”.