'Nadie lo sabe todavía': el diseño de donut podría crear un monstruo informático de tránsito de billones Los analistas discuten la interconectividad inusual mientras el CEO de Cerebras admite que no sabemos qué sucede cuando se conectan múltiples WSE

[ad_1]

Tri-Labs (que comprende tres importantes instituciones de investigación de EE. UU.: el Laboratorio Nacional Lawrence Livermore (LLNL), los Laboratorios Nacionales Sandia (SNL) y el Laboratorio Nacional de Los Alamos (LANL)) está trabajando con la empresa de inteligencia artificial. Mentes Aborda una serie de problemas científicos, incluida la ruptura de la barrera de la escala temporal de la dinámica molecular (DM).

Hay un documento que explica este desafío en particular, que puedes leer. aquíPero básicamente apunta al problema de realizar simulaciones de dinámica molecular en una escala de tiempo mayor de lo que normalmente es posible.

Las barreras aquí son dobles: potencia computacional y latencia de comunicación entre diferentes nodos del sistema HPC. Tradicionalmente, para compensar la falta de potencia computacional, los científicos asignan más trabajo a cada nodo y aumentan el tamaño de la simulación con el número de nodos. Desafortunadamente, la comunicación lenta entre nodos causada por una alta latencia exacerba el problema de la escala de tiempo.

como donas

Las simulaciones MD son cruciales para muchos campos científicos porque cierran la brecha entre los métodos de la electrónica cuántica y la mecánica continua. Sin embargo, estas simulaciones enfrentan limitaciones de tiempo, ya que deben tener en cuenta las vibraciones atómicas, que ocurren en escalas de tiempo muy cortas, y otros fenómenos que ocurren durante períodos mucho más largos.

Los autores del artículo intentaron superar la barrera de la escala de tiempo utilizando un sistema computacional más eficiente, específicamente el motor de oblea de Cerebras.

como Próxima plataforma “La simulación específica consistía en enviar radiación a tres redes cristalinas diferentes hechas de tungsteno, cobre y tantalio. En esta simulación en particular, que era para 801.792 átomos en cada red, la idea era bombardear las redes con radiación y ver qué pasaba.

Al ejecutar simulaciones en Frontier, la supercomputadora más rápida del mundo con sede en el Laboratorio Nacional Oak Ridge en Tennessee, y en Quartz en LLNL, los científicos solo pudieron observar nanosegundos de lo que estaba sucediendo en las redes mientras eran bombardeadas con radiación. Usando WSE, se les dio decenas de milisegundos de tiempo para observar lo que sucedió.

Para las pruebas, Tri-Labs utilizó el Cerebras Wafer Scale Engine 2 (WSE-2), en lugar del motor más nuevo y potente. WSE-3 se lanzó a principios de este año.Pero como se detalló anteriormente, los resultados fueron impresionantes. Como señala el documento, “Al dedicar un núcleo de procesador a cada átomo simulado, demostramos una mejora de 179 veces en los pasos de tiempo por segundo en comparación con la plataforma Exascale basada en GPU de Frontier, junto con una mejora significativa en los pasos de tiempo por unidad de energía. Uno o dos días abren escalas de tiempo actualmente inaccesibles para procesos lentos de transformación microestructural que son fundamentales para comprender el comportamiento y la función de los materiales.

Próxima plataformaEl director ejecutivo de Cerebras, Timothy Prickett Morgan, y el cofundador, Andrew Feldman, preguntaron qué sucede cuando se conectan varios motores a escala de chip e intentan ejecutar la misma simulación, y les dijeron que “nadie lo sabe todavía”.

Prickett-Morgan continuó señalando que “la interconexión privada en los sistemas WSE-2 puede ser de hasta 192 dispositivos, y con WSE-3, este número ha aumentado en más de un orden de magnitud a 2.048 dispositivos”, pero “fuertemente Sospecha que los mismos principios La analogía se aplica tanto a las WSE como a las GPU y CPU.

Sin embargo, continuó sugiriendo que podría haber alguna forma de conectar físicamente los WSE entre sí, creando una “chimenea de cuadrados de WSE interconectados”, lo que crearía un diseño en forma de rosquilla con energía funcionando en el interior y enfriándose en el exterior. . Como concluye Prickett Morgan: “Este tipo de configuración no podría ser peor que usar InfiniBand o Ethernet para interconectar las CPU o GPU”.

Más de TechRadar Pro

[ad_2]

Source Article Link

By lisa nichols

Leave a Reply Cancel reply