Jim Keller-ledet Chip Company Tenstorrent har frigivet sin næste generations ormehulsprocessor til AI-arbejdsbelastninger, som den forventer at tilbyde god ydelse til en overkommelig pris.Virksomheden tilbyder i øjeblikket to yderligere PCIe-kort, der kan rumme en eller to ormhulsprocessorer, samt TT-Loudbox og TT-Quietbox-arbejdsstationer til softwareudviklere. Alle dagens meddelelser er rettet mod udviklere, ikke dem, der bruger ormhulsplader til kommercielle arbejdsbelastninger.
”Det er altid glædeligt at få flere af vores produkter i hænderne på udviklere. Udgivelsesudviklingssystemer ved hjælp af vores Wormhole ™ -kort kan hjælpe udviklere med at skalere og udvikle multi-chip AI-software,” sagde Jim Keller, administrerende direktør for Tenstorrent.Ud over denne lancering er vi glade for at se de fremskridt, vi gør med båndet ud og power-up af vores anden generation af produkt, Blackhole. ”

Hver ormhulsprocessor indeholder 72 Tensix-kerner (hvoraf fem understøtter RISC-V-kerner i forskellige dataformater) og 108 MB SRAM, der leverer 262 FP8 TFLOPS ved 1 GHz med en termisk designkraft på 160W. Enkelt-chip ormhul N150-kortet er udstyret med 12 GB GDDR6-videohukommelse og har en båndbredde på 288 GB/s.
Wormhole -processorer giver fleksibel skalerbarhed til at imødekomme de forskellige behov i arbejdsbelastning. I et standardopsætning af arbejdsstation med fire Wormhole N300 -kort kan processorer kombineres til en enkelt enhed, der vises i softwaren som et samlet, bredt Tensix -kernenetværk. Denne konfiguration giver acceleratoren mulighed for at håndtere den samme arbejdsbyrde, splittes mellem fire udviklere eller løbe op til otte forskellige AI -modeller samtidig. Et vigtigt træk ved denne skalerbarhed er, at den kan køre lokalt uden behov for virtualisering. I et datacentermiljø vil ormhulsprocessorer bruge PCIe til ekspansion inde i maskinen eller Ethernet til ekstern udvidelse.
Med hensyn til ydeevne opnåede Tenstorrents single-chip ormhul N150-kort (72 Tensix-kerner, 1 GHz frekvens, 108 MB SRAM, 12 GB GDDR6, 288 GB/s båndbredde) 24 GB GDDR6, 576 GB/s båndbredde) leverer op til 466 FP8 TFLOPS ved 300W.
For at sætte 300W af 466 FP8 TFLOPS i sammenhæng, vil vi sammenligne det med, hvad AI -markedsleder Nvidia tilbyder på denne termiske designkraft. NVIDIAs A100 understøtter ikke FP8, men det understøtter INT8 med en høj ydeevne på 624 toppe (1.248 toppe, når de er sparsomme). Til sammenligning understøtter NVIDIAs H100 FP8 og når en topydelse på 1.670 TFLOPS ved 300W (3.341 TFLOPS ved sparsom), hvilket er markant forskelligt fra Tenstorrents Wormhole N300.
Der er dog et stort problem. Tenstorrents Wormhole N150 retails for $ 999, mens N300 sælger for $ 1.399. Til sammenligning retails en enkelt NVIDIA H100 -grafikkort for $ 30.000, afhængigt af mængde. Selvfølgelig ved vi ikke, om fire eller otte ormehulsprocessorer faktisk kan levere ydelsen af en enkelt H300, men deres TDP'er er henholdsvis 600W og 1200W.
Foruden kortene tilbyder Tenstorrent forudbyggede arbejdsstationer til udviklere, herunder 4 N300-kort i den mere overkommelige Xeon-baserede TT-Loudbox med aktiv køling, og den avancerede TT-Quietbox med EPYC-baserede XiaOlong) væskeafkølingsfunktion).
Posttid: Jul-29-2024