Der chinesische Grafikkartenhersteller Moore Threads hat seine „MUSA Developer Conference“ abgehalten und dabei seine nächste Architektur-Generation namens „Huagang“ (auch „Flowerpot“ genannt) enthüllt. Die Architektur soll im nächsten Jahr auf den Markt kommen und sowohl Gaming- als auch KI-Anwendungen abdecken. Die Konferenz hielt sich jedoch mit spezifischen technischen Spezifikationen zur kommenden Architektur zurück und legte stattdessen den Schwerpunkt auf Leistungsversprechen.
Eine neue Gaming-GPU namens „Lushan“ wird auf der Huagang-Architektur basieren und die aktuellen Modelle MTT S80 und S90 ablösen. Das Unternehmen verspricht eine 15-fache Leistungssteigerung beim Rendern von AAA-Spielen sowie einen 50-fachen Boost bei der Raytracing-Leistung. Laut Berichten soll die Grafikkarte zudem über eine Hardware-Raytracing-Engine der zweiten Generation sowie volle DirectX-12-Ultimate-Unterstützung für eine bessere Kompatibilität verfügen. Es ist jedoch wichtig zu bedenken, dass es bislang keine Belege dafür gibt, dass diese Behauptungen der Realität standhalten – man sollte sie also mit einer gewissen Skepsis genießen.
In Bezug auf den Speicher wird erwartet, dass die GPU bis zu 64 GB bietet, was einer Steigerung gegenüber den 16 GB GDDR6 der aktuellen Modelle entspricht. Zudem behauptet das Unternehmen eine 64-fache Verbesserung der KI-Rechenleistung, eine 16-fache Steigerung bei der Geometrieverarbeitung, eine 4-fache Steigerung bei der Texturfüllrate sowie eine 8-fache Verbesserung beim Atomic Memory Access. Laut Berichten wird die GPU außerdem über eine neue „UniTE“-Unified-Rendering-Architektur mit einem dedizierten KI-Hardwareblock verfügen. Es bleibt jedoch abzuwarten, ob diese Angaben tatsächlich von bleibendem Wert sein werden.
Neben Lushan gab das Unternehmen auch einen Ausblick auf seine ‚Huashan‘-KI-GPU, die Berichten zufolge über ein Dual-Chiplet-Design mit 9 HBM-Modulen verfügt. Das Unternehmen behauptet, dass die Leistung mit Nvidias Hopper- und Blackwell-GPUs vergleichbar sein wird und die Speicherbandbreite sogar die der Nvidia B200 übertrifft. Die KI-GPU wird zudem Berechnungen von FP4 bis FP64 unterstützen, einschließlich hauseigener Formate (MTFP4, MTFP6, MTFP8), und ist über die ‚MTLink 4.0‘-Schnittstelle mit einer Geschwindigkeit von 1.314 GB/s auf über 100.000 GPUs skalierbar. Das Unternehmen verspricht eine Steigerung der Rechendichte um 50 Prozent sowie eine 10-fache Effizienzverbesserung gegenüber den aktuellen Modellen.
Obwohl keine Gaming-Demos für die GPUs verfügbar waren, präsentierte das Unternehmen eine Performance-Demo für DeepSeek V3 auf der MTT S5000, einer weiteren GPU, die nächstes Jahr erscheint, aber nicht zur Huashan-Reihe gehört. Die GPU erreichte offenbar 1.000 Token/Sekunde im „Decode“ und 4.000 Token/Sekunde im „Prefill“, womit ihre Leistung leicht über der von Nvidias Hopper-Generation liegt. Die kommenden GPUs verdeutlichen Chinas Bestreben nach Unabhängigkeit im GPU-Sektor angesichts bestehender Exportbeschränkungen. Weitere Details werden in den kommenden Monaten erwartet, wenn die Produkte kurz vor der Markteinführung stehen.
Quelle(n)
Fast Technology (auf Chinesisch)















