HC1: Effizienter Chip deklassiert jede GPU bei lokaler KI-Beschleunigung

Auch im IT-Bereich und etwa in Bezug auf Rechenchips kann man durchaus ein gewisses Spannungsfeld zwischen Universalität und Performance annehmen. Ein Rechenchip - oder auch allgemein gesprochen, ein System - kann universell sein und damit verschiedene Aufgaben bewältigen. Allerdings ist es im Regelfall möglich, Systeme nur auf einen einzelnen Anwendungsfall zu designen und massiv zu optimieren. Im Falle eines Rechenchips kann die ganze Architektur dann etwa mit definierten Datentypen und ohne Mechanismen zur Bearbeitung von Sonderfällen agieren. Einigen Lesern dürfte dies durchaus bekannt sein: Universell nutzbare CPUs und GPUs wurden beim Mining von spezialisierten ASICs abgelöst, welche extrem effizient arbeiten, aber eben nur zum Mining eingesetzt werden können.
Eine ähnliche Entwicklung zeigt sich bei KI-Beschleunigern. Inzwischen sind auch im Endkundenbereich Prozessoren mit integrierter NPU verbreitet. Der Hersteller Taalas hat mit dem HC1 nun einen besonders spezialisierten Rechenchip vorgestellt. Der Talaas HC1 ist dabei nicht nur auf die Beschleunigung von KI-Modellen insgesamt beschränkt, sondern sogar auf ein spezielles Modell, konkret Llama 3.1 8B und damit ein tendenziell kleines Modell. Gewisse Anpassungen sollen sich allerdings vornehmen lassen. Die Performance gibt Taalas mit 16.960 Token in der Sekunde an, die Nvidia B200 kommt Herstellerangaben zufolge auf 353 Token in der Sekunde. Im Vergleich zum Cerebras WSE-3 wird mit einer fast zehnmal so hohen Performance bei einer zehnmal geringeren Leistungsaufnahme geworben - und das bei 20-fach günstigerem Preis. Informationen zum Preis oder zur Verfügbarkeit liegen indes noch nicht vor.










