Mit Apertus hat die Schweiz laut der ETH Zürich ein KI-Sprachmodell vorgestellt, das auf Transparenz, offene Zugänglichkeit und ethisch verantwortbare Nutzung abzielt. Entwickelt wurde Apertus von der ETH Zürich, der École polytechnique fédérale de Lausanne (EPFL) und dem Schweizerischen Supercomputing-Zentrum CSCS. Das Modell richtet sich an Forschung, Bildung und kleine sowie mittlere Unternehmen (KMU) und setzt damit auf den Schutz des Gemeinwohls.
Zwei Versionen - über tausend Sprachen
Apertus ist in zwei Versionen verfügbar: die kleinere Variante mit 8 Milliarden Parametern kann auf Standard-Laptops betrieben werden, während die leistungsfähigere 70B-Version für Hochleistungsrechner konzipiert ist. Das Modell unterstützt über tausend Sprachen, darunter Schweizerdeutsch, Rätoromanisch und seltene afrikanische Sprachen, und bietet damit einen Vorteil gegenüber primär englischsprachigen Modellen wie ChatGPT oder Gemini.
Transparenz und Open-Source-Ansatz
Im Unterschied zu kommerziellen KI-Modellen ist Apertus ein Open-Source-Modell und unter der Apache-2.0-Lizenz verfügbar. Entwickler können das Modell herunterladen, anpassen und in eigenen Projekten einsetzen. Laut Public AI Inference Utility ist Apertus direkt über Hugging Face nutzbar. Fachleute können die Trainingsmethoden und Datensätze vollständig überprüfen, wodurch das Modell nachvollziehbar und vertrauenswürdig bleibt.
Training auf Supercomputer
Das Training erfolgte auf dem Supercomputer Alps des CSCS in Lugano. Laut ETH Zürich entspricht der Stromverbrauch rund 5 Gigawattstunden, vergleichbar mit dem Jahresverbrauch von 1.500 Haushalten, oder dem Energiebedarf einer SBB-Lokomotive über drei Monate. Dies verdeutlicht den hohen technischen Aufwand für ein leistungsfähiges und gleichzeitig ethisch korrektes Sprachmodell.
KI unabhängig von Big-Tech
Apertus soll künftig spezifische Sprachmodelle in Bereichen wie Recht, Klima, Gesundheit und Bildung bereitstellen. Multimodale Fähigkeiten, darunter KI-gestützte Bildgenerierung, sind geplant. Das Schweizer Modell demonstriert, dass KI nicht ausschließlich von großen Tech-Konzernen entwickelt werden muss, sondern auch öffentliche Institutionen nachhaltige, transparente und gemeinwohlorientierte KI-Infrastrukturen bereitstellen können.


















