Fraunhofer mischt bei Sprachmodellen mit
Künstliche Intelligenz: Vielsprachig, sicher und schon im Einsatz: Das Sprachmodell „Teuken-7B“ des Fraunhofer-Instituts IIS in Erlangen.


KI wird die Welt revolutionieren“: Davon ist Prof. Dr.-Ing. Bernhard Grill, Leiter des Fraunhofer-Instituts für Integrierte Schaltungen IIS in Erlangen, überzeugt. Bei der Veranstaltung „IHK trifft Wissenschaft“ sagte er in Richtung der anwesenden Unternehmer: „Nicht dabei sein, ist keine Option.“ Spätestens seit dem Start von ChatGPT beschäftigt sich die Wirtschaft mit den Möglichkeiten der sogenannten Sprachmodelle aus den USA von Google, Meta, Microsoft & Co. Und seit dem Launch des chinesischen Konkurrenten DeepSeek sind auch Energieeffizienz und Modellierung ein Thema. Immerhin gilt die Leistung von DeepSeek trotz der US-Sanktionen im Hightech-Bereich als beachtlich.
Welches Potenzial der KI zugemessen wird, lässt sich in den USA an dem geplanten Stargate-Projekt ablesen: US-Präsident Trump will mit einen riesigen Fördertopf mit 500 Mrd. US-Dollar das Wettrennen mit den Chinesen für sich entscheiden. In Europa bremsen dagegen laut Grill die hohen Datenschutz-Standards z. B. mit dem neuen AI-Act (Artificial Intelligence = KI). Außerdem fehlten die hohen Investitionssummen wie in den USA. Immerhin habe die EU mit InvestAI ein Förderprogramm mit einem Volumen von 200 Mrd. Euro angekündigt. Frankreich wolle zusammen mit den Vereinigten Arabischen Emiraten bis zu 50 Mrd. Euro in KI investieren. Ein wichtiger Erfolgsbaustein für KI seien die verfügbaren Rechenkapazitäten, aber Grill kritisiert die intransparenten Förderkriterien. Das derzeit im nordrhein-westfälischen Forschungszentrum Jülich entstehende Rechenzentrum sei ein guter Schritt in die richtige Richtung, allerdings bräuchte man so ein Zentrum auch in Bayern.
Grill denkt dabei auch an sein Erlanger Institut, das zwei Jahre vor ChatGPT gemeinsam mit dem Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS das eigene KI-Sprachmodell „Teuken-7B“ entwickelt hat (siehe WiM 2-3/2025, Seite 17). Teuken ist ein Kunstwort aus Token und EU. Token steht in diesem Kontext für eine Zahlenreihe, in die ein Wort eines Textes umgewandelt wird und so für die nachfolgenden mathematischen Prozesse verfügbar ist.
Eine Reihe von Unternehmen arbeitet bereits mit „Teuken-7B“: Sie nutzen das Sprachmodell beispielsweise, um damit auf Basis ihrer eigenen Daten aus der Fertigung eine individuelle Maschinensteuerung umzusetzen. Andere erledigen damit KI-gestützt Verwaltungsaufgaben oder automatisieren ihren Kunden-Support. Die Automobilindustrie wird von Fraunhofer IIS mit Assistenzsystemen unterstützt. Ein wichtiger Unterschied zu den großen amerikanischen oder chinesischen KI-Modellen: „Die Kundendaten der Unternehmen bleiben im geschützten Raum“, hebt Grill hervor. Sie flössen nicht in den allgemeinen Datenbestand von Chat-GPT & Co. ein. Mit einer entsprechenden Lizenz ließen sich KI-Anwendungen auf die firmeneigenen Geräte wie Handys oder Laptops, auf die firmeneigene Cloud oder das eigene Firmenareal begrenzen.
Ein weiterer Unterschied zu den großen KI-Sprachmodellen: „Teuken-7B“ ist eine europäische KI „Made in Germany“. Sie ist Open Source und damit keine „Black Box“ sowie im Einklang mit den strengen europäischen Datenschutzregeln. Neben kleinen eingebetteten Lösungen für spezielle Anwendungen wie etwa einem Hörgerät eignet sich „Teuken-7B“ auch als sogenanntes Foundation-Modell für Großgeräte. Es lässt sich mit Texten, Videos und anderen beliebigen Daten füttern. Anders als die allgemein sehr großen Modelle achten IIS und IAIS darauf, nicht einfach unkontrolliert alle verfügbaren Daten, den Common Crawl, einzuspeisen. Außerdem liegt der Fokus nicht fast ausschließlich auf Englisch und Chinesisch. Vielmehr ist „Teuken-7B“ vielsprachig: „Es versteht und spricht alle 24 EU-Sprachen.“ Beim nächsten Update im Sommer sollen weitere 13 Sprachen und Dialekte hinzukommen.
Autor: Thomas Tjiang
Das Sprachmodell „Teuken-7B“ finden Sie auf der Plattform Hugging Face. Weiterführende Informationen zum Thema Künstliche Intelligenz stellt das Fraunhofer IIS bereit.
Webcode: N1113