Zum Hauptinhalt springen

„Teuken-7B“ nennt sich ein neues vielsprachiges Sprachmodell, das vielfältige Anwendungen Künstlicher Intelligenz (KI) für Wirtschaft und Wissenschaft verspricht. Zu den Entwicklern gehörten auch die Fraunhofer-Institute für Integrierte Schaltungen IIS in Erlangen und für Intelligente Analyse- und Informationssysteme IAIS in Sankt Augustin. Die neue KI-Technologie ist nach Angaben der Entwickler derzeit eines der wenigen KI-Sprachmodelle, das von Grund auf mehrsprachig entwickelt worden sei. Es enthalte ca. 50 Prozent nicht-englische Daten und sei in allen 24 europäischen Amtssprachen trainiert worden. Zudem wurde das Modell mit einem neuen Verfahren trainiert, sodass auch komplexe sprachliche Strukturen wie im Deutschen oder Ungarischen effizient verarbeitet werden. Damit sei es besonders für international tätige Unternehmen interessant.

Die Bereitstellung als Open-Source-Tool erlaubt es Unternehmen und Organisationen, eigene angepasste Modelle in realen Anwendungen zu betreiben. Zusätzlich wurde das Modell für praxisnahe Anwendungen wie Chat-Systeme optimiert. Als erstes Unternehmen bietet die Deutsche Telekom ein kommerzielles Angebot auf Basis von „Teuken-7B“ und verspricht dafür höchste Sicherheits- und Compliance-Standards.

Entwickelt wurde „Teuken-7B“ („Teuken“ steht für „Token“ und „EU“) im Zuge des Projekts „OpenGPT-X“, das durch das Bundeswirtschaftsministerium gefördert wird. Es steht in zwei Varianten zur Verfügung: einer Version für Forschungszwecke und einer Version unter der Lizenz „Apache 2.0“, die Unternehmen neben Forschung auch für kommerzielle Zwecke nutzen und in eigene KI-Anwendungen integrieren können.

Das neue Sprachmodell ist auch über die Infrastruktur der Forschungsinitiative „Gaia-X“ zugänglich. Dies ist auch hinsichtlich der Datensicherheit wichtig, denn die Gaia-X-Standards garantieren die Datenspeicherung und -verarbeitung nach höchsten europäischen Datenschutz- und Sicherheitsbestimmungen. Die Daten verbleiben stets beim Eigentümer und werden ausschließlich nach festgelegten Bedingungen geteilt. Damit sei auch die sichere Nutzung sensibler Unternehmensdaten möglich. Deshalb eigne sich „Teuken-7B“ auch für KI-Anwendungen in sicherheitskritischen Bereichen wie Automobilindustrie, Robotik, Medizin oder Finanzenwesen, so Prof. Dr.-Ing. Bernhard Grill, Institutsleiter am Fraunhofer IIS.

Webcode: N1004