Small Language Models: Warum die Zukunft der KI kleiner wird

Claus Fesel
1. Juni
6 Min. Lesezeit

Maschine mit Energieverbrauch und ein kleines Präzisionsteil

Wer KI nutzt, nutzt Infrastruktur. Und Infrastruktur hat einen ökologischen Fußabdruck — in Strom, Wasser, Kupfer und Fläche. Das ist keine neue Erkenntnis, aber die Dimensionen verschieben sich gerade rasant. Gleichzeitig entsteht leise eine Alternative, die die Debatte um KI und Nachhaltigkeit grundlegend verändern könnte — und die gerade für mittelständische Unternehmen hochrelevant ist: sogenannte Small Language Models, kurz SLMs.

Was das bedeutet, welche konkreten Vorteile diese kleineren Sprachmodelle bieten — und wo ihre Grenzen liegen — das hat Alexander Fischer vom KI-Kompetenzcenter der Bundesdruckerei-Gruppe in einer Mittagspause der Peer School for Sustainable Development e.V. am 28. Mai 2026 eindrücklich aufgezeigt. Gemeinsam mit Mareike Ahrens stellte er das Forschungsprojekt ADLER vor, das sich gezielt mit dem Praxiseinsatz kleiner Sprachmodelle für die öffentliche Verwaltung — und darüber hinaus — beschäftigt.

Als Nachhaltigkeitsberater für KMU und Mittelstand begleite ich Unternehmen, die KI zunehmend als Werkzeug betrachten — aber oft zögern, weil Datenschutz, Ressourcenfragen und fehlende Standardlösungen bremsen. Was ich in der Mittagspause gehört habe, war für mich deshalb kein rein technisches Update, sondern ein strategischer Perspektivwechsel.

Wie groß ist das Problem wirklich? Der KI-Energiehunger in Zahlen

Der globale Stromverbrauch von Rechenzentren wird sich laut Prognosen der Internationalen Energieagentur (IEA) bis 2030 ungefähr verdoppeln. Und die Nachfrage durch KI wächst schneller als die Projektionen einpreisen konnten: Auf einer der großen Plattformen für KI-Schnittstellen hat sich das wöchentliche Token-Volumen — also die Menge verarbeiteter Spracheinheiten — innerhalb eines einzigen Jahres um das 35-Fache gesteigert.

Die Nutzung von KI-Modellen wächst in einem Tempo, das bestehende Infrastruktur- und Energiepläne bereits heute überholt.

Was viele dabei übersehen: Es ist nicht mehr hauptsächlich das Training der Modelle, das Energie frisst, sondern zunehmend die sogenannte Inferenz — also jede einzelne Anfrage, jede erzeugte Antwort, jeder automatisierte Prozess, der ein Modell aufruft. McKinsey schätzt, dass KI-Inferenz bis 2030 über 40 Prozent der globalen Rechenzentrumsnachfrage ausmachen könnte.

In Frankfurt, einem der größten Internetknotenpunkte der Welt, werden bereits keine neuen Stromverträge mehr für Rechenzentren vergeben. Wer ein neues Rechenzentrum betreiben will, braucht eigene Energieversorgung — und landet praktisch zwangsläufig bei Gaskraftwerken. Nachhaltig sieht anders aus.

Was sind Small Language Models — und was unterscheidet sie von den „Großen"?

Small Language Models sind keine abgespeckten, schlechteren Versionen großer KI — sie sind spezialisierte Werkzeuge für definierte Aufgaben.

Eine allgemein anerkannte Trennlinie zwischen großen und kleinen Sprachmodellen gibt es bisher nicht. Das Forschungsprojekt ADLER orientiert sich an einer Definition des Halbleiterunternehmens NVIDIA: Ein Small Language Model ist ein Sprachmodell, das auf handelsüblicher Verbraucherelektronik ausgeführt werden kann — also auf einem gewöhnlichen Laptop, einem Arbeitscomputer oder einem modernen Smartphone. Kein eigenes Rechenzentrum, keine Spezial-Hardware.

Die technische Architektur ist dabei dieselbe wie bei großen Modellen. Der Unterschied liegt in der Parameterzahl: Parameter sind vereinfacht gesagt die Stellschrauben, an denen beim Training gedreht wird. Weniger Parameter bedeuten weniger Rechenleistung — und weniger Ressourcenverbrauch.

Wie drastisch dieser Unterschied sein kann, zeigte eine eigene Messung aus dem Projekt: Ein zehnmal größeres Modell verursachte einen sechzehnmal höheren Energieverbrauch. Der Mehrverbrauch skaliert also nicht linear mit der Modellgröße, sondern überproportional.

Spezialisierung als Schlüssel: Wenn Klein das Große schlägt

Allgemeine Qualitätsvergleiche zwischen kleinen und großen Sprachmodellen gehen zugunsten der großen aus — sie haben mehr gespeichertes Weltwissen, sind flexibler in unbekannten Situationen. Aber dieser Vergleich greift zu kurz, wenn es um konkrete Aufgaben geht.

Im Projekt ADLER wurde ein Modell mit lediglich 4 Milliarden Parametern — also eines, das problemlos auf einem handelsüblichen Laptop läuft — gezielt auf eine Aufgabe trainiert: die Prüfung und Informationsextraktion aus Vereinsregistrierungsunterlagen. Das Trainingsmaterial? 10.000 synthetisch erzeugte Beispiele, generiert von einem größeren Sprachmodell.

Wer ein Sprachmodell auf eine klar definierte Aufgabe spezialisiert, kann damit große Allzweckmodelle bei eben dieser Aufgabe übertreffen — bei einem Bruchteil des Ressourcenverbrauchs.

Das Ergebnis: Das spezialisierte kleine Modell übertraf GPT-5.2 um 2 Prozentpunkte — bei dieser einen Aufgabe. Das ist kein Zufall, sondern das Prinzip hinter SLMs: Was ein Modell genau lernt, lernt es besonders gut.

Die Qualitätslücke zwischen kleinen und großen Modellen schließt sich zudem generell: Aktuelle Benchmarks zeigen, dass kleine Modelle — trainiert auf einer einzelnen Verbraucher-GPU — heute in ähnlichen Qualitätsbereichen liegen wie Frontier-Modelle, die vor weniger als einem Jahr noch unerreichbar schienen.

Datensouveränität by Design: Was lokale KI für Unternehmen bedeutet

Neben dem Ressourcenaspekt hat der lokale Betrieb kleiner Sprachmodelle eine zweite, für viele Unternehmen noch gewichtigere Dimension: Datenschutz und digitale Souveränität.

Wer Daten in externe KI-Dienste schickt, gibt Kontrolle ab. Vor dem französischen Senat konnte Microsoft nicht ausschließen, dass Daten europäischer Bürger:innen in die USA übertragen werden. Das ist kein Randproblem — es betrifft Unternehmen, die mit vertraulichen Kundeninformationen, Mitarbeiterdaten, eingestuften Unterlagen oder sensiblen Geschäftsprozessen arbeiten.

Mit einem lokal betriebenen Sprachmodell verbleiben Daten dort, wo sie hingehören: im eigenen Unternehmen, auf eigener Hardware, unter voller Kontrolle.

Keine Datenströme über das offene Internet, keine Verträge mit außereuropäischen Cloud-Providern, keine unangekündigten Modell-Updates durch externe Anbieter, die das Verhalten der KI plötzlich verändern. Das schafft nicht nur Sicherheit, sondern auch Auditierbarkeit — für IT-Sicherheitsverantwortliche und Datenschutzbeauftragte ein erheblicher Unterschied.

Für Unternehmen, die KI bisher genau aus diesen Gründen meiden oder stark einschränken, eröffnet dieser Ansatz neue Möglichkeiten.

Was das für KMU-Nachhaltigkeitsstrategie bedeutet

In meiner Beratungspraxis erlebe ich immer wieder dieselbe Konstellation: Mittelständische Unternehmen wollen KI nutzen, scheuen aber den Schritt, weil sie sensible Kundendaten, Produktionsdaten oder vertrauliche Kalkulationen nicht in externe Dienste geben wollen — und das zu Recht. Gleichzeitig fehlen häufig die IT-Ressourcen für große Cloud-Infrastrukturen, und das Argument „Wir brauchen das Alleskönner-Modell von Anbieter X" lässt sich intern schwer begründen, wenn der konkrete Nutzen unklar bleibt.

SLMs bieten hier einen anderen Einstieg: nicht über die Frage „Welches große Modell lizenzieren wir?", sondern über die Frage „Welche wiederkehrenden Aufgaben könnten wir mit einem spezialisierten, lokal betriebenen Modell automatisieren?" Das ist eine Frage, die ich als Berater mit Unternehmen viel lieber durchdenke — weil sie zu konkreten, umsetzbaren Antworten führt.

Für KMU ist die SLM-Perspektive kein Technologie-Trend, sondern eine strategische Entscheidungsfrage: Welche KI passt zu unseren Prozessen, unseren Daten und unserem Ressourcenverständnis?

Und sie verbindet Nachhaltigkeitsstrategie mit Digitalisierungsstrategie auf eine Weise, die bisher oft fehlt: Wer fragt, wie ressourceneffizient seine KI-Nutzung ist, stellt automatisch auch bessere Fragen über Prozesse, Datenhaltung und technologische Abhängigkeiten.

Wo SLMs (noch) an ihre Grenzen stoßen

Ehrlichkeit gehört zu einem fairen Bild dazu: Kleine Sprachmodelle sind Spezialisten, keine Alleskönner. Wer ein Modell für sehr komplexe Coding-Aufgaben, tiefes Reasoning über viele Schritte oder breite Allgemeinwissensanfragen einsetzen will, ist mit großen Modellen besser bedient.

Und: Kommerzielle Standardlösungen auf Basis kleiner Sprachmodelle sind noch rar. Wer heute SLMs einsetzen will, braucht meist IT-Kompetenz im eigenen Haus oder externe Unterstützung. Das ändert sich, aber noch langsam.

Kleine Sprachmodelle sind kein Ersatz für alle KI-Anwendungen — aber für viele betriebliche Aufgaben sind sie heute bereits die ressourceneffizientere, souveränere und oft günstigere Wahl.

Ein europäischer Weg: Stärke durch Spezialisierung

Das Bundesministerium für Umwelt, Klimaschutz, Naturschutz und nukleare Sicherheit hat im April 2026 durch sein Expertengremium empfohlen, dass Deutschland und Europa gezielt auf spezialisierte KI-Modelle setzen sollten. Begründung: Sie reduzieren den Energieverbrauch erheblich und stärken die wirtschaftliche Wettbewerbsfähigkeit.

Das ist mehr als eine Energieeffizienzempfehlung. Es ist eine Positionierung: Europa muss nicht im Wettrennen um die größten Rechenzentren mitspielen. Es kann einen eigenen Weg gehen — mit Modellen, die Aufgaben zuverlässig, sicher und ressourcenschonend lösen.

Nicht das größte Modell gewinnt — sondern das Modell, das die richtige Aufgabe am besten löst.

Für Unternehmen, die Nachhaltigkeitsstrategie und Digitalisierung zusammendenken wollen, ist das ein konkreter Ansatzpunkt: KI einsetzen, wo sie Sinn ergibt, mit Modellen, die zur Aufgabe passen — und dabei Energieverbrauch, Datenschutz und Kosten mitdenken.

Fazit: Nachhaltige KI beginnt mit der richtigen Frage

Für KMU und mittelständische Unternehmen, die Nachhaltigkeitsstrategie und Digitalisierung zusammendenken wollen, ist das ein konkreter Ansatzpunkt: KI einsetzen, wo sie Sinn ergibt, mit Modellen, die zur Aufgabe passen — und dabei Energieverbrauch, Datenschutz und Kosten nicht als Nachgedanken, sondern als Auswahlkriterien mitdenken.

Das Forschungsprojekt ADLER zeigt, dass dieser Weg technisch heute schon gangbar ist. Was jetzt fehlt, ist das Bewusstsein dafür in den Unternehmen — und der Mut, KI-Entscheidungen nicht einfach am Namen des größten Anbieters festzumachen.

Wenn ihr euch fragt, wie das für euer Unternehmen konkret aussehen könnte: Genau das ist eine Frage, die ich gerne gemeinsam durchdenke.

Weiterführende Quellen und Links

Whitepaper Forschungsprojekt ADLER – Bundesdruckerei GmbH:

IEA Report "Energy and AI": https://www.iea.org/reports/energy-and-ai
BMUKN-Empfehlung zu spezialisierten KI-Modellen (April 2026): https://www.bundesumweltministerium.de/pressemitteilung/internationale-ki-experten-spezialisierte-ki-modelle-koennen-energieverbrauch-stark-reduzieren-und-wirtschaftliche-wettbewerbsfaehigkeit-staerken

FAQ

Sind Small Language Models wirklich besser für die Umwelt? Nicht pauschal — aber in vielen Anwendungsfällen erheblich ressourceneffizienter. Ein zehnfach größeres Modell kann einen sechzehnfach höheren Energieverbrauch erzeugen. Wer die richtige Modellgröße für seine Aufgabe wählt, reduziert den ökologischen Fußabdruck seiner KI-Nutzung real.

Können kleine Sprachmodelle wirklich große Modelle wie ChatGPT ersetzen? Für viele betriebliche Aufgaben — Klassifikation, Informationsextraktion, Dokumentenprüfung, strukturierte Prozesse — ja. Für offene, kreative oder sehr komplexe Aufgaben sind große Modelle weiterhin überlegen. Die Frage ist nicht entweder/oder, sondern: Welches Modell passt zu welcher Aufgabe?

Was brauche ich, um Small Language Models im Unternehmen einzusetzen? Heute noch vor allem IT-Kompetenz und die Bereitschaft, etwas selbst aufzubauen — fertige Standardlösungen sind noch selten. Unternehmen mit eigenem IT-Team können bereits loslegen; für andere lohnt sich das Gespräch mit spezialisierten Partnern.

Claus Fesel