Künstliche Intelligenz

07.04.2026

KI-KOLUMNE: Die richtige KI für die richtige Aufgabe

Stellen Sie sich vor: Ihre Gemeinde plant das Sommerfest. Sie brauchen einen Einladungstext für die Website, ein ansprechendes Plakat, ein kurzes Video für Social Media und Hintergrundmusik für die Warteschleife am Gemeindetelefon. Die Kollegin aus der Öffentlichkeitsarbeit öffnet ChatGPT und tippt: „Mach mir ein Plakat für unser Sommerfest der Marktgemeinde Finkenstein am 17.7. um 18:00 in Latschach beim Kulturhaus.“ Das Ergebnis? Ein netter Text mit Formulierungsvorschlägen für ein Plakat. Aber eben kein Plakat-Bild. ChatGPT hat den detaillierten Prompt als Textaufgabe verstanden – nicht als Bildauftrag.

Das ist kein Fehler der KI. Es ist ein Missverständnis. Denn „die KI“ gibt es nicht. Es gibt hunderte verschiedene Modelle und sie sind so unterschiedlich wie Hammer, Schraubenzieher und Wasserwaage. Alles Werkzeuge. Aber keines kann alles.

Die Textversteher: Große Sprachmodelle

Das sind die KI-Systeme, die Sie wahrscheinlich kennen: ChatGPT, Claude, Gemini, Perplexity. Text rein, Text raus. Briefe formulieren, E-Mails beantworten, Texte zusammenfassen, Fragen beantworten – das ist ihre Domäne.

Nicht alle gleich: Wer kann was?

ChatGPT (von OpenAI) ist der Allrounder mit rund 900 Millionen wöchentlichen Nutzern – das aktuelle Modell GPT-5 kann Texte schreiben, Bilder erzeugen, im Internet suchen und sogar Sprache verstehen. Claude (von Anthropic) hat seine Stärke bei langen Dokumenten – das Modell „Opus“ kann bis zu 1.000 Seiten auf einmal verarbeiten. Gemini (von Google) ist direkt in die Google-Welt eingebunden und hat mit Nano Banana 2 den derzeit besten Bildgenerator an Bord. Und Perplexity ist eine KI-Suchmaschine: Frage rein, Antwort mit Quellenangaben raus.

Es gibt also nicht „die beste KI“. Es gibt die beste KI für eine Aufgabe, in diesem Moment.

Der Dokumenten-Spezialist: Mistral OCR

Auch innerhalb der Sprachmodelle gibt es Spezialisten. Mistral (aus Frankreich) zum Beispiel hat sich auf Dokumentenverarbeitung konzentriert: Ihr OCR-System kann gescannte PDFs, Rechnungen und komplexe Tabellen lesen und in sauberen Text umwandeln. Für Gemeinden, die täglich mit Bergen von PDF-Dokumenten arbeiten, ist das eine spannende Entwicklung.

Die Bildermacher: KI-Bildgeneratoren

Sie brauchen ein Bild für den Newsletter? Eine Illustration für die Kinderseite auf der Website? ChatGPT und Gemini können mittlerweile beide Bilder erzeugen – direkt im selben Chat. Googles Nano Banana 2 (in Gemini) ist derzeit der wohl beeindruckendste Bildgenerator, kostenlos zum Ausprobieren. Für die meisten Gemeinde-Aufgaben reicht das als Einstieg.

Daneben gibt es weitere Spezialisten: Midjourney für künstlerische Bilder, Seedream (ByteDance) und Flux für fotorealistische Ergebnisse, Ideogram für lesbaren Text im Bild. Dazu kommen gerade viele starke Modelle aus China auf den Markt.

Die Filmemacher: KI-Videogeneratoren

Dieser Bereich ist am turbulentesten. OpenAIs Videogenerator Sora wurde im März 2026 nach gut einem Jahr wieder eingestellt – so schnell dreht sich das Karussell. Aber die Alternativen sind stark: Kling (aus China, ab ca. 8€/Monat) erzeugt Videos bis zu drei Minuten. Runway ist der Favorit professioneller Kreativteams. Googles Veo erzeugt sogar passenden Sound zum Video.

Für Gemeinden heißt das: Kurze Social-Media-Clips sind heute schon möglich. Einen ganzen Imagefilm ersetzt das aber noch nicht – die Konsistenz über mehrere Szenen hinweg ist noch die größte Schwachstelle.

Die Stimmen: KI-Audio und Sprachmodelle

ElevenLabs ist der führende Anbieter für KI-Stimmen – in über 70 Sprachen, natürlich klingend, mit Emotionen und Betonungen. Praktisch für Gemeinden: Telefonansagen, barrierefreies Vorlesen auf der Website oder Audiobeiträge für den Newsletter.

Und dann gibt es Musik-KIs wie Suno: Statt stundenlang nach lizenzfreier Musik zu suchen, beschreiben Sie, was Sie brauchen – „Fröhliche Hintergrundmusik, akustische Gitarre, 2 Minuten“ – und bekommen einen fertigen Track. Gratis-Version zum Testen, Bezahlversion ab ca. 10€/Monat.

Die Unabhängigen: Lokale KI-Modelle

Bei Cloud-KI verlassen Ihre Daten den eigenen Rechner. Lokale Modelle wie Qwen (derzeit eines der stärksten offenen Modelle), Llama oder Mistral können Sie auf eigenem Computer installieren – die Daten bleiben bei Ihnen. Der Haken: Die Einrichtung erfordert technisches Wissen. Tools wie Ollama oder LM Studio helfen, aber es bleibt eine Option für Gemeinden mit IT-Kompetenz.

Die Denker: Reasoning-Modelle

Mehrere Anbieter bieten inzwischen „Denkmodi“ an: Die KI denkt länger nach, bevor sie antwortet. In ChatGPT wählen Sie zwischen „Instant“ (schnell) und „Thinking“ (gründlich) – oder „Auto“, dann entscheidet die KI selbst. Bei Claude heißt es „Erweitertes Denken“, bei Gemini „Deep Think“.

Nützlich bei komplexen Aufgaben: rechtliche Fragestellungen analysieren, Budgetentwürfe prüfen, Fördermöglichkeiten vergleichen. Braucht man nicht täglich – aber gut zu wissen.

Zurück zum Sommerfest: Welches Werkzeug für welche Aufgabe? Mit dem Wissen aus dieser Kolumne würde unsere Kollegin jetzt so vorgehen:

Fünf Aufgaben, fünf Werkzeuge. Keines davon ersetzt die Kollegin, aber jedes spart ihr eine Menge Zeit.

Sie müssen nicht alles auf einmal lernen

Wenn Sie bisher nur ChatGPT kennen: Das ist ein perfekter Ausgangspunkt. Man muss nicht alles auf einmal lernen. Aber man sollte wissen, dass es existiert – für den Tag, an dem man es braucht.

Kleine Hausaufgabe für diese Woche Denken Sie an eine Aufgabe in Ihrer Gemeinde, für die Sie bisher kein KI-Werkzeug nutzen – vielleicht etwas mit Bildern, Audio oder Video. Probieren Sie eines der hier genannten Tools aus. Die meisten haben kostenlose Versionen zum Testen.

– M.TREIBER (KIUMI – Die Agentur für Zusammenarbeit von KI und Mensch)

KI KOMPAKT

Die KI-Modelllandschaft: Welches Werkzeug für welche Aufgabe?

Sprachmodelle (LLMs): ChatGPT, Claude, Gemini, Perplexity – für alles mit Text. ChatGPT ist der Allrounder, Claude stark bei langen Dokumenten, Gemini gut bei Recherche, Perplexity die KI-Suchmaschine mit Quellenangaben. Spezialtipp: Mistrals OCR kann gescannte PDFs und Rechnungen in sauberen Text umwandeln.

Bildgeneratoren: ChatGPT und Gemini erzeugen Bilder direkt im Chat. Googles Nano Banana 2 (in Gemini) ist derzeit führend. Spezialisten: Midjourney (künstlerisch), Seedream/Flux (fotorealistisch), Ideogram (Text im Bild).

Videogeneratoren: Kling, Runway, Googles Veo – kurze Clips aus Textbeschreibungen. Für Social Media nützlich, für längere Produktionen noch nicht geeignet. Der Bereich verändert sich rasant.

Audio & Sprache: ElevenLabs für KI-Stimmen (Telefonansagen, barrierefreies Vorlesen). Suno für lizenzfreie KI-Musik – Gratis-Version zum Testen, Bezahlversion ab ca. 10€/Monat.

Lokale Modelle: Qwen, Llama, Mistral – laufen auf eigener Hardware, maximaler Datenschutz. Technisch anspruchsvoller, aber für Gemeinden mit IT-Kompetenz eine Option.

Reasoning-Modi: „Denk länger nach“ – bei ChatGPT „Thinking“ vs. „Instant“, bei Claude „Erweitertes Denken“, bei Gemini „Deep Think“. Für komplexe Aufgaben wie rechtliche Analysen.

Der wichtigste Satz: Es gibt nicht „die beste KI“. Es gibt die beste KI für diese Aufgabe, in diesem Moment.

ALLE TOOLS AUF EINEN BLICK

DOWNLOADS
LINKS
MEHR ZUM THEMA

Kostenloses KI‑Webinar: Mit KI durchs Web – der neue Browser als Assistent

KI-KOLUMNE: Vom Ausprobieren zum echten Können – was KI-Kompetenz wirklich bedeutet

KI-KOLUMNE: KI im Projekt- und Veranstaltungsmanagement

© Copyright - Kommunalnet