Pansonic Video Lab

Was ist KI-Video?

KI-Video-Generierung verwendet neuronale Netze — meist Diffusion Transformer (DiT) — um aus Textbeschreibungen, Bildern oder Videos neue Bewegtbilder zu erschaffen. Statt Kamera, Licht und Schauspieler brauchst du nur einen gut formulierten Prompt. Die KI "malt" 24 Bilder pro Sekunde, die zusammen ein flüssiges Video ergeben.

Text-to-Video

Du beschreibst eine Szene in Worten — z.B. "Eine Katze springt über einen Zaun im Sonnenuntergang" — und die KI generiert daraus ein 5–10-sekündiges Video. Je präziser der Prompt, desto besser das Ergebnis.

Image-to-Video

Du lädst ein Foto hoch und die KI animiert es: Ein Portrait wird zum sprechenden Gesicht, eine Landschaft zum Zeitraffer mit Wolken. Mehr Kontrolle als Text-to-Video, da das Ausgangsbild vorgegeben ist.

Video-to-Video

Du lädst ein bestehendes Video hoch und die KI transformiert es: Stilwechsel (Anime, Ölmalerei), Objekt-Ersetzung, Hintergrundwechsel oder das Entfernen von Elementen. Idealer Einstieg für Filmemacher.

Video-Erweiterung

Die KI setzt ein Video nahtlos fort: Du hast 5 Sekunden, die KI generiert die nächsten 5. Durch wiederholtes Extend entstehen längere Sequenzen. Die größte Herausforderung: Konsistenz von Charakteren und Umgebung.

Open Source — Lokal auf deinem Rechner

Die stärksten KI-Modelle sind heute Open Source. Mit einer halbwegs aktuellen Grafikkarte (8+ GB VRAM) kannst du professionelle Videos komplett lokal generieren — ohne Cloud, ohne Abo, ohne Datenschutzbedenken. Der Einstieg ist über ComfyUI am einfachsten.

Wan 2.1

Alibaba | Apache 2.0
Derzeit eines der besten Open-Source-Modelle. Verfügbar als 1.3B (läuft auf 8 GB VRAM) und 14B Version. Hervorragende Bewegungsdarstellung, physikalische Plausibilität und schnelle Inferenz. Unterstützt Text-to-Video und Image-to-Video.

HunyuanVideo 1.5

Tencent | Open Source
8,3 Milliarden Parameter, optimiert für Consumer-GPUs. Hohe visuelle Qualität, starke Textverständnis und konsistente Bewegungen. Bildet den Sweet Spot zwischen Qualität und Hardware-Anforderungen. Auch als Image-to-Video verfügbar.

LTX-Video / LTX-2

Lightricks | Open Source
Besonders schnell: Erzeugt 6-Sekunden-Clips in 5 Sekunden auf Consumer-Hardware. LTX-2 unterstützt 4K, 50 FPS und synchronisierte Audio-Generierung. Keyframe-Steuerung und LoRA-Support für individuelle Stile.

CogVideoX

Tsinghua / Zhipu AI | Apache 2.0
Transformer-basiert mit 3D-VAE und 3D-RoPE. Starke Text-Bild-Ausrichtung und zeitliche Kohärenz. Die 5B-Version ist ein guter Kompromiss aus Qualität und Geschwindigkeit. Auch als Image-to-Video verfügbar.

ComfyUI

Node-basierte Open-Source-Oberfläche
Das Standard-Tool für lokale KI-Video-Generierung. Verbinde Nodes für Modelle, Prompts, Sampler und Export visuell wie ein Flussdiagramm. Unterstützt alle obigen Modelle und hunderte Community-Erweiterungen.

Hardware-Anforderungen: Für die kleineren Modelle (Wan 1.3B, HunyuanVideo 1.5) reichen 8 GB VRAM — also eine RTX 3060/4060 oder vergleichbare Karten. 16 GB VRAM (RTX 4080/4090) ermöglichen höhere Auflösungen und schnellere Generierung. Ohne GPU nutze die Web-Tools im nächsten Abschnitt.

Freemium Web-Tools — Keine Hardware nötig

Keine leistungsstarke GPU? Kein Problem. Diese Tools laufen in der Cloud und bieten kostenlose Kontingente für den Einstieg. Ideal für Schulen, unterwegs oder zum ersten Ausprobieren.

Runway

Free: 125 Credits (einmalig)
Der Industriestandard. Gen-4.5, Gen-4 Turbo, Motion Brush, Video-to-Video, 4K-Upscaler. Die besten Steuerungswerkzeuge der Branche. Free-Tier ist begrenzt (Wasserzeichen), aber perfekt zum Testen.

Pika Labs

Freemium
Besonders stark bei Image-to-Video und Stil-Transfer. Einfache Oberfläche, schnelle Generierung. Die Pika-1.5-Version liefert beeindruckende Ergebnisse bei Charakter-Konsistenz und Bewegungsflüssigkeit.

Kling AI

Freemium
Von Kuaishou (chinesischer TikTok-Konkurrent). Hervorragende physikalische Plausibilität und Kamera-Bewegungen. Besonders gut für realistische Szenen und komplexe Aktionen. 1.6/2.0/3.0 Versionen verfügbar.

Haiper

Freemium
Von Minimax. Starke allgemeine Performance mit nativem Audio-Support. 720p Standard-Auflösung, einfache Bedienung. Gutes Preis-Leistungs-Verhältnis für Einsteiger.

PixVerse

Freemium
Vielseitig mit vielen Stil-Vorgaben (Anime, Realistisch, 3D). Unterstützt Character-to-Video für konsistente Figuren über mehrere Clips. Gute Community und viele Tutorials.

Luma Dream Machine

Freemium
Von Luma Labs. Besonders natürliche Bewegungen und realistische Physik. Image-to-Video ist hier exzellent. Die Free-Tier ist großzügig bemessen für erste Experimente.

KI-gestützte Videobearbeitung

Nicht nur die reine Generierung — auch die Nachbearbeitung wird durch KI revolutioniert. Diese Tools integrieren KI-Funktionen direkt in den Schnitt-Workflow und sparen enorme Zeit.

CapCut

Freemium | Bytedance
KI-Auto-Captions (Untertitel automatisch generieren), KI-Background-Removal (Hintergrund entfernen ohne Green Screen), KI-Music (passt Musik an Video-Länge an), KI-Denoise. Die Desktop-Version ist kostenlos und leistungsstark.

Descript

Freemium
Text-basiertes Video-Editing: Du editierst das Transkript und das Video folgt. KI-Stimmenklonung (Overdub), automatische Füllwort-Entfernung ("äh", "um"), Screen Recording mit KI-Enhancement. Revolutionär für Podcasts und Tutorials.

OpusClip

Freemium
Long-to-Short KI: Lade ein langes Video hoch (z.B. 1 Stunde Podcast) und OpusClip extrahiert automatisch die viralesten 60-Sekunden-Clips mit KI-B-Roll, dynamischen Untertiteln und intelligenter Schnittfolge.

Quickstart: Dein erstes KI-Video

Der schnellste Weg ins KI-Video: Ein Freemium-Web-Tool. Keine Installation, keine Hardware-Anforderungen, sofort einsatzbereit. Hier ist der Workflow mit Runway als Beispiel — die Schritte sind bei anderen Tools ähnlich.

1

Tool wählen & Account erstellen

Gehe zu runwayml.com und erstelle einen kostenlosen Account. Du erhältst 125 Credits (einmalig) — genug für ca. 25 Sekunden Gen-4 Turbo Video. Alternativ: Pika, Kling oder Haiper für größere Free-Tiers.

2

Prompt formulieren

Ein guter Prompt ist präzise und visuell: "Aerial drone shot, slow pan over a misty mountain lake at sunrise, golden light reflecting on calm water, cinematic, 4K, shallow depth of field." Je spezifischer, desto besser.

3

Generieren & vergleichen

Wähle das Modell (z.B. Gen-4 Turbo für schnelle Iteration), stelle die Dauer ein (5–10 Sekunden) und generiere 2–4 Varianten mit leicht unterschiedlichen Prompts. Vergleiche die Ergebnisse und wähle den besten Clip.

4

Upscalen & erweitern

Nutze den 4K-Upscaler für höhere Auflösung. Willst du länger? Nutze "Extend" oder generiere einen zweiten Clip mit überlappendem Ende und füge sie in DaVinci Resolve oder Shotcut zusammen.

5

In dein Projekt integrieren

Lade das generierte Video herunter und importiere es in deinen Schnitt (Resolve, Shotcut, Premiere). Kombiniere KI-generierte Szenen mit echtem Footage für einen hybriden Look — das ist der sweet spot.

Prompt-Engineering-Tipp: Strukturiere deine Prompts nach dem Schema: [Kamera] + [Szene] + [Aktion] + [Licht/Stimmung] + [Stil/Qualität]. Beispiel: "Close-up, an elderly carpenter carving wood in a dusty workshop, warm afternoon light through a window, documentary style, film grain."

KI-Video für unsere Module

Jedes Modul im Video Lab profitiert von KI-Tools. Hier ist die Karte, wo KI-Video deinen Workflow beschleunigt oder ergänzt.

Modul 04 — Schnitt

CapCut KI + Descript: Auto-Captions in Sekunden, KI-gestützte Sprachverbesserung, automatische Schnitt-Vorschläge basierend auf Pausen und Füllwörtern. OpusClip für Long-to-Short Extraktion.

Modul 05 — Farbe & Grading

Runway / LTX Video-to-Video: Wandle das komplette Farb-Grading eines Videos mit einem Prompt um: "convert to noir film style with high contrast". Oder nutze KI-basierte Color-Matching zwischen Clips.

Modul 06 — Audio & Sound

Hunyuan-Foley + ElevenLabs: Generiere automatisch passende Soundeffekte zu deinem Video. KI-Sprachsynthese für Voiceover. Descript Overdub für Sprachkorrekturen ohne Neuausfnahme.

Modul 07 — Motion Graphics

KI-Generierung + Compositing: Generiere animierte Hintergründe, Partikel-Effekte oder abstrakte Visuals mit Wan 2.1 oder Runway. In Resolve Fusion oder After Effects als Layer compositen.

Modul 08 — KI-Workflows

ComfyUI + API-Integration: Baue automatisierte Pipelines: Text → Video → Audio → Schnitt. Nutze Runway-API oder lokale Modelle in ComfyUI für Batch-Generierung. Das ist KI-Workflow in Reinform.

Modul 10 — Storytelling

KI-Visualisierung: Generiere Storyboards und Mood-Videos aus deinem Drehbuch. Teste verschiedene visuelle Stile, bevor du drehst. Runway und Pika sind hier ideale Prototyping-Tools.

Ethik, Rechte & rechtliche Hinweise

KI-Video ist mächtig — und mit großer Macht kommt große Verantwortung. Bevor du KI-generierte Videos veröffentlichst, solltest du diese grundlegenden Regeln kennen.

Deepfake & Personenschutz

Erstelle niemals Videos, die reale Personen ohne deren Einwilligung zeigen. Das Erzeugen von "Deepfakes" ist in vielen Ländern strafbar. Auch für Satire und Parodie gibt es Grenzen — informiere dich über die Rechtslage in deinem Land.

Urheberrecht & Training

KI-Modelle wurden mit Millionen urheberrechtlich geschützter Videos trainiert. Die rechtliche Lage zu generierten Outputs ist weltweit unklar. Nutze KI-Video für private Projekte und Bildungszwecke. Bei kommerzieller Nutzung: Nutze Open-Source-Modelle mit klaren Lizenzen (Apache 2.0).

Transparenz & Labeling

Sei transparent: Kennzeichne KI-generierte Inhalte als solche. Auf YouTube, TikTok und Instagram gibt es Pflichten zur Kennzeichnung von KI-Inhalten. Ehrlichkeit schafft Vertrauen — und schützt dich rechtlich.

Faktizität & Desinformation

KI-Video kann real aussehende, aber vollständig erfundene Szenen erzeugen. Missbrauch für Desinformation, politische Manipulation oder Betrug ist nicht nur unethisch, sondern oft strafbar. Verantwortungsvoller Umgang ist Pflicht.

Wichtig: Die rechtliche Lage zu KI-generierten Videos ändert sich schnell. In der EU gilt der AI Act mit spezifischen Anforderungen an generative KI. In Österreich und Deutschland gelten zusätzlich Urheberrechts- und Persönlichkeitsrechtsbestimmungen. Bei kommerziellen Projekten konsultiere einen Anwalt.

Ressourcen & Links

Die KI-Video-Landschaft entwickelt sich täglich. Hier sind die besten Quellen, um auf dem Laufenden zu bleiben.

Wan 2.1 auf GitHub

Das vollständige Open-Source-Repository mit Modell-Weights, Inference-Code und Dokumentation. Apache 2.0 lizenziert — frei für kommerzielle Nutzung.

HunyuanVideo 1.5 auf GitHub

Tencents Open-Source-Video-Modell mit 8,3B Parametern. Inklusive Installationsanleitung für lokale Nutzung und vortrainierte Checkpoints.

ComfyUI auf GitHub

Die führende Node-basierte Open-Source-Oberfläche für KI-Bild- und Video-Generierung. Unterstützt alle gängigen Modelle über Custom Nodes.

Runway — KI-Video-Plattform

Die professionelle Cloud-Lösung für KI-Video. Free-Tier mit 125 Credits, Standard ab $12/Monat. Gen-4.5, Motion Brush, Video-to-Video und mehr.

r/StableDiffusion — Community

Die größte KI-Bild- und Video-Community auf Reddit. Täglich neue Modelle, Workflows, Tutorials und Troubleshooting-Hilfe. Der beste Ort, um aktuell zu bleiben.