Die Interactions API ist jetzt allgemein verfügbar. Wir empfehlen, diese API zu verwenden, um auf alle aktuellen Funktionen und Modelle zuzugreifen.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Videogenerierung in der Gemini API

Die Gemini API bietet zwei Modelle für die Videogenerierung: Gemini Omni Flash und Veo. Beide sind für unterschiedliche Arbeitsabläufe konzipiert.

Verwenden Sie Gemini Omni Flash als Standardmodell für die Videogenerierung. Es bietet eine bessere Videokohärenz, eine bessere Verarbeitung mehrerer Eingaben (Unterstützung von Text-, Bild-, Audio- und Videoeingaben gleichzeitig), eine bessere Konsistenz der Charaktere, eine höhere faktische Genauigkeit und eine mehrfache Bearbeitung per Prompt (z.B. Ersetzen von Elementen oder Ändern der Perspektive). Verwenden Sie Veo 3.1, wenn bestimmte Funktionen wie die Szenenerweiterung, die Steuerung des letzten Frames oder die Integration in ältere Pipelines erforderlich sind.

Gemini Omni Flash

Gemini Omni Flash ist ein schnelles, multimodales Modell für die Videogenerierung und die Bearbeitung von Videos per Prompt. Es kann Text-Prompts und Bilder schnell in kurze Videos umwandeln und ermöglicht es Ihnen, die Ergebnisse mithilfe der Interactions API in mehreren Schritten zu optimieren.

Erste Schritte mit Gemini Omni Flash →

Veo 3.1

Veo 3.1 ist ein Modell für die Videogenerierung mit nativem Audio. Es unterstützt Funktionen wie die Videoerweiterung, die framespezifische Generierung und die bildbasierte Steuerung über die generateContent API.

Erste Schritte mit Veo 3.1 →

Videos verstehen

Wenn Sie vorhandene Videoinhalte aufnehmen und analysieren möchten, anstatt neue Videos zu generieren , lesen Sie den Leitfaden Videos verstehen.