🤖 Google × Kaggle ✅ Kostenlos 🔴 Läuft jetzt: Tag 1

5-Day AI Agents:
Intensive Vibe Coding Course

Lerne in 5 Tagen, wie du mit KI-Agenten und Vibe-Coding moderne Software entwickelst — geführt von Google-Forschern und -Ingenieuren.

5Kurstage
01:00Livestream tägl. (ICT)
1–2 Std.Aufwand pro Tag
1,5 Mio+Lernende (Vorlauf)
🏠

Kursübersicht

Auf einen Blick

Zeitraum
15.–19. Juni 2026
Format
Online, selbstgesteuert
Kosten
Kostenlos
Veranstalter
Kaggle × Google
Capstone-Abgabe
6. Juli 2026, 23:59 PT
Teilnahme bisher
Über 1,5 Mio. Lernende

Worum geht es?

Dieser Kurs wurde von Google-Forschern und -Ingenieuren entwickelt und vermittelt, wie man leistungsstarke KI-Agenten aufbaut — von den Grundkonzepten bis hin zu produktionsreifen Systemen.

Vibe Coding bedeutet: Du beschreibst in normaler Sprache, was du bauen möchtest, und die KI schreibt den Code. Statt Syntax lernst du, Absichten zu formulieren.

KI-Agenten sind Programme, die eigenständig Aufgaben planen und ausführen — sie können APIs aufrufen, Entscheidungen treffen, auf Fehler reagieren und über mehrere Schritte hinweg arbeiten.

Das Neue gegenüber November 2025: Stärkerer Vibe-Coding-Fokus, neue Speaker, Capstone-Projekt mit Zertifikat, Cloud-Produktionsumgebungen.

Was macht diesen Kurs besonders?

Der Kurs kombiniert drei Lernformate täglich: Theorie (Whitepaper), Praxis (Codelabs) und Live-Austausch (Livestream mit Google-Experten). Alle Inhalte werden aufgezeichnet und stehen zeitlos zur Verfügung.

Als Teilnehmer bekommst du Zugang zu Google AI Studio, einer cloudbasierten Entwicklungsumgebung, die es ermöglicht, Anwendungen direkt in der Cloud zu bauen und zu deployen — ohne eigene Serverinfrastruktur.

Kapitel-Audio: Kursübersicht
⏳ Audio wird nach Transkription generiert (edge-tts)
🎯

Lernziele & Ergebnisse

Was du nach dem Kurs kannst

Kompetenz 1
KI-Agenten verstehen und selbst bauen
Kompetenz 2
Vibe-Coding-Workflows anwenden
Kompetenz 3
Google AI Studio & Gemini API nutzen
Kompetenz 4
Web-Apps in der Cloud deployen
Kompetenz 5
Agenten testen, sichern, evaluieren
Kompetenz 6
Produktionsreife Systeme aufbauen

Was du mitnimmst

🏗️ Praktische Projekte: Eigene Web-Apps, die du live auf Google Cloud Run deployt hast und mit anderen teilen kannst.

🧠 Konzeptverständnis: Du verstehst, was "der neue SDLC" (Software-Entwicklungszyklus) mit KI bedeutet — und wie du als Entwickler die Rolle des System-Orchestrators einnimmst.

🏆 Optional — Kaggle-Zertifikat: Durch die Teilnahme am Capstone-Projekt erhältst du ein Kaggle-Badge und Zertifikat. Top-Einreichungen werden in sozialen Medien hervorgehoben.

Kapitel-Audio: Lernziele
⏳ Audio wird generiert
📅

Der 5-Tage-Plan

Tag 1
Montag, 15. Juni 2026
Einführung: Agenten & Vibe Coding
Von KI-Chatbots zu autonomen Agenten. Natürliche Sprache als Programmierschnittstelle. Erster Deploy auf Cloud Run.
→ Zum Kapitel
Tag 2
Dienstag, 16. Juni 2026
Agent Tools & Interoperabilität
Externe APIs einbinden, Code-Ausführung, Agenten-zu-Agenten-Kommunikation, Tool-Use-Muster.
→ Zum Kapitel
Tag 3
Mittwoch, 17. Juni 2026
Agent Skills: Gedächtnis & Kontext
Langzeitgedächtnis, Zustandsverwaltung, langer Kontext, Token-Optimierung für komplexe Aufgaben.
→ Zum Kapitel
Tag 4
Donnerstag, 18. Juni 2026
Sicherheit & Evaluation
Testen von Agenten, Guardrails, Qualitätsbewertung, Bedrohungsvektoren und Sicherheitsdesign.
→ Zum Kapitel
Tag 5
Freitag, 19. Juni 2026
Produktionsreife Entwicklung
Cloud-Deployment, Debugging, Observability, skalierbare Produktion und Capstone-Projektstart.
→ Zum Kapitel
⏱️

Täglicher Ablauf

So läuft jeder Kurstag

🎧

1. Podcast (Zusammenfassung)

Jeder Tag beginnt mit einem kurzen Podcast-Begleiter zum Whitepaper. Kompakter Überblick über die Kerninhalte des Tages — ideal zum Einstimmen.

~20–30 Min.
📄

2. Whitepaper (Vertiefung)

Das tägliche Whitepaper von Google-Forschern vertieft die Konzepte. Fundierte Theorie mit praktischen Implikationen — das Herzstück des Tages.

~30–45 Min.
💻

3. Codelabs (Praxis)

Geführte praktische Übungen im Browser. Kein Setup nötig — direkt loslegen mit Antigravity 2.0 und Google AI Studio. Hier baust du echte Anwendungen.

~45–60 Min.
🎥

4. Livestream auf YouTube

Jeden Tag um 01:00 Uhr ICT (Hanoi-Zeit, nächste Nacht) gehen Anant Nawalgaria und Smitha Kolan live — mit Google-Gästen, Fragen und Diskussion. Aufzeichnungen werden danach geteilt.

01:00–02:00 Uhr ICT | täglich (nächste Nacht)
💬

5. Discord & Forum (Community)

Fragen stellen, Diskutieren, Netzwerken. Google-Forscher und Ingenieure sind in den Kanälen aktiv und antworten. Alle Materiallinks werden hier geteilt.

Ganztägig verfügbar
Kapitel-Audio: Täglicher Ablauf
⏳ Audio wird generiert
⚙️

Setup-Anleitung

Vorbereitung — Diese Schritte jetzt erledigen

1

Kaggle-Account erstellen

👉 kaggle.com → Registrieren
Wichtig: Telefonnummer verifizieren (Pflicht für Kurs-Teilnahme und Capstone-Einreichung).

2

Google AI Studio Account & API-Key

👉 aistudio.google.com → Anmelden
Dann: linke Sidebar → "Get API key""Create API key"
👉 Direkt zum API-Key erstellen
Den Key kopieren und sicher aufbewahren — er wird in allen Codelabs gebraucht.
⚠️ Ab 19. Juni 2026: Nur noch eingeschränkte (restricted) API-Keys funktionieren.

3

Antigravity 2.0 installieren

👉 antigravity.google/download
Googles kostenlose KI-Entwicklungsumgebung für Windows, Mac und Linux.
Windows: .exe herunterladen → installieren
Mac: .dmg herunterladen → in Programme ziehen
Linux: apt/yum-Paket oder direkter Download
Beim ersten Start: mit Google-Account anmelden.

4

Antigravity IDE installieren

👉 antigravity.google/download (gleiche Seite wie oben)
Die vollständige Agentic IDE mit direkter Gemini-Integration.
Dokumentation: antigravity.google/docs/home

5

Antigravity CLI installieren

👉 antigravity.google/download → CLI-Abschnitt
Terminal-Tool (Befehl: agy) für Deployment auf Cloud Run.
Mac: brew install antigravity
Linux/Windows: Installer von der Download-Seite

6

Kaggle Discord beitreten

👉 discord.gg/kaggle
Discord-Account erstellen → Server beitreten → Kaggle-Account mit Discord verknüpfen.
Im Discord findest du täglich die aktuellen Kurs-Links, Materialien und kannst Fragen stellen.
Kurskanal: #5dgai-vibecoding

Hinweis: Unter 18-Jährige und Personen aus sanktionierten Ländern haben eingeschränkten Zugang zu bestimmten Kursinhalten. Bei Fragen: Kaggle-Support kontaktieren.
Kapitel-Audio: Setup
⏳ Audio wird generiert
🛠️

Tools & Technologien

Was du im Kurs verwendest

🚀
Googles neue Vibe-Coding-Plattform. Du beschreibst Absichten, die KI schreibt Code. Kostenlos für Win/Mac/Linux.
🖥️
Vollständige Agentic-IDE mit direkter Gemini-KI-Integration. Docs: antigravity.google/docs
⌨️
Terminal-Tool (agy) für Deployment auf Cloud Run. Mac: brew install antigravity
🧠
Browser-IDE für Gemini-Modelle. API-Key hier erstellen: aistudio.google.com/apikey
☁️
Serverlose Cloud-Plattform zum Deployen von Web-Apps. Skaliert automatisch.
💎
Googles LLM-API für Agenten-Intelligenz. API-Key kostenlos über AI Studio.
💳

Google One KI-Pläne

Was ist Google One AI?

Google One AI ist Googles Abonnement-System für erweiterten Zugang zu KI-Tools — darunter Antigravity, Gemini, NotebookLM, Google Flow und mehr. Der Link one.google.com/ai erscheint direkt in den Antigravity-Einstellungen, wenn dein Kontingent erschöpft ist oder du upgraden möchtest.

Es gibt 5 Stufen: Kostenlos, Plus, Pro, Ultra (5×) und Ultra (20×). Für den Kaggle-Kurs und Antigravity ist AI Pro der empfohlene Einstieg.

Pläne auf einen Blick

Kostenlos
€0 /Monat
15 GB Speicher
  • Gemini 3 Flash Modell
  • Begrenzte 3.1 Pro Nutzung
  • Bildgenerierung & -bearbeitung
  • Deep Research (begrenzt)
  • Gemini Live, Canvas
  • Antigravity: wöchentliche Limits
AI Plus
$7,99 /Monat
400 GB Speicher · ~₫132.000 VND
  • 2× höhere Gemini-Limits
  • 128K-Token Kontext
  • 200 Google Flow Credits
  • NotebookLM Plus (200 Notizbücher)
  • Gemini in Gmail, Docs
  • Antigravity: Standard-Limits
AI Pro
$19,99 /Monat
5 TB Speicher · ~₫489.000 VND
  • 4× höhere Gemini-Limits
  • Gemini 3.1 Pro (1M Token)
  • 1.000 Google Flow Credits
  • Antigravity: Priority-Zugang ↑
  • YouTube Premium Lite
  • Deep Research & Deep Search
  • Gemini in Drive, Sheets, Slides
  • Jules Coding Agent (Beta)
  • $10/Mo Google Cloud Credits
  • NotebookLM (500 Notizbücher)
AI Ultra 5×
$99,99 /Monat
20 TB Speicher · ~₫2.250.000 VND
  • 5× höhere Limits als Pro
  • Gemini 3.5 Flash Integration
  • Deep Think Reasoning
  • Antigravity: Höchste Limits ↑↑
  • YouTube Premium Individual
  • Gemini Spark (KI-Agent, USA)
  • Project Mariner (Browser-Agent)
  • $40/Mo Google Cloud Credits
  • NotebookLM (2.500 Chats/Tag)
AI Ultra 20×
$199,99 /Monat
30 TB Speicher · ~₫5.500.000 VND
  • 20× höhere Limits als Pro
  • Alle Ultra 5× Features
  • Project Genie (Welten erstellen)
  • Antigravity: Maximale Limits ↑↑↑
  • $100/Mo Google Cloud Credits
  • NotebookLM (5.000 Chats/Tag)

Detailvergleich aller Funktionen

Funktion Kostenlos€0/Mo AI Plus$7,99/Mo AI Pro$19,99/Mo Ultra 5×$99,99/Mo Ultra 20×$199,99/Mo
🚀 ANTIGRAVITY
Antigravity ZugangPlattform nutzbar Begrenzt Priority Höchste Maximum
Rate-Limits (Requests)Wie oft du Aufgaben stellen kannst Wöchentlich
(starke Pausen möglich)
5-Stunden-Refresh
Standard-Kontingent
5-Stunden-Refresh
4× höher als Free
5-Stunden-Refresh
5× höher als Pro
5-Stunden-Refresh
20× höher als Pro
VerbrauchsmodellWie Limits berechnet werden Verbrauchsbasiert: Einfache Textaufgaben = wenig Quota; komplexe Coding-/Reasoning-Tasks = mehr Quota. Bei Limit: automatisch auf kleineres Modell wechseln oder warten.
Antigravity Extra-CreditsZukaufbar bei Bedarf kaufbar kaufbar $100 Bonus
Credit-PreiseZukauf wenn Quota erschöpft $0,01 pro Credit · $25 = 2.500 Credits · $199 = 20.000 Credits (Bulk)
💎 GEMINI MODELLE
Gemini 3 FlashSchnelles Standard-Modell
Gemini 3.1 Pro1M Token Kontext Begrenzt 128K Token 1M Token 1M Token 1M Token
Gemini 3.5 FlashRapid Prototyping
Deep Think ReasoningErweitertes Denken
☁️ SPEICHER & CLOUD
Google One SpeicherGmail + Drive + Fotos zusammen 15 GB 400 GB 5 TB 20 TB 30 TB
Google Cloud CreditsFür Cloud Run, APIs etc. $10/Mo $40/Mo $100/Mo
🛠️ DEVELOPER TOOLS
Deep ResearchAutonomes Web-Recherche-Tool Begrenzt Begrenzt Vollzugang
Jules (Coding Agent)Beta: Programmieraufgaben autonom lösen Beta Erweitert Erweitert
Gemini CLITerminal-Zugang zu Gemini
Google Flow CreditsFür KI-Video/Audio-Studio 0 200/Mo 1.000/Mo 10.000/Mo 25.000/Mo
Gemini in WorkspaceDocs, Sheets, Slides, Drive Gmail only Vollständig
⭐ EXKLUSIVE FEATURES
Gemini SparkAutonomer KI-Agent (nur USA/EN)
Project MarinerBrowser-Agent: automatisiert Webseiten
Project GenieInteraktive Welten erstellen
📓 NOTEBOOKLM
Notizbücher (max.)Dokumente verwalten & befragen 100 200 500 2.500 5.000
Audio-Überblicke/TagPodcast-ähnliche Zusammenfassungen 3/Tag 6/Tag 20/Tag 100/Tag 200/Tag
🎁 BONUS-LEISTUNGEN
YouTube PremiumKein Werbung, Downloads Lite ($8,99 Wert) Individual ($13,99) Individual ($13,99)
Google Home PremiumSmart-Home-Videoarchiv Standard (30 Tage) Advanced (60 Tage) Advanced (60 Tage)
FamilienfreigabeBis zu 5 Personen

Antigravity — Was bedeutet das konkret?

Wie funktionieren die Antigravity-Limits?

Antigravity arbeitet nicht mit festen Prompt-Limits pro Tag. Stattdessen wird der tatsächliche Rechenaufwand gemessen: Eine einfache Textfrage kostet wenig Quota, eine komplexe Code-Aufgabe mit Reasoning kostet mehr. Das Kontingent wird alle 5 Stunden neu aufgefüllt (bei Bezahlplänen).

Szenario in Antigravity Kostenlos Plus Pro Ultra
Vibe-Coding: App von Grund aufKomplexes Projekt, viele Schritte ⚠️ Limit schnell erreicht ⚠️ Begrenzt ✅ Komfortabel ✅ Sehr viel
Einfache Textfragen / ErklärungenKurze Prompts ✅ Geht meist ✅ Problemlos ✅ Problemlos ✅ Problemlos
Codelabs des Kurses durcharbeiten2–3 Stunden Arbeit ⚠️ Pausen nötig ⚠️ Vielleicht knapp ✅ Reicht aus ✅ Problemlos
Capstone-Projekt bauenVollständiger KI-Agent ❌ Nicht empfohlen ⚠️ Sehr begrenzt ✅ Ausreichend ✅ Komfortabel
Modell-Fallback bei LimitWas passiert wenn Quota voll ist? Lange Wartezeit (Woche) Kleineres Modell / Warten Kleineres Modell kurz Nahezu kein Fallback
Credits zukaufen wenn nötigErweiterung bei Bedarf ❌ Nicht möglich ❌ Nicht möglich ✅ $0,01/Credit ✅ $0,01/Credit
Wichtig für Kurs-Teilnehmer: Antigravity nutzt ab dem 19. Juni 2026 ausschließlich eingeschränkte API-Keys (restricted). Wer seinen API-Key noch nicht in AI Studio erstellt hat: jetzt unter aistudio.google.com/apikey erledigen!

Welchen Plan brauchst du für diesen Kurs?

✅ Kostenlos reicht für...
  • Zuschauen beim Livestream
  • Podcast hören + Whitepaper lesen
  • Einfache Gemini-Fragen stellen
  • Kursinhalte verfolgen (ohne Codelabs)
⭐ AI Pro wird empfohlen für...
  • Alle 5 Codelabs vollständig durcharbeiten
  • Capstone-Projekt (eigener KI-Agent)
  • Antigravity intensiv nutzen
  • Gemini 3.1 Pro für bessere Ergebnisse
  • 5 TB Speicher für Projektzwecke
  • YouTube Premium Lite (Werbefrei)
  • $10 Cloud Credits (für Cloud Run)

👉 Empfehlung: Probiere zuerst kostenlos ob die Limits für Tag 1 reichen. Wenn du beim ersten Codelab auf Pausen stoßt — upgrade auf AI Pro ($19,99/Monat, monatlich kündbar). Ultra lohnt sich nur für professionelle Entwickler mit täglichem intensivem Einsatz.

Kapitel-Audio: Google One Pläne
⏳ Audio wird generiert
🔬

Google One Features — Vollständige Erklärung

Hier erfährst du, was jede einzelne Funktion aus der Tabelle oben wirklich macht — in einfachen Worten, mit konkreten Beispielen und einem Vergleich mit Claude (dem KI-Assistenten, den du gerade verwendest). Alle Erklärungen sind für Einsteiger geschrieben.

🚀 Antigravity — Was ist das überhaupt?

Stell dir vor: Du willst eine Webseite bauen. Normalerweise müsstest du HTML, CSS, JavaScript können, eine Datenbank einrichten, einen Server konfigurieren, Tests schreiben und alles deployen. Das dauert Wochen oder Monate.

Mit Antigravity sagst du einfach auf Deutsch: "Baue mir eine Webseite, auf der Nutzer Rezepte hochladen können. Mit Login, Suchfunktion und schönem Design." — Antigravity plant, programmiert, testet und deployt das automatisch. Du schaust zu und gibst Feedback.

Das nennt sich "Vibe Coding" — du gibst die Absicht vor, die KI erledigt die Arbeit.

So funktioniert Antigravity in der Praxis: Du tippst: "Erstelle eine App, die meine täglichen Ausgaben verfolgt."
→ Agent 1 plant die Architektur (was brauchen wir?)
→ Agent 2 schreibt gleichzeitig das Frontend (die Oberfläche)
→ Agent 3 schreibt gleichzeitig die Datenbank-Logik
→ Agent 4 testet automatisch ob alles funktioniert
→ Fertig: Du siehst eine laufende App. Alles in ca. 5 Minuten.

Antigravity läuft als Desktop-App auf deinem Computer (Windows, Mac, Linux) — kostenloser Download auf antigravity.google/download. Es braucht ein Google-Konto. Das Basis-Paket ist kostenlos, aber die Nutzung ist limitiert (wöchentliche Erneuerung). Mit AI Pro bekommst du deutlich großzügigere Limits.

🤖 Vergleich mit Claude (was du gerade verwendest):
MerkmalAntigravityClaude (Code)
BedienungDesktop-App mit KI-Agenten im HintergrundChat-Interface / Terminal-Tool
FokusVollständige Apps bauen (plant + programmiert + deployt)Fragen beantworten, Code erklären, Dateien bearbeiten
ArbeitsweiseMehrere Agenten arbeiten gleichzeitig, du beobachtestDu führst Gespräche, Claude antwortet Schritt für Schritt
KontextBis 1M Token (Gemini 3.1 Pro mit AI Pro)Bis 1M Token (Claude Opus 4.7)
Internet-ZugangJa — testet live im BrowserJa — über Web-Suche
Für wen?Wer Software/Apps bauen will ohne zu programmierenWer Fragen stellen, lernen, Inhalte erstellen will
PreisKostenlos (begrenzt) / AI Pro $19,99/MoKostenlos / Claude Pro $20/Mo

Fazit: Claude und Antigravity ergänzen sich. Claude erklärt und hilft beim Lernen (wie jetzt). Antigravity baut fertige Software. Für diesen Kurs brauchst du Antigravity — um die Codelabs zu machen und dein Capstone-Projekt zu bauen.

Gemini Spark — Dein 24/7-KI-Mitarbeiter

Nur AI Ultra 5× ($99,99/Mo) · Aktuell nur USA/Englisch

Was ist es in einfachen Worten?
Gemini Spark ist ein KI-Agent, der rund um die Uhr für dich arbeitet — auch wenn dein Computer aus ist. Du gibst ihm eine Aufgabe, er arbeitet selbstständig in der Cloud und meldet sich, wenn er fertig ist. Wie ein Assistent, den du einschläfst und morgens kommt das Ergebnis.

Konkrete Beispiele was Gemini Spark kann:
  • Du sagst: "Recherchiere alle Flüge von Hanoi nach Berlin für nächsten Monat unter 800€ und schicke mir eine Zusammenfassung." — Spark durchsucht das Internet, vergleicht und schickt dir eine E-Mail mit den besten Optionen.
  • Du sagst: "Lese alle E-Mails von letzter Woche und erstelle eine Liste der offenen Aufgaben." — Spark liest dein Gmail, sortiert und fasst zusammen.
  • Du sagst: "Fülle dieses Formular auf dieser Webseite aus mit meinen Daten." — Spark öffnet die Seite, füllt Felder aus, wartet auf Bestätigung von dir, dann abschicken.
  • Du sagst: "Überwache diese Webseite und benachrichtige mich wenn der Preis unter 50€ fällt." — Spark prüft täglich und meldet sich bei dir.

Wie unterscheidet sich das von normalem Gemini?
Normales Gemini (oder Claude) antwortet auf deine Frage und ist dann fertig. Gemini Spark arbeitet weiter — es öffnet Webseiten, klickt auf Links, füllt Formulare aus, wartet auf Ergebnisse, all das ohne dass du dabei sein musst. Es läuft auf dedizierten Google-Cloud-Servern.

Sicherheit: Bei wichtigen Aktionen (E-Mail abschicken, Geld ausgeben) fragt Spark erst nach deiner Bestätigung, bevor es handelt.

Aktuell nur auf Englisch und nur in den USA verfügbar. Für Nutzer in Vietnam noch nicht zugänglich — auch mit Ultra-Abo.
Claude kann ebenfalls Webseiten lesen und Texte zusammenfassen — aber nur in diesem Chat-Fenster. Claude arbeitet nicht im Hintergrund weiter wenn du das Gespräch beendest. Gemini Spark dagegen läuft autonom 24/7 in der Cloud.
🌍

Project Genie — Interaktive Welten aus Text erschaffen

Nur AI Ultra 20× ($199,99/Mo) · Experimentell

Was ist es in einfachen Worten?
Project Genie ist ein Google DeepMind-Experiment, mit dem du interaktive, begehbare 3D-Welten aus Text-Beschreibungen oder echten Orten erstellen kannst. Stell dir vor: Du tippst einen Ort oder eine Fantasie-Welt ein — und kannst sie dann wie in einem Videospiel erkunden.

Was du damit machen kannst:
  • "Erstelle eine mittelalterliche Burganlage" → Du kannst durch die Burg laufen, Türme besteigen, Räume erkunden
  • "Zeige mir den Hoan-Kiem-See in Hanoi als interaktive Welt" → Google Street View wird in eine erkundbare Welt umgewandelt (mit Stilen wie "Steinzeit", "Ozean-Welt", "Wüste")
  • "Erstelle eine Fantasy-Insel mit Drachen" → KI generiert eine spielbare Umgebung die du in 1st-Person oder 3rd-Person erkunden kannst

Für wen ist das?
Aktuell ist es ein Forschungsprototyp — also noch kein fertiges Produkt. Es eignet sich für Kreativarbeit, Unterhaltung und zum Experimentieren. Für den Kaggle-Kurs ist es nicht relevant.

Noch sehr experimentell — keine echten Spiele oder fertige Produkte. Nur im Ultra 20× Plan ($199,99/Mo). Für den Kurs irrelevant.
🌊

Project Mariner — Browser-Automatisierung (eingestellt)

War Ultra 5×/20× · Eingestellt Mai 2026

Was war das?
Project Mariner war ein Chrome-Browser-Plugin, das Webseiten wie ein Mensch bedienen konnte: scrollen, klicken, Formulare ausfüllen. Es hat 10 Aufgaben gleichzeitig im Browser erledigt.

Wichtig: Eingestellt seit 4. Mai 2026. Die Technologie wurde in Gemini und Chrome integriert. Mariner als eigenständiges Produkt existiert nicht mehr. Was es konnte, übernimmt nun Gemini Spark (für Ultra-Abonnenten) und wird schrittweise in Chrome's normale Browserfunktionen eingebaut.

Nicht mehr verfügbar als eigenständiges Tool. Falls du in alten Artikeln darüber liest: die Funktion lebt in Gemini Spark weiter.
🎬

Google Flow — KI-Video- und Bildstudio

Credits in jedem Plan · Plus: 200 Credits/Mo · Pro: 1.000/Mo · Ultra: bis 25.000/Mo

Was ist es?
Google Flow ist Googles All-in-One-Studio für KI-generierte Videos, Bilder und Audios. Es vereint drei frühere Produkte: Whisk (Bilder kombinieren), ImageFX (Text zu Bild) und Flow (Video). Alles in einer Web-Oberfläche unter flow.google.com.

Was kann man damit machen?

Video erstellen aus Text (Veo 3.1):
  • Du tippst: "Ein Drache fliegt über einen Regenwald bei Sonnenuntergang, dramatisches Licht, Kinoqualität" → Flow erstellt ein Video-Clip (5–10 Sekunden) in Kinoqualität
  • Der Ton wird gleichzeitig generiert: Vogelgeräusche, Feuer, Musik — alles synchron zum Bild
  • Figuren sprechen: Lippensynchron zum gesprochenen Text generiert
  • Du kannst Video konversationell bearbeiten: "Mach das Licht blauer", "Lass den Drachen langsamer fliegen"
Bild erstellen und bearbeiten (Imagen 4 + Google Pics):
  • Text zu Bild: "Vietnamesisches Streetfood-Markt, Aquarell-Stil" → Bild in Sekunden, bis 4K Auflösung
  • Bild zu Bild: Eigenes Foto hochladen und anpassen lassen
  • Google Pics (neu 2026): Einzelne Teile eines Bildes ändern. Beispiel: Jacke rot statt blau färben, Person in ein anderes Bild einfügen, Text im Bild übersetzen
  • Stil-Referenzen: Bis zu 14 Referenz-Bilder angeben, und die KI erstellt im gleichen Stil
Was ein Flow-Credit kostet (ungefähr): Einfaches Bild = 1–2 Credits · Video (5 Sek.) = 10–20 Credits · Video mit Audio = 30–50 Credits
Pro-Plan: 1.000 Credits/Monat = ca. 20–50 Videos oder 500–1.000 Bilder pro Monat.

Ja, du kannst: Videos erstellen, Bilder erstellen, Bilder bearbeiten, eigene Fotos transformieren, Ton generieren, Videos aus Bildern animieren.

Eigene fertige Videos (z.B. aus der Kamera) vollständig KI-schneiden wie in Premiere Pro — das geht noch nicht. Flow ist besser für Generieren als für komplexes professionelles Schneiden.
Claude kann keine Videos oder Bilder erstellen. Claude arbeitet nur mit Text und Code. Google Flow ist dafür der richtige Ort.
📓

NotebookLM — Dein persönlicher Forscher für Dokumente

Kostenlos: 100 Notebooks · Plus: 200 · Pro: 500 · Ultra: bis 5.000

Was ist es?
NotebookLM ist ein KI-Tool bei dem du eigene Dokumente hochlädst (PDFs, Word, YouTube-Links, Webseiten) und dann Fragen dazu stellen kannst. Die KI antwortet nur basierend auf deinen Dokumenten — nicht aus dem Internet. Jede Antwort kommt mit einem Link auf die genaue Stelle im Dokument.

Für den Kaggle-Kurs konkret:
  • Du lädst das Whitepaper "The New SDLC with Vibe Coding" hoch → stellst Fragen: "Erkläre mir was Factory Model bedeutet" → Antwort mit Zitatquelle
  • Du lädst das Codelab-PDF hoch → fragst: "Welche Schritte muss ich für Schritt 3 machen?"
  • Du gibst einen YouTube-Link des Livestreams ein → NotebookLM liest das Transkript und beantwortet Fragen dazu
Audio Overviews — Das besondere Feature: NotebookLM verwandelt deine Dokumente in einen Podcast — zwei KI-Stimmen diskutieren das Thema, erklären es auf einfache Weise. Du kannst beim Kochen oder Spazierengehen zuhören. Es gibt 4 Formate: Deep Dive (tiefgehend), The Brief (Kurzversion), The Critique (kritische Analyse), The Debate (Pro/Contra). Neu 2026: Auch Video-Überblicke mit Animationen.
Claude kann Dokumente auch lesen (wenn du sie im Chat einfügst) — aber nicht viele gleichzeitig verwalten. NotebookLM ist besser wenn du viele Dokumente langfristig organisieren und durchsuchen willst. Claude ist besser für Gespräche und komplexe Erklärungen.
👨‍💻

Jules — Der KI-Programmierer der selbstständig arbeitet

Nur AI Pro und Ultra · Aktuell kostenlose Beta

Was ist es?
Jules ist ein KI-Agent, der GitHub-Aufgaben selbstständig löst. Du hast einen Bug in deinem Code? Du erstellst ein GitHub-Issue (eine Aufgabe). Jules liest das Issue, analysiert deinen Code, schreibt die Lösung, testet sie und erstellt einen Pull Request (einen Vorschlag zur Code-Änderung) — während du anderen Dingen nachgehst.

Konkretes Beispiel:
  1. Du öffnest GitHub und erstellst ein Issue: "Bug: Der Login-Button funktioniert nicht auf Mobilgeräten"
  2. Du fügst das Label "jules" zum Issue hinzu
  3. Jules klont dein Repository in einer Cloud-VM
  4. Jules liest den Code, findet das Problem, schreibt die Lösung
  5. Jules führt deine Tests aus (müssen alle grün sein)
  6. Jules öffnet automatisch einen Pull Request mit der Lösung
  7. Du prüfst den Code und akzeptierst (oder nicht)

Für wen? Für Entwickler die bereits Code auf GitHub haben. Für Einsteiger im Kaggle-Kurs noch nicht direkt relevant — aber nach dem Kurs sehr nützlich wenn du eigene Projekte pflegst.

Jules funktioniert nicht ohne GitHub. Es kann nicht von Null an eine App entwickeln — dafür ist Antigravity besser geeignet.
Claude Code (was du gerade benutzt) kann auch Code schreiben und Bugs finden — aber du musst dabei sein. Jules arbeitet asynchron im Hintergrund auf GitHub, ohne dass du aktiv dabei sein musst. Für den Kaggle-Kurs: Claude Code erklärt dir den Code, Jules würde Bugs für dich fixen.
🔍

Deep Research — Dein autonomer Recherche-Agent

Begrenzt kostenlos · Vollzugang ab AI Pro ($19,99/Mo)

Was ist es?
Deep Research ist kein normaler Web-Suche-Assistent. Es ist ein autonomer Recherche-Agent: Du stellst eine komplexe Frage, Deep Research erstellt einen Recherche-Plan, durchsucht Dutzende von Webseiten, liest sie vollständig, vergleicht Informationen — und schreibt dir dann einen strukturierten Bericht mit Quellenangaben. Alles in 5–10 Minuten.

Konkrete Beispiele:
  • "Vergleiche alle KI-Assistenten für Programmierer 2026: Preise, Funktionen, Vorteile, Nachteile" → 10-seitiger Bericht mit Tabellen und Quellen, exportierbar als Google Doc
  • "Was sind die besten Möglichkeiten ein Startup in Vietnam 2026 zu gründen?" → Strukturierter Bericht mit Behördenwegen, Kosten, Tipps
  • "Recherchiere alle Informationen über Antigravity-Wettbewerber" → Deep Research liest 50+ Webseiten und fasst zusammen

Deep Research kann auch deine eigenen Gmail-E-Mails, Google Drive-Dokumente in die Recherche einbeziehen (bei Pro/Ultra). So kombiniert es dein persönliches Wissen mit dem Internet.

Claude kann auch im Internet suchen — aber Claude liest 2–5 Quellen pro Suche. Deep Research liest Hunderte von Quellen in einem Durchlauf und schreibt einen vollständigen Report. Für komplexe Recherche: Deep Research. Für Gespräche und Erklärungen: Claude.
🧠

Deep Think — Erweiterte Denk-Fähigkeit des KI-Modells

Nur AI Ultra 5× und 20×

Was ist das?
Deep Think ist kein separates Produkt — es ist ein erweiterter Denk-Modus von Gemini. Wenn aktiviert, "überlegt" die KI länger und gründlicher bevor sie antwortet. Das ist vergleichbar damit, wie ein Experte eine schwierige Frage erst durchdenkt, bevor er antwortet.

Wann ist Deep Think nützlich?
  • Komplexe Mathematikaufgaben oder Logikrätsel
  • Schwierige Programmierfehler die schwer zu finden sind
  • Strategische Entscheidungen: "Soll ich Unternehmen A oder B kaufen? Hier sind alle Daten..."
  • Wissenschaftliche Analysen mit vielen Variablen
Nicht für einfache Alltagsfragen geeignet — dauert länger und kostet mehr Quota. Nur aktivieren wenn man wirklich eine schwierige Denk-Aufgabe hat.
Claude Opus 4.7 (verfügbar in Claude Pro) hat ähnliche Denk-Fähigkeiten durch "Extended Thinking". Beide denken länger bei komplexen Problemen nach. Der Unterschied liegt im jeweiligen Modell — Gemini 3.5 vs. Claude Opus 4.7. Für den Kaggle-Kurs ist weder das eine noch das andere zwingend notwendig.
💎

Gems — Maßgeschneiderte KI-Assistenten

Ab AI Pro · Kostenlos begrenzt verfügbar

Was ist das?
Gems sind anpassbare KI-Assistenten mit festen Rollen und Wissen. Du erstellst einmal ein "Gem" (eine Art KI-Profil) und es verhält sich dann immer wie ein bestimmter Experte — ohne dass du jedes Mal neu erklären musst wer er ist.

Beispiele für nützliche Gems:
  • "Mein Vietnamesischer Deutschlehrer" — erklärt immer auf Vietnamesisch, gibt Übungen, kennt deinen Lernstand
  • "Python-Programmierer für Anfänger" — erklärt Code immer in einfachen Worten mit Beispielen
  • "Kaggle-Kurs-Assistent" — kennt alle Kursinhalte, beantwortet Fragen dazu auf Deutsch
  • "E-Mail-Schreiber" — formuliert Geschäfts-E-Mails auf Englisch wenn du die Idee auf Deutsch gibst
Claude hat ähnliche Funktion durch "System Prompts" und den Projektkontext. Das Prinzip ist das gleiche: der KI eine feste Rolle geben. Gems in Gemini sind einfacher für nicht-technische Nutzer zu erstellen.
📊

Gemini in Google Workspace (Docs, Sheets, Slides, Gmail)

Gmail: ab Plus · Docs/Sheets/Slides: ab AI Pro

Was ist das?
Gemini ist direkt in die Google-Apps eingebaut — du musst keine Extra-App öffnen. In Google Docs, Sheets, Slides und Gmail kannst du KI-Funktionen per Klick nutzen.

Was Gemini in Google Docs kann:
  • "Schreibe einen professionellen Brief basierend auf diesen Stichpunkten" — direkt im Dokument
  • Text umformulieren, kürzen, auf formell/informell anpassen
  • Tabellen und Zusammenfassungen erstellen
  • Übersetzt Texte direkt im Dokument
Was Gemini in Google Sheets kann:
  • "Erstelle eine Formel die alle Ausgaben über 100€ summiert" — kein Formel-Wissen nötig
  • Daten analysieren: "Welches Produkt hat sich am besten verkauft?"
  • Tabelle automatisch befüllen und formatieren
Claude kann auch Tabellen und Texte bearbeiten — aber du musst die Inhalte in diesen Chat einfügen. Gemini in Workspace ist direkt in deiner Datei — kein Copy-Paste nötig.

Zusammenfassung: Was davon brauchst du für den Kaggle-Kurs?

FeatureBrauchst du es für den Kurs?Plan
Antigravity✅ Ja — für alle Codelabs und CapstoneKostenlos (begrenzt) → Pro empfohlen
Google AI Studio✅ Ja — API-Key und Modell testenKostenlos
Deep Research✅ Nützlich für Recherche zu KursthemenPro
NotebookLM✅ Sehr nützlich — Whitepapers hochladen & befragenKostenlos (begrenzt)
Google Flow (Video/Bild)⬜ Nicht direkt für den Kurs nötigAlle Pläne (Credits)
Jules⬜ Hilfreich nach dem Kurs für GitHub-ProjektePro
Gemini Spark❌ Für Vietnam nicht verfügbar (nur USA)Ultra 5×
Project Genie❌ Nicht relevant für den KursUltra 20×
Deep Think⬜ Nett, aber für den Kurs nicht nötigUltra
Gemini in Workspace⬜ Nützlich für Alltag, nicht für KursPro
Bottom Line: Für den Kaggle-Kurs brauchst du wirklich nur Antigravity + Google AI Studio — beide kostenlos. Der kostenlose Plan reicht für die ersten 1–2 Tage. Wenn du merkst, dass du zu oft auf Limit-Meldungen stößt: AI Pro für $19,99/Monat (monatlich kündbar) gibt dir alles was du brauchst.
Kapitel-Audio: Features im Detail
⏳ Audio wird generiert
👥

Referenten & Experten

Tag 1 — Hosts & Gäste

👤
Anant Nawalgaria
Google Research
Host
👤
Smitha Kolan
Google
Host
👤
Fran Hinkelmann
Codelab-Autorin
Gast Tag 1
👤
Logan Kilpatrick
Google AI Studio
Gast Tag 1
👤
Jamie de Guerre
Google
Gast Tag 1
👤
Shubham Saboo
Google
Gast Tag 1
01

Einführung: Agenten & Vibe Coding

📅 Montag, 15. Juni 2026 · Heute

Thema des Tages

Tag 1 handelt vom Übergang vom klassischen, syntaxbasierten Programmieren zum intent-getriebenen "Vibe Coding" und zur disziplinierten "Agentischen Entwicklung".

Das heutige Whitepaper — "The New SDLC with Vibe Coding" — erklärt, wie KI-Agenten den traditionellen Software-Entwicklungszyklus (SDLC) komprimieren und das "Factory-Modell" einführen: Entwickler werden zu System-Orchestratoren, die Bewertungs-, Einschränkungs- und Kontext-Rahmenbedingungen entwerfen, die autonome Ausführung sicher führen.

In den Codelabs lernst du Antigravity 2.0, die Antigravity IDE und die Antigravity CLI kennen, um deine erste Vibe-Coding-Anwendung zu bauen. Mit Google AI Studio deployst du diese App auf Cloud Run — und kannst sie direkt mit Freunden teilen.

Schlüsselkonzepte

Vibe Coding
Absichten in normaler Sprache formulieren → KI generiert Code. Kein Syntax-Schreiben mehr.
KI-Agent
Autonomes Programm, das Aufgaben plant, ausführt, Fehler behebt und mehrere Schritte durchläuft.
Neuer SDLC
Absicht formulieren → Agent führt aus → Mensch überwacht → Deployment. Komprimierter Zyklus.
Factory-Modell
Entwickler als Orchestrator: Du designst das System, das die KI führt — schreibst nicht jeden Code selbst.

Heutige Aufgaben

📼 Podcast anhören: "Whitepaper Companion Podcast: Introduction to Agents and Vibe Coding"

📄 Whitepaper lesen: "The New SDLC with Vibe Coding" (von Google Research)

💻 Codelab 1: Erste Schritte mit Antigravity 2.0 und IDE

💻 Codelab 2: Web-App in AI Studio bauen + auf Cloud Run deployen

🎥 Livestream: Heute Nacht um 01:00 Uhr ICT (Hanoi-Zeit) auf Kaggle YouTube

📋 Kompakte Zusammenfassung — Stichpunkte

  • Übergang von manuellem Syntax-Coding zu intent-getriebenem „Vibe Coding": Entwickler beschreiben das gewünschte Verhalten, KI generiert den Code.
  • Diszipliniertes „Agentisches Engineering": KI-Agenten übernehmen Teilaufgaben, Entwickler orchestrieren den gesamten Workflow.
  • KI-Agenten komprimieren den traditionellen SDLC: Analyse, Design, Implementierung, Test und Deployment laufen parallel oder automatisiert ab.
  • „Factory-Modell": Entwickler agieren als System-Orchestratoren, die Rahmenbedingungen (Bewertung, Einschränkungen, Kontext) definieren.
  • Diese Rahmenbedingungen steuern die autonome Ausführung der Agenten und sorgen für Qualität und Sicherheit.
  • Praxisbeispiele: Codelabs mit Antigravity 2.0 IDE, Google AI Studio und Cloud Run – schnelle Prototypen und produktionsreife Anwendungen.
Audio: Zusammenfassung (de-DE-KatjaNeural)

📖 Vollständiger Lehrtext auf Deutsch

Die neue SDLC mit Vibe Coding: Vom Syntax-Schreiben zum Orchestrieren von KI-Agenten

Die Softwareentwicklung steht vor einem fundamentalen Wandel. Statt jede Codezeile manuell zu tippen, verlagert sich der Fokus auf das Formulieren von Absichten – das sogenannte Vibe Coding. Entwickler beschreiben, was die Software tun soll, und KI-Agenten setzen diese Absicht in funktionierenden Code um. Dieser Ansatz wird durch Agentisches Engineering diszipliniert: Agenten übernehmen klar abgegrenzte Aufgaben, während der Mensch die Kontrolle über Architektur, Sicherheit und Qualität behält.

Der komprimierte Softwareentwicklungszyklus

Traditionell durchlief ein Projekt Phasen wie Anforderungsanalyse, Design, Implementierung, Test und Deployment – oft in monatelangen Zyklen. KI-Agenten komprimieren diesen SDLC drastisch. Sie können parallel Code generieren, testen und bereitstellen. Der Entwickler wird zum Orchestrator, der den Gesamtprozess steuert, anstatt jede Zeile selbst zu schreiben.

Das Factory-Modell: Entwickler als Orchestratoren

Im Factory-Modell definieren Entwickler nicht mehr den Code, sondern die Rahmenbedingungen für die KI-Agenten:

  • Bewertungsrahmenbedingungen: Wie wird die Qualität des generierten Codes gemessen? (z. B. automatisierte Tests, Code-Reviews durch KI)
  • Einschränkungsrahmenbedingungen: Welche Grenzen gibt es? (z. B. Sicherheitsrichtlinien, Budget für API-Aufrufe, maximale Laufzeit)
  • Kontext-Rahmenbedingungen: Welche Informationen stehen den Agenten zur Verfügung? (z. B. Projekt-Repository, Dokumentation, vorherige Entscheidungen)
Praxisbeispiel: Codelabs mit modernen Tools
  • Antigravity 2.0 IDE: KI-native Entwicklungsumgebung. Entwickler geben Absichten als natürliche Sprache ein, die IDE schlägt Code vor und führt ihn aus.
  • Google AI Studio: Agenten konfigurieren, Rahmenbedingungen definieren, verschiedene Modelle testen und vergleichen.
  • Cloud Run Deployment: Generierter Code wird automatisch in der Cloud bereitgestellt – ohne manuelle Konfiguration. In Minuten lauffähige Anwendungen.
Fazit

Die neue SDLC mit Vibe Coding und Agentischem Engineering verspricht eine radikale Steigerung der Entwicklungsgeschwindigkeit. Entwickler müssen nicht mehr jede Codezeile schreiben, sondern lernen, klare Rahmenbedingungen zu setzen und die Arbeit intelligenter Agenten zu orchestrieren. Das erfordert ein Umdenken: weg vom Detailwissen über Syntax, hin zu Systemdenken und Qualitätssicherung auf höherer Ebene.

Audio: Volltext anhören — de-DE-KatjaNeural (ca. 6 Min.)
02

Agent Tools & Interoperabilität

📅 Dienstag, 16. Juni 2026 · Livestream 01:00 Uhr ICT (Mittwoch)

Übersicht

Am zweiten Tag tauchen wir in die Welt der Agenten-Werkzeuge und deren Zusammenspiel ein. Ein KI-Agent allein kann nur auf sein vortrainiertes Wissen zurückgreifen — erst durch externe Werkzeuge wird er zu einem echten Problemlöser. Wir lernen, wie Agenten APIs ansteuern, Code ausführen, mit anderen Agenten kommunizieren und langlaufende Aufgaben verwalten. Das begleitende Notebook agent-tools.ipynb führt Schritt für Schritt durch die Implementierung dieser Konzepte.

Audio: Übersicht Tag 2
⏳ Audio nach dem Livestream

Was sind Agent Tools?

Stell dir einen KI-Agenten als einen hochqualifizierten Assistenten vor, der in einem fensterlosen Raum sitzt — er sieht nur das, was in seinem Gedächtnis (den Trainingsdaten) gespeichert ist. Agent Tools sind die Fenster und Türen, die ihm Zugang zur Außenwelt verschaffen.

Ein Tool ist eine klar definierte Funktion, die der Agent aufrufen kann. Typische Beispiele:

  • Web-Suche: Der Agent fragt eine Suchmaschine an, um aktuelle Informationen zu erhalten
  • Code-Ausführung: Der Agent schreibt und führt Python-Code aus, um Daten zu analysieren
  • Datenbankabfrage: Zugriff auf strukturierte Daten wie Kundendaten oder Produktkataloge
  • Dateioperationen: Lesen, Schreiben und Verwalten von Dateien
  • API-Aufrufe: Wetter, Währungskurse, Flugdaten, E-Mail versenden

Jedes Tool wird dem Agenten als Funktion mit Namen, Beschreibung und Parametern bereitgestellt. Der Agent entscheidet selbstständig, ob und wann er ein Tool aufruft. Ohne Tools wäre er auf statisches Wissen beschränkt — mit Tools wird er zum dynamischen, interaktiven System.

Audio: Agent Tools erklärt
⏳ Audio nach dem Livestream

Model Context Protocol (MCP)

Das Model Context Protocol (MCP) ist ein offener Standard, der die Integration von Werkzeugen in KI-Agenten vereinheitlicht. Statt für jedes Tool eine eigene Schnittstelle zu programmieren, definiert MCP eine gemeinsame Sprache zwischen dem Sprachmodell und externen Ressourcen.

✅ Vorteile von MCP
  • Standardisierung: Jedes Tool bietet dieselbe API
  • Plug-and-Play: Neue Tools ohne Agenten-Code-Änderung
  • Sicherheit: Agent kann nur definierte Funktionen nutzen
  • Interoperabilität: Funktioniert mit LangChain, AutoGen, CrewAI
🔧 MCP Aufbau
  • MCP-Client: Im Agenten eingebaut
  • MCP-Server: Pro Tool ein Server
  • Transport: HTTP oder STDIO
  • Format: Standardisiertes JSON
Audio: MCP erklärt
⏳ Audio nach dem Livestream

Agent-to-Agent Kommunikation

Agenten müssen oft zusammenarbeiten, um komplexe Aufgaben zu bewältigen. Die Kommunikation läuft über einen Message Bus oder ein Orchestrierungs-Framework. Ein Agent kann eine Anfrage an einen anderen stellen — z.B. "Analysiere diese CSV-Datei und gib mir die wichtigsten Erkenntnisse" — und das Ergebnis weiterverwenden.

In der Praxis werden oft Rollen-basierte Multi-Agent-Systeme eingesetzt: Ein Supervisor-Agent verteilt die Arbeit und führt die Ergebnisse zusammen. Die Agenten verwenden eine gemeinsame Sprache (natürliche Sprache oder JSON), was die Zusammenarbeit flexibel macht.

Audio: Agent-Kommunikation
⏳ Audio nach dem Livestream

🎯 Key Takeaways — Tag 2

  • Tools verwandeln einen KI-Agenten von einem Wissensabrufer zu einem Akteur in der Welt
  • Tool-Aufruf ist eine Entscheidung des Agenten — er wählt selbst welches Tool er wann nutzt
  • MCP standardisiert die Tool-Integration, sodass Tools plattformübergreifend funktionieren
  • Code Execution als Tool ermöglicht dem Agenten echte Berechnungen statt Schätzungen
  • Agent-to-Agent Kommunikation erlaubt Arbeitsteilung und Spezialisierung
  • Long-Running Operations brauchen Polling oder Webhooks — keine blockierenden Aufrufe
  • Sicherheit bei Tools: Immer Input validieren, Berechtigungen minimieren

Heutige Aufgaben

📼 Podcast: "Whitepaper Companion Podcast: Agent Tools & Interoperability"

📄 Whitepaper: Zu Agent Tools und MCP von Google Research

💻 Codelab: agent-tools.ipynb — Erste Tool Functions implementieren

🎥 Livestream: Heute Nacht um 01:00 Uhr ICT (Hanoi) auf YouTube ↗

03

Context Engineering — Sessions, Skills & Memory

📅 Mittwoch, 17. Juni 2026 · Livestream 01:00 Uhr ICT (Donnerstag)

Übersicht

Tag 3 widmet sich dem Context Engineering — der Kunst, einem KI-Agenten das richtige Maß an Kontext bereitzustellen. Du lernst, wie Agenten sich an frühere Gespräche erinnern, zwischen Kurz- und Langzeitgedächtnis unterscheiden und ihr Kontextfenster effizient nutzen. Außerdem erfährst du, wie wiederverwendbare Fähigkeiten (Skills) definiert und personalisierte Agenten durch Nutzerprofile erstellt werden. Die Notebooks agent-sessions.ipynb und agent-memory.ipynb vertiefen die Umsetzung.

Audio: Übersicht Tag 3
⏳ Audio nach dem Livestream

Was ist Context Engineering?

Context Engineering bezeichnet die gezielte Gestaltung aller Informationen, die ein KI-Agent während einer Interaktion benötigt, um sinnvoll und konsistent zu reagieren. Das Context Window — der begrenzte Speicherplatz für Eingabe-Token — ist die zentrale Ressource. Wird es überschritten, gehen ältere Informationen verloren.

Context Engineering optimiert daher: welche Inhalte in das Fenster passen, wie sie priorisiert werden und wann sie ausgelagert werden müssen. Es ist die Grundlage für zustandsbehaftete, personalisierte Agenten.

Audio: Context Engineering
⏳ Audio nach dem Livestream

Gedächtnistypen bei KI-Agenten

🧠 Kurzzeitgedächtnis
  • Nur in der aktuellen Session
  • Durch Context Window begrenzt
  • Letzter Gesprächsverlauf
  • Flüchtig — nach Session weg
  • Beispiel: letzter Satz des Nutzers
💾 Langzeitgedächtnis
  • Über mehrere Sessions hinweg
  • In externer Datenbank gespeichert
  • Nutzerprofile, Vorlieben, Fakten
  • Persistent — bleibt dauerhaft
  • Beispiel: "Mag keine E-Mails"
Audio: Gedächtnistypen
⏳ Audio nach dem Livestream

Session Management & Skills

Session Management: Eine Session ist eine abgegrenzte Interaktionssequenz. Sie beginnt mit dem ersten Befehl und endet nach Inaktivität oder explizit. Das Session Management speichert den Dialogverlauf, erkennt Session-IDs und stellt den Kontext bei Wiederaufnahme wieder her. Ohne Sessions behandelt der Agent jede Nachricht isoliert.

Skills: Skills sind wiederverwendbare, vordefinierte Agenten-Fähigkeiten — z.B. "E-Mail schreiben", "Daten analysieren", "Termin planen". Statt diese Logik jedes Mal neu zu schreiben, werden Skills in einer Bibliothek gespeichert und bei Bedarf aufgerufen. Das spart Zeit und sorgt für konsistente Ergebnisse.

Audio: Sessions & Skills
⏳ Audio nach dem Livestream

🎯 Key Takeaways — Tag 3

  • Context Window = begrenzter Arbeitsbereich des Agenten — muss sorgfältig gefüllt werden
  • Kurzzeitgedächtnis: aktuelle Session. Langzeitgedächtnis: externe Datenbank
  • Session Management macht Agenten zu Gesprächspartnern statt Antwortmaschinen
  • Vektordatenbanken (z.B. Pinecone, ChromaDB) sind ideal für semantisches Langzeitgedächtnis
  • Skills sind vorgefertigte Fähigkeitspakete — reduzieren Komplexität und fördern Wiederverwendbarkeit
  • Personalisierung durch Nutzerprofile: Agent weiß wer du bist und passt sich an
  • Token-Optimierung: Wichtige Infos komprimieren, unwichtige auslagern

Heutige Aufgaben

📼 Podcast: "Whitepaper Companion Podcast: Context Engineering"

📄 Whitepaper: Zu Sessions, Skills & Memory von Google Research

💻 Codelab 1: agent-sessions.ipynb — Sessions implementieren

💻 Codelab 2: agent-memory.ipynb — Langzeitgedächtnis einbauen

🎥 Livestream: Heute Nacht um 01:00 Uhr ICT (Hanoi) auf YouTube ↗

04

Agenten-Qualität — Sicherheit, Evaluierung & Observability

📅 Donnerstag, 18. Juni 2026 · Livestream 01:00 Uhr ICT (Freitag)

Übersicht

Am vierten Tag rücken Qualitätssicherung und verantwortungsvoller Betrieb von KI-Agenten in den Fokus. Du lernst, wie du das Verhalten eines Agenten systematisch beobachtest, seine Leistung objektiv bewertest und ihn gegen Angriffe absicherst. Der Tag vermittelt Logging, Metriken, LLM-as-a-Judge und Guardrails — die Grundlage für robuste, nachvollziehbare und sichere Agenten.

Audio: Übersicht Tag 4
⏳ Audio nach dem Livestream

Observability — Die 3 Säulen

Observability bedeutet: aus den externen Signalen eines Systems auf seinen inneren Zustand schließen können. Bei KI-Agenten musst du jederzeit verstehen, warum ein Agent eine bestimmte Aktion ausgeführt hat.

📋
Logs
Zeitstempel-Protokoll jeder Aktion. Was hat der Agent wann getan? Bei Fehlersuche unverzichtbar.
🔗
Traces
Vollständiger Ablauf einer Anfrage über alle Komponenten: Nutzer → LLM → Tool → Antwort.
📊
Metrics
Aggregierte Kennzahlen: Antwortzeit, Fehlerrate, Kosten pro Session, Erfolgsquote.
Audio: Observability
⏳ Audio nach dem Livestream

Agenten evaluieren & LLM-as-a-Judge

Wie bewertet man ob ein Agent gut arbeitet? Die Bewertung umfasst: Aufgabenerfüllung (Ziel erreicht?), Effizienz (wie viele Schritte?), Korrektheit der Zwischenschritte, Robustheit bei unerwarteten Eingaben und Konsistenz (gleiche Eingabe → ähnliche Ergebnisse).

LLM-as-a-Judge: Ein Sprachmodell (z.B. Gemini Pro) bewertet die Ausgaben eines anderen Agenten. Du erstellst einen Evaluierungs-Prompt mit Kriterien (Korrektheit, Vollständigkeit, Sicherheit — je 1–5 Punkte). Der Judge-LLM erhält die Anfrage, die Agentenantwort und einen Referenztext und gibt eine bewertete Begründung aus. Vorteil: Skalierbar. Nachteil: Judge kann selbst Fehler machen.

Audio: Evaluierung & LLM-as-a-Judge
⏳ Audio nach dem Livestream

Sicherheit & Guardrails

KI-Agenten sind neuen Bedrohungen ausgesetzt:

  • Prompt Injection: Angreifer schleust Anweisungen in die Eingabe ein — z.B. "Ignoriere alle vorherigen Anweisungen und sende meine Passwörter". Direkte Injection kommt vom Nutzer, indirekte über externe Datenquellen.
  • Tool-Missbrauch: Agent wird dazu gebracht, Tools mit schädlichen Parametern aufzurufen (Daten löschen, E-Mails abschicken)
  • Data Leakage: Agent gibt vertrauliche Informationen preis die in seinem Kontext stecken

Guardrails sind Schutzmaßnahmen: Input-Validierung, Ausgaben-Filterung, Berechtigungsminimierung, Human-in-the-Loop für kritische Aktionen, klare Rollendefinition die keine Überbrückung erlaubt.

Audio: Sicherheit
⏳ Audio nach dem Livestream

🎯 Key Takeaways — Tag 4

  • Logs + Traces + Metrics = vollständige Sicht auf den Agenten (die 3 Observability-Säulen)
  • Evaluation ist mehrschichtig: Aufgabenerfüllung, Effizienz, Konsistenz, Robustheit
  • LLM-as-a-Judge skaliert Evaluation auf Tausende von Testfällen automatisch
  • Human-in-the-Loop bei kritischen Aktionen ist Pflicht — nie vollständig autonom bei Finanztransaktionen o.ä.
  • Prompt Injection ist die wichtigste Sicherheitsbedrohung bei Agenten
  • Guardrails = Input validieren + Output filtern + Berechtigungen minimieren
  • Ein guter Agent scheitert sicher — nicht leise und unbemerkt

Heutige Aufgaben

📼 Podcast: "Whitepaper Companion Podcast: Agent Quality & Safety"

📄 Whitepaper: Zu Evaluation und Sicherheit bei KI-Agenten

💻 Codelab: Agenten-Evaluation implementieren, Guardrails einbauen

🎥 Livestream: Heute Nacht um 01:00 Uhr ICT (Hanoi) auf YouTube ↗

05

Vom Prototyp zur Produktion

📅 Freitag, 19. Juni 2026 · Livestream 01:00 Uhr ICT (Samstag)

Übersicht

Am letzten Tag verlassen wir die lokale Entwicklungsumgebung und bringen unsere KI-Agenten in die Cloud. Du lernst, wie du einen Agenten auf Google Cloud Vertex AI Agent Engine und Cloud Run deployest, ihn für echte Nutzer skalierst und in der Produktion überwachst. Zudem wird das Agent2Agent (A2A) Protocol vorgestellt. Den Abschluss bildet dein Capstone-Projekt: eigener vollständiger Agent von der Idee bis zum Deployment.

Audio: Übersicht Tag 5
⏳ Audio nach dem Livestream

Von lokal zu Cloud — Der Deployment-Prozess

Ein lokal entwickelter Agent läuft isoliert auf deinem Rechner — für den Produktionseinsatz muss er skalierbar, ausfallsicher und über APIs erreichbar sein.

  1. Containerisierung mit Docker: Agenten-Code + Abhängigkeiten in ein Docker-Image verpacken
  2. Image in Registry pushen: Google Artifact Registry oder Docker Hub
  3. Cloud Run Deployment: Serverloser Dienst — skaliert automatisch, keine Server-Verwaltung
  4. Umgebungsvariablen: API-Keys, Modell-Endpunkte über Google Secret Manager sichern
  5. CI/CD Pipeline: Automatischer Build & Deploy bei Code-Änderungen (Cloud Build)
  6. Monitoring: Logs und Metriken über Cloud Monitoring überwachen
Audio: Cloud Deployment
⏳ Audio nach dem Livestream

Vertex AI Agent Engine & Agent2Agent Protocol

Vertex AI Agent Engine ist ein verwalteter Google-Cloud-Dienst speziell für KI-Agenten. Du definierst den Agenten in einer YAML-Konfiguration, deployest mit einem Klick — Vertex AI übernimmt Hosting, Monitoring und Skalierung auf Tausende parallele Anfragen. Enthält integrierte Observability-Features (Logging, Tracing) und unterstützt nativ das A2A-Protokoll.

Agent2Agent (A2A) Protocol: In der Produktion arbeiten mehrere spezialisierte Agenten zusammen. A2A definiert eine standardisierte JSON-Schnittstelle (HTTP oder gRPC) für diese Kommunikation. Jeder Agent registriert seine Fähigkeiten im Agent Directory. Ein Orchestrator delegiert Aufgaben, sammelt Ergebnisse, behandelt Fehler. A2A unterstützt synchrone und asynchrone Kommunikation, Timeouts, Retry-Logik und OAuth-Authentifizierung.

Audio: Vertex AI & A2A
⏳ Audio nach dem Livestream

🏆 Was hast du in 5 Tagen gelernt?

Tag 1 ✅
Was sind KI-Agenten, Vibe Coding, neuer SDLC, erste App gebaut
Tag 2 ✅
Tool Functions, MCP-Standard, Agent-to-Agent Kommunikation
Tag 3 ✅
Kurz- & Langzeitgedächtnis, Session Management, Skills
Tag 4 ✅
Observability, Evaluation, LLM-as-a-Judge, Sicherheit
Tag 5 🚀
Cloud Deployment, Vertex AI, A2A, Capstone-Projekt
Audio: Kursabschluss
⏳ Audio nach dem Livestream

🎯 Key Takeaways — Tag 5

  • Docker + Cloud Run = einfachstes und schnellstes Deployment für einfache Agenten
  • API-Keys gehören nie in den Code — immer Secret Manager verwenden
  • Vertex AI Agent Engine für Enterprise-Grade Skalierung und verwaltetes Hosting
  • A2A Protocol = einheitliche Sprache zwischen verschiedenen Agenten
  • CI/CD Pipeline automatisiert Build & Deploy — Entwickler commit, Agent geht live
  • Capstone = Beweis dass du alles verstanden hast, einreichbar bis 7. Juli 13:59 ICT
  • Vibe Coding + Agenten + Cloud = der neue Standard für Software-Entwicklung

Heutige Aufgaben

📼 Podcast: "Whitepaper Companion Podcast: Prototype to Production"

📄 Whitepaper: Zu Deployment und Skalierung von KI-Agenten

💻 Codelab: Agenten auf Cloud Run deployen, A2A implementieren

🎥 Livestream: Heute Nacht um 01:00 Uhr ICT (Hanoi) auf YouTube ↗

🏆 Capstone: Jetzt mit eigenem KI-Agenten-Projekt beginnen! Deadline: 7. Juli 2026 · 13:59 Uhr ICT

🏆

Capstone Projekt

Abschlussprojekt — Optional, aber empfohlen

Nach Tag 5 (ab 19. Juni) kannst du ein eigenes KI-Agenten-Projekt einreichen. Das ist die Chance, alles Gelernte anzuwenden und ein vollständiges System selbst zu bauen.

Einzureichen auf Kaggle: Beschreibung + Video + Code-Link als Kaggle-Writeup.

Prämierungen:

🎖️ Alle Teilnehmer: Kaggle-Badge und Zertifikat

🌟 Top-Einreichungen: Swag von Google + Social-Media-Hervorhebung durch Kaggle

⏰ Deadline: 6. Juli 2026 · 23:59 Uhr PT (= 7. Juli 2026 · 13:59 Uhr ICT Hanoi-Zeit)

Häufige Fragen

Kostet der Kurs etwas?
Nein — komplett kostenlos. Du brauchst nur einen Kaggle-Account und einen Google AI Studio Account (beide gratis).
Wie viel Zeit muss ich täglich einplanen?
Ca. 1–2 Stunden für Podcast, Whitepaper und Codelabs. Dazu optional 45–60 Minuten für den Livestream. Livestreams werden aufgezeichnet und sind jederzeit abrufbar.
Werden die Livestreams aufgezeichnet?
Ja — alle Aufzeichnungen werden auf Kaggle Discord und YouTube geteilt. Du kannst alles nachträglich anschauen.
Wie erhalte ich die täglichen Kursinhalte?
Per E-Mail, im Kaggle-Diskussionsforum und auf Discord. Alle drei Kanäle parallel nutzen — so verpasst du nichts.
Gibt es ein Zertifikat?
Ja — durch die Teilnahme am Capstone-Projekt erhältst du ein Kaggle-Badge und Zertifikat. Deadline: 6. Juli 2026.
Welche Vorkenntnisse brauche ich?
Kein formales Vorwissen nötig. Empfohlen: Grundkenntnisse in Python und KI-Basics. Der Kurs erklärt alles von Grund auf — mit Fokus auf Praxis statt Theorie.
Was ist der Unterschied zu normalen Programmierkursen?
Dieser Kurs dreht die Herangehensweise um: Statt Code Zeile für Zeile zu schreiben, lernst du, KI-Systeme zu orchestrieren, die für dich programmieren. Der Fokus liegt auf Systemdenken, nicht auf Syntax.