huecki

huecki

Software, AI agents, messy notes and the occasional useful idea.

Blog lesen GitHub LinkedIn

Currently on the bench

Aktuell baue ich: Agent Buildprint

Agent Buildprint ist mein aktuelles Hauptprojekt: ausführbare Verträge für Coding Agents — mit Phase-Flow, Evidence Ledger, Review-Schleifen und Replay-Gates statt nur Prompt + Spec.

ACTIVE BUILD phase-flow replay + evidence honesty

Agent Buildprint

Agenten starten nicht mehr mit einem vagen Auftrag. Sie bootstrappen ein selected-buildprint Paket, lesen die Phase-Flow-Verfassung, schreiben schema-valide Laufzeitbelege und dürfen Blocker nicht als Erfolg verkaufen.

$ agb start
→ phase before code
→ evidence before trust
→ replay before done

PHASE-FLOWEVIDENCEREVIEWSREPLAY

Buildprint Registry öffnen →

AI Native Engineering

Vom Prompt-Schreiber zum AI-System-Builder.

Ein selbstgeführter Lernpfad für Entwickler:innen, die AI-Features nicht nur demoen, sondern betreiben wollen — mit Kontextbudgets, Task Contracts, Dekomposition, Evals und Fallbacks.

01

Tokens & Attention

Kontextfenster, Positionseffekte und lost-in-the-middle als echte Architekturgrenzen.

02

Context Engineering

Task Contracts, Schemas und Quellenregeln statt längerer Prompts.

03

Agentic Delivery

Evals, Traces, Tool-Gates und Incident Playbooks für betreibbare AI-Features.

68 slides · self-paced · interactive

Becoming LLM-Native

Öffnet den kompletten Lernpfad mit interaktivem Slide Deck, Kontextmodellen, Task Contracts und operablen AI-Feature-Patterns.

AI Native Engineering öffnen →

2. Juli 2026 · AI-first Engineering

Simple Graph-RAG halbiert Halluzinationen – ohne komplexes Knowledge Graph Schema

Vector-RAG + einfacher Document-Graph halbiert Halluzinationen auf komplexen QA-Aufgaben im MoNaCo-Benchmark. Die Erkenntnis: Man braucht kein komplexes Knowledge Graph Schema – nur strukturierte Navigation über Dokumente.

Artikel lesen →

1. Juli 2026 · AI-first Engineering

Von 'Prompt-Klappern' zu Prompt-Debugging

Prompt-Optimierung ist kein Suchproblem mehr — es ist ein Debugging-Problem. Contrastive Reflection liefert das Framework, um Fehler gezielt zu fangen, statt blind zu raten.

Artikel lesen →

22. Juni 2026 · AI Agent Workflows

Teste deine Coding-Agent-Instruktionen wie Code

Eine gute AGENTS.md ist kein Prompt-Dokument, das man einmal schreibt. Sie ist ein kleines Betriebshandbuch fuer den Agenten. Und Betriebshandbuecher werden besser, wenn man sie gegen konkrete Fehler testet.

Artikel lesen →

16. Juni 2026 · AI-first Engineering

Automatisch generierte Agent Skills brauchen eine Supply Chain

Das OpenClaw-Skill-Paper ist ein starkes Signal: Agent Skills werden nicht nur manuell geschrieben, sondern aus Trajektorien, Skill-Bäumen und Transfer-Evals gelernt. Aber genau das macht eine Skill-Supply-Chain wichtiger, nicht unwichtiger.

Artikel lesen →

15. Juni 2026 · AI-first Engineering

Dein Coding Agent braucht eine Verfassung und ein Logbuch

Coding Agents werden nicht nur durch bessere Modelle nützlich. Teams brauchen eine kleine Verfassung für Agent-Verhalten und ein kuratiertes Logbuch für Projektwissen, sonst wird Memory zu Kontext-Müll.

Artikel lesen →

9. Juni 2026 · AI-first Engineering

RAG 2026: Vergiss GraphRAG als Default

RAG wird 2026 nicht dadurch besser, dass man GraphRAG auf alles wirft. Der robuste Default ist Contextual Hybrid RAG: saubere Ingestion, BM25 plus Embeddings, Reranking, Quellenpflicht und harte Evals.

Artikel lesen →

8. Juni 2026 · AI-first Engineering

AGENTS.md ist kein Kontext. Es ist eine Steuerfläche.

Die überraschende Lektion aus AGENTS.md-Benchmarks ist nicht, dass Kontextdateien nutzlos sind. Sie verändern Agent-Verhalten, manchmal in Richtung teurerer und weniger nützlicher Arbeit. Behandle sie als Steuerfläche, nicht als Repo-Handbuch.

Artikel lesen →

7. Juni 2026 · AI-first Engineering

Agenten brauchen Runtime Contracts, nicht längere Prompts

Bessere Prompts machen Agenten nicht automatisch zuverlässig. Entwickler brauchen Runtime Contracts: explizite Verträge dafür, welche Tools ein Agent nutzen darf, was er erinnern darf, wann er stoppen muss und wie seine Behauptungen geprüft werden.

Artikel lesen →

28. Mai 2026 · AI-first Engineering

Bewerte KI-Code nicht am Diff

Besseres KI-Coding entsteht nicht primär durch bessere Prompts, sondern durch den Harness um das Modell: explizite Contracts, getrennte Builder- und Reviewer-Rollen, Belege und eine Schleife, die Fehler in bessere Spezifikationen zurückführt.

Artikel lesen →

28. Mai 2026 · AI-first Engineering

Deine KI-generierte UI braucht einen Playtester, keinen Screenshot-Review

KI-generierte Interfaces sehen oft fertig aus, bevor sie sich korrekt verhalten. Eine GUI-Playtester-Loop schickt einen separaten Browser-Agenten in die App, protokolliert Interaktionen, speichert Screenshots und Logs, macht aus kaputten Flows reproduzierbare Bug Reports und rerunnt denselben Test nach dem Fix.

Artikel lesen →

23. Mai 2026 · AI-first Engineering

Spec-Driven Context Resets für Coding-Agenten

Lange Agenten-Chats verrotten. Besser ist es, Entscheidungen in kleine Spec-Dateien zu verschieben, zwischen den Ebenen bewusst den Kontext zu resetten und jede Coding-Agent-Session nur das lesen zu lassen, was sie wirklich braucht.

Artikel lesen →

21. Mai 2026 · KI-Agent Workflows

KI-Agenten brauchen Belege, bevor sie klicken

Wenn ein Agent klickt, sendet, kauft oder Daten extrahiert, darf die entscheidende Wahrheit nicht nur aus Modell-Prosa kommen. Baue vor riskanten Tool Calls ein kleines Evidenz-Gate: Predicate, Belegtyp, Quelle, Entscheidung.

Artikel lesen →

21. Mai 2026 · KI-Agent Workflows

Hör auf, KI zum kritischen Selbstcheck zu bitten

Offene Anweisungen wie „prüf das kritisch“ belohnen das Modell ungewollt dafür, Kritik zu produzieren. Die Lösung ist nicht weniger Review, sondern kalibriertes Review: klare Kriterien, PASS_NO_CHANGE, Evidenz pro Finding, Severity-Schwellen und ein kleines Änderungsbudget.

Artikel lesen →

19. Mai 2026 · AI-first Engineering

AGENTS.md reicht nicht: Dein Coding Agent braucht einen Harness

Ein Coding Agent wird nicht durch einen magischen Prompt zuverlässig. Er braucht einen Harness: AGENTS.md, Skills, Tool-Permissions, Hooks und Evals, die merken, wenn sich sein Verhalten verschiebt.

Artikel lesen →

19. Mai 2026 · AI Agent Workflows

gib jedem Kundenprojekt einen kleinen Agenten

Der nützliche Move ist nicht ein Mega-Assistent für alle Kunden. Gib jedem Kundenprojekt einen kleinen, isolierten Agenten mit eigener Erinnerung, Aufgabenliste, Preview-URL-Gewohnheit und langweiligem Daily Standup.

Artikel lesen →

18. Mai 2026 · AI-first Engineering

Prompt Decomposition: So zerlegst du KI-Aufgaben richtig

Nach Context Engineering kommt Decomposition: Entwickler sollten nicht alles in einen Prompt stopfen, sondern Aufgaben in direkte Prompts, Subtasks, Pipelines, Agent-Loops oder Skills zerlegen.

Artikel lesen →

15. Mai 2026 · AI-first Engineering

LLM-native Entwickler brauchen mehr als gute Prompts

Die nächste Entwicklerfähigkeit ist nicht der cleverste Prompt. Es ist das Betriebssystem um LLMs herum: Datenqualität, Model-Versioning, Evals, Guardrails, Incident Response, Review-UX und Repo-Anweisungen, denen Agents wirklich folgen können.

Artikel lesen →

15. Mai 2026 · Personal AI Workflows

Sprachnachrichten sind das beste Interface für kleine Agentenjobs

Voice ist nicht gut für alles. Aber für kleine Agentenjobs ist es brutal praktisch: unterwegs eine Aufgabe diktieren, lokal transkribieren, vom bestehenden Agenten ausführen lassen und nur eine kurze Antwort zurückbekommen.

Artikel lesen →

12. Mai 2026 · AI-first Engineering

Prompting ist tot. Context zählt.

2026 geht es nicht mehr um den einen magischen Prompt. Der bessere Ansatz: Kontext wählen, Tools und Schemas definieren, Agent-Regeln setzen und mit Evals prüfen.

Artikel lesen →

11. Mai 2026 · KI-Agenten-Workflows

Hermes Agent: Self-Review statt One-Shot

Hermes wird interessant, wenn ein Agent nicht nur liefert, sondern die eigene Arbeit reviewed: ausführen, messen, kritisieren, Skill umbauen, nochmal laufen lassen. Der Nutzen entsteht vor allem bei wiederholbaren Workflows.

Artikel lesen →

29. April 2026 · AI-first Engineering

AI-first Architektur: schneller entscheiden, sauber bleiben

AI-first Architektur heißt nicht: Modell entscheidet. Es heißt: KI erzeugt Optionen, findet Risiken, verdichtet Kontext — das Team entscheidet und dokumentiert nachvollziehbar.

Artikel lesen →