WebGPU Showcase

KI, die offline denkt

Frag den KI-Schmied — direkt in deinem Browser, ohne Cloud, ohne Datenweitergabe. Angetrieben von WebGPU und einem lokalen Sprachmodell.

Vollständige Privatsphäre

Das Modell läuft lokal auf deinem Gerät. Kein einziges Zeichen verlässt deinen Browser.

WebGPU-Beschleunigung

Nutzt deine GPU für schnelle Inferenz — typisch 10–30 Token/s auf moderner Hardware.

Einmaliger Download

Das Modell (~0.7 GB) wird nach dem ersten Download im Browser-Cache gespeichert.

Frag den Schmied — offline

Dein Gespräch. Dein Gerät.

Stelle eine Frage zu KI, unseren Leistungen oder Preisen. Bei unterstütztem Browser läuft alles lokal.

KI-Demo wird geladen…

Wie funktioniert das?

Diese Demo nutzt die WebGPU-API deines Browsers und das Open-Source-Modell Llama-3.2-1B-Instruct (quantisiert, ~0.7 GB). Das Modell wird einmalig von HuggingFace in den Browser-Cache geladen. Danach laufen alle Anfragen ohne Internetverbindung.

Unterstützte Browser: Chrome 113+, Edge 113+, Opera. Firefox und Safari unterstützen WebGPU noch nicht — dort wird transparent unser Schweizer Server genutzt.

Beeindruckt? Wir schmieden genau solche Lösungen für dein Unternehmen.

Projekt konfigurieren Beratung buchen

Wird geschmiedet...