Wird geschmiedet...
Wird geschmiedet...
Frag den KI-Schmied — direkt in deinem Browser, ohne Cloud, ohne Datenweitergabe. Angetrieben von WebGPU und einem lokalen Sprachmodell.
Das Modell läuft lokal auf deinem Gerät. Kein einziges Zeichen verlässt deinen Browser.
Nutzt deine GPU für schnelle Inferenz — typisch 10–30 Token/s auf moderner Hardware.
Das Modell (~0.7 GB) wird nach dem ersten Download im Browser-Cache gespeichert.
Stelle eine Frage zu KI, unseren Leistungen oder Preisen. Bei unterstütztem Browser läuft alles lokal.
KI-Demo wird geladen…
Wie funktioniert das?
Diese Demo nutzt die WebGPU-API deines Browsers und das Open-Source-Modell Llama-3.2-1B-Instruct (quantisiert, ~0.7 GB). Das Modell wird einmalig von HuggingFace in den Browser-Cache geladen. Danach laufen alle Anfragen ohne Internetverbindung.
Unterstützte Browser: Chrome 113+, Edge 113+, Opera. Firefox und Safari unterstützen WebGPU noch nicht — dort wird transparent unser Schweizer Server genutzt.
Beeindruckt? Wir schmieden genau solche Lösungen für dein Unternehmen.