Wichtige Erkenntnisse:
- Ethereum-Mitbegründer Vitalik Buterin gab die Cloud-KI im April 2026 auf und führte Qwen3.5:35B lokal auf einem Nvidia 5090-Laptop mit 90 Token pro Sekunde aus.
- Buterin fand heraus, dass etwa 15 % der Fähigkeiten von KI-Agenten böswillige Anweisungen enthalten, und berief sich dabei auf Daten der Sicherheitsfirma Hiddenlayer.
- Sein Open-Source-Messaging-Daemon erzwingt eine Mensch-plus-LLM-2-aus-2-Bestätigungsregel für alle ausgehenden Signal- und E-Mail-Aktionen an Dritte.
Wie Vitalik Buterin ein selbstsouveränes KI-System ohne Cloud-Zugriff betreibt
Buterin beschrieben Er bezeichnete das System als „selbstsouverän/lokal/privat/sicher“ und sagte, es sei eine direkte Reaktion auf die seiner Meinung nach schwerwiegenden Sicherheits- und Datenschutzmängel, die sich überall ausbreiten Ich habe einen Agenten Raum. Er verwies auf Untersuchungen, die zeigten, dass etwa 15 % der Agentenfähigkeiten oder Plug-in-Tools böswillige Anweisungen enthalten. Sicherheitsfirma Hiddenlayer demonstriert dass das Parsen einer einzelnen bösartigen Webseite eine vollständig gefährden könnte Offene Klaue Dies ermöglicht beispielsweise das Herunterladen und Ausführen von Shell-Skripten, ohne dass der Benutzer dies bemerkt.
„Ich habe eine Geisteshaltung, in der ich große Angst davor habe, dass wir, gerade als wir mit der Mainstreaming von Ende-zu-Ende-Verschlüsselung und immer mehr Local-First-Software endlich einen Schritt vorwärts in Sachen Privatsphäre gemacht haben, kurz davor stehen, zehn Schritte zurück zu machen“, schrieb Buterin.
Seine bevorzugte Hardware ist ein Laptop, auf dem ein läuft Nvidia 5090 GPU mit 24 GB Videospeicher. Beim Ausführen des Open-Weights-Modells Qwen3.5:35B von Alibaba über den Lama-Server erreicht das Setup 90 Token pro Sekunde, was Buterin als Ziel für eine komfortable tägliche Nutzung bezeichnet. Er testete den AMD Ryzen AI Max Pro mit 128 GB Unified Memory, der 51 Token pro Sekunde erreichte, und den DGX Spark, der 60 Token pro Sekunde erreichte.
Er sagte, der DGX Spark, der als Desktop-KI-Supercomputer vermarktet wird, sei angesichts seiner Kosten und des geringeren Durchsatzes im Vergleich zu einer guten Laptop-GPU nicht beeindruckend. Für sein Betriebssystem Buterin wechselte von Arch Linux zu NixOS, wodurch Benutzer ihre gesamte Systemkonfiguration in einer einzigen deklarativen Datei definieren können. Er verwendet Lama-Server als Hintergrund-Daemon, der einen lokalen Port offenlegt, mit dem sich jede Anwendung verbinden kann.
Claude Codebemerkte er, kann auf eine lokale Lama-Server-Instanz statt auf die Server von Anthropic verwiesen werden. Sandboxing ist von zentraler Bedeutung für sein Sicherheitsmodell. Er verwendet Bubblewrap, um mit einem einzigen Befehl isolierte Umgebungen aus jedem Verzeichnis zu erstellen. Prozesse, die in diesen Sandboxes ausgeführt werden, können nur auf Dateien zugreifen, die explizit zugelassen und über Netzwerkports kontrolliert werden. Buterin hat unter github.com/vbuterin/messaging-daemon einen Messaging-Daemon als Open-Source-Version bereitgestellt, der signal-cli und E-Mail umschließt.
Er bemerkte, dass der Daemon Nachrichten frei lesen und ohne Bestätigung Nachrichten an sich selbst senden kann. Jede ausgehende Nachricht an Dritte erfordert eine ausdrückliche menschliche Genehmigung. Er nannte dies das „Mensch + LLM 2-von-2“-Modell und sagte, die gleiche Logik gelte für Ethereum Geldbörsen. Er empfahl den Teams, mit KI verbundene Wallet-Tools zu entwickeln, um autonome Transaktionen auf 100 US-Dollar pro Tag zu begrenzen und eine menschliche Bestätigung für alles Höhere oder jede Transaktion zu verlangen, die Anrufdaten enthält, die Daten herausfiltern könnten.
Fernschluss nach Buterins Bedingungen
Für Forschungsaufgaben verglich Buterin das lokale Tool Local Deep Research mit seinem eigenen Setup unter Verwendung des Pi-Agent-Frameworks gepaart mit SearXNG, einer selbst gehosteten, auf Datenschutz ausgerichteten Metasuchmaschine. Er sagte, Pi plus SearXNG lieferten Antworten von besserer Qualität. Er speichert neben der technischen Dokumentation einen lokalen Wikipedia-Dump von etwa 1 Terabyte, um seine Abhängigkeit von externen Suchanfragen zu reduzieren, die er als Datenschutzleck betrachtet.
Er veröffentlichte außerdem einen lokalen Audio-Transkriptions-Daemon unter github.com/vbuterin/stt-daemon. Das Tool läuft für den Grundgebrauch ohne GPU und leitet die Ausgabe zur Korrektur und Zusammenfassung an das LLM weiter. Zur Ethereum-Integration sagte Buterin, dass KI-Agenten niemals uneingeschränkt agieren sollten Geldbörse Zugang. Er empfahl, den Menschen und das LLM als zwei unterschiedliche Bestätigungsfaktoren zu betrachten, die jeweils unterschiedliche Fehlermodi abdecken.
Für Fälle, in denen lokale Modelle nicht ausreichen, skizzierte Buterin einen datenschutzschonenden Ansatz für Fernschlussfolgerungen. Er verwies auf seinen eigenen ZK-API-Vorschlag mit dem Forscher Davide Openanonymity-Projektund die Verwendung von Mixnets, um zu verhindern, dass Server aufeinanderfolgende Anfragen anhand der IP-Adresse verknüpfen. Er nannte außerdem vertrauenswürdige Ausführungsumgebungen als eine Möglichkeit, Datenlecks durch Remote-Inferenz kurzfristig zu reduzieren, stellte jedoch fest, dass die vollständig homomorphe Verschlüsselung für Private-Cloud-Inferenz heute noch zu langsam ist, um praktikabel zu sein.
Buterin schloss mit der Anmerkung, dass der Beitrag einen Ausgangspunkt und kein fertiges Produkt beschreibe, und warnte die Leser davor, seine genauen Werkzeuge zu kopieren und davon auszugehen, dass sie sicher seien.

