Kann KI mit Krypto handeln? Jay Azhangein Computeringenieur und Finanzbruder aus New York, stellt diese Frage mit auf die Probe Alpha-Arena. Das Projekt lässt die größten Large Language Models (LLM) mit jeweils einem Kapital von 10.000 US-Dollar gegeneinander antreten, um herauszufinden, wer mit dem Handel mit Kryptowährungen mehr Geld verdienen kann. Zu den Modellen gehören Grok 4, Claude Sonnet 4.5, Gemini 2.5 pro, ChatGPT 5, Deepseek v3.1 und Qwen3 Max.
Jetzt denken Sie vielleicht: „Wow, das ist eine tolle Idee!“ Und Sie werden überrascht sein, dass sich zum Zeitpunkt des Verfassens dieses Artikels drei der fünf KIs unter Wasser befinden, wobei Qwen3 und Deepseek – die beiden chinesischen Open-Source-Modelle – die Nase vorn haben.
Richtig, die leistungsstärksten proprietären Closed-Source-Künstler der westlichen Welt, die von Giganten wie Google und OpenAI betrieben werden, haben in etwas mehr als einer Woche über 8.000 Dollar, 80 % ihres Krypto-Handelskapitals, verloren, während ihre östlichen Open-Source-Pendants im grünen Bereich liegen.
Der bisher erfolgreichste Handel? Qwen3 – befeuchtet und auf Kurs – mit einer einfachen 20-fachen Bitcoin-Long-Position. Grok 4 war – was niemanden überrascht – für den größten Teil der Konkurrenz Long-Doge mit 10-facher Hebelwirkung … und stand zeitweise zusammen mit Deepseek an der Spitze der Charts, jetzt fast 20 % unter Wasser. Vielleicht sollte Elon Musk ein Dogen-Meme oder so etwas twittern, um Grok aus der Hundehütte zu holen.

Unterdessen ist Googles Gemini unerbittlich pessimistisch und verfügt über einen Mangel an allen zum Handel verfügbaren Krypto-Assets, eine Position, die die allgemeine Krypto-Politik der letzten 15 Jahre widerspiegelt.
Last but not least ist ChatGibitty eine bemerkenswerte Leistung, die eine Woche lang jeden schlechten Trade möglich gemacht hat! Es braucht Geschick, um so schlecht zu sein, besonders wenn Qwen3 sich gerade nach Bitcoin gesehnt hat und angeln gegangen ist. Wenn dies das Beste ist, was Closed-Source-KI zu bieten hat, dann sollte OpenAI es vielleicht einfach Closed-Source behalten und uns verschonen.
Ein neuer Maßstab für KI
Spaß beiseite: Die Idee, KI-Modelle in einer Krypto-Handelsarena gegeneinander antreten zu lassen, bietet einige sehr tiefgreifende Erkenntnisse. Zunächst einmal kann die KI nicht vorab auf Antworten auf Wissenstests zum Krypto-Handel trainiert werden, da sie so unvorhersehbar ist, ein Problem, unter dem andere Benchmarks leiden. Anders ausgedrückt: Viele KI-Modelle erhalten die Antworten auf einige dieser Tests in ihrem Training und schneiden daher beim Testen natürlich gut ab. Aber einige Untersuchungen haben das gezeigt Leichte Änderungen an einigen dieser Tests führen zu völlig unterschiedlichen KI-Benchmark-Ergebnissen.
Diese Kontroverse wirft die Frage auf: Was ist der ultimative Intelligenztest? Nun, laut Elon Musk, Iron Man-Enthusiast und Schöpfer von Grok 4, ist die Vorhersage der Zukunft der ultimative Maßstab für Intelligenz.
Und seien wir ehrlich: Es gibt keine unsicherere Zukunft als den kurzfristigen Preis von Kryptowährungen. Mit den Worten von Azhang: „Unser Ziel mit Alpha Arena ist es, Benchmarks der realen Welt ähnlicher zu machen, und Märkte sind dafür perfekt. Sie sind dynamisch, kontrovers, mit offenem Ende und unendlich unvorhersehbar. Sie fordern die KI auf eine Weise heraus, die statische Benchmarks nicht können. – Märkte sind der ultimative Test für Intelligenz.“
Diese Erkenntnisse über Märkte sind tief in den libertären Prinzipien verankert, aus denen Bitcoin entstand. Ökonomen wie Murray Rothbard und Milton Friedman argumentierten vor über hundert Jahren, dass Märkte grundsätzlich von zentralen Planern nicht vorhersehbar seien und dass nur Einzelpersonen, die echte wirtschaftliche Entscheidungen treffen und etwas zu verlieren hätten, rationale wirtschaftliche Berechnungen anstellen könnten.
Mit anderen Worten: Der Markt lässt sich am schwierigsten vorhersagen, da er von den individuellen Perspektiven und Entscheidungen intelligenter Individuen auf der ganzen Welt abhängt und daher der beste Test für Intelligenz ist.
Azhang erwähnt in seiner Projektbeschreibung, dass die KIs angewiesen sind, nicht nur für Gewinne, sondern auch für risikobereinigte Renditen zu handeln. Diese Risikodimension ist von entscheidender Bedeutung, da ein schlechter Trade alle bisherigen Erträge zunichte machen kann, wie sich beispielsweise am Niedergang des Portfolios von Grok 4 zeigt.
Es bleibt noch die Frage offen, ob diese Modelle aus ihren Erfahrungen im Kryptohandel lernen, was technisch nicht einfach zu erreichen ist, da die Vorschulung von KI-Modellen von vornherein sehr teuer ist. Sie könnten mit ihrer eigenen Handelsgeschichte oder der Geschichte anderer Leute abgestimmt werden und sie könnten sogar aktuelle Geschäfte in ihrem Kurzzeitgedächtnis oder Kontextfenster behalten, aber das bringt sie nur bis zu einem gewissen Grad. Letztendlich muss das richtige KI-Handelsmodell möglicherweise wirklich aus seinen eigenen Erfahrungen lernen, eine Technologie, die kürzlich in akademischen Kreisen angekündigt wurde, aber noch einen langen Weg vor sich hat, bis sie zu einem Produkt wird. Das MIT nennt sie selbstanpassende KI-Modelle.
Woher wissen wir, dass es nicht nur Glück ist?
Eine weitere Analyse des Projekts und seiner bisherigen Ergebnisse besagt, dass es möglicherweise nicht von einem „Random Walk“ zu unterscheiden ist. Ein Random Walk ist so, als würde man bei jeder Entscheidung würfeln. Wie würde das auf einem Diagramm aussehen? Nun ja, das gibt es tatsächlich Ein Simulator, mit dem Sie diese Frage beantworten können; Eigentlich würde es nicht allzu anders aussehen.

Diese Glücksfrage auf Märkten wurde auch von Intellektuellen wie Nassim Taleb in seinem Buch Antifragile sehr ausführlich beschrieben. Darin argumentiert er, dass es aus statistischer Sicht völlig normal und möglich ist, dass ein Händler, in diesem Fall Qwen3, eine ganze Woche lang Glück hat! Dies führt zum Anschein überlegener Argumentation. Taleb geht noch viel weiter und argumentiert, dass es an der Wall Street genug Händler gibt, dass einer von ihnen problemlos 20 Jahre hintereinander Glück haben und einen gottähnlichen Ruf entwickeln könnte, während alle um ihn herum davon ausgehen, dass dieser Händler nur ein Genie ist, bis natürlich das Glück ausgeht.
Damit Alpha Arena wertvolle Daten produzieren kann, muss es tatsächlich lange laufen, und seine Muster und Ergebnisse müssen auch unabhängig reproduziert werden, wobei echtes Kapital auf dem Spiel steht, bevor sie als anders als ein Random Walk identifiziert werden können.
Letztendlich ist es großartig zu sehen, dass kosteneffiziente Open-Source-Modelle wie DeepSeek ihre Closed-Source-Pendants bisher übertreffen. Alpha Arena war bisher eine großartige Quelle für Unterhaltung, da es in der vergangenen Woche auf X.com viral ging. Wo es hingeht, kann niemand erraten; Wir werden sehen müssen, ob sich das Risiko, das der Erfinder eingegangen ist und fünf Chatbots 50.000 US-Dollar gegeben hat, damit sie auf Kryptowährungen wetten können, am Ende auszahlt.

