Investing.com – DeepSeek hat am Freitag Vorschauversionen seines neuen Flaggschiff-Open-Source-Modells für künstliche Intelligenz, V4, veröffentlicht, das angeblich über verbesserte Argumentations- und Leistungsfähigkeiten verfügt.
Das Unternehmen hat zwei neue Modelle herausgebracht – DeepSeek-V4-Pro und DeepSeek-V4-Flash. Die Pro-Version verfügt über 1,6 Billionen Parameter, während die Flash-Version ein kleineres, schlankeres Modell mit 284 Milliarden Parametern ist, sagte das Unternehmen in einem Beitrag auf der Open-Source-KI-Website Hugging Face.
Beide Modelle verfügen über ein Kontextfenster von 1 Million Token – eine Funktion, die bestimmt, wie viele Informationen ein KI-Modell verarbeiten kann.
Die Modelle können vorerst nur Text verarbeiten, wobei DeepSeek erklärte, dass man „an der Integration multimodaler Fähigkeiten arbeite“, was es einem KI-Modell ermöglichen würde, auch Bilder und Videos zu verarbeiten.
DeepSeek sagte, V4-Pro-Max, das fortschrittlichste seiner KI-Modelle, habe „erstklassige Leistung bei Codierungs-Benchmarks erzielt und die Lücke zu führenden Closed-Source-Modellen bei Argumentations- und Agentenaufgaben deutlich geschlossen“.
Auf MMLU-Pro, einem beliebten KI-Coding-Benchmark, konnte DeepSeek V4-Pro mit GPT-5.4 von OpenAI mithalten, während es leicht hinter Googles Gemini-3.1-Pro und Anthropics Claude Opus 4.6 zurückblieb, wie Daten von DeepSeek zeigten.
DeepSeek hat nicht angegeben, auf welchen GPUs sein neues Modell trainiert wurde. Anfang des Jahres hatten US-Beamte dem Unternehmen vorgeworfen, verbotene Blackwell-Chips der NVIDIA Corporation (NASDAQ:) zum Trainieren seiner Modelle zu verwenden.
In einem aktuellen Bericht von The Information hieß es jedoch, das Unternehmen habe seine Modelle auf fortschrittliche KI-Chips von Huawei trainiert.
Huawei sagte in einer separaten Ankündigung, dass sein Ascend-Superknoten, auf dem die Flaggschiff-Chips des Unternehmens Ascend 950 AI laufen, die V4-Modelle von DeepSeek vollständig unterstützen würde.
Die Ankündigung vom Freitag markiert die erste große Veröffentlichung eines Grundmodells von DeepSeek, seit sein R1-Modell Anfang 2025 die Branche erschütterte.
DeepSeeks R1 wurde als großer Fortschritt für Open-Source-KI-Modelle angesehen und bot eine Leistung, die mit Angeboten von Closed-Source-Konkurrenten vergleichbar war. Die Veröffentlichung des Modells hatte zunächst zu starken Verlusten bei globalen Technologieaktien geführt, da Anleger die Notwendigkeit einer größeren KI-Infrastruktur in Frage stellten, wenn ein schlankeres, effizienteres Modell eine vergleichbare Leistung bieten könnte.
Die Veröffentlichung am Freitag erfolgt auch nur wenige Tage, nachdem Berichten zufolge die chinesischen Technologiegiganten Tencent und Alibaba Gespräche über eine Investition in DeepSeek mit einem Wert von über 20 Milliarden US-Dollar führten.
Das Unternehmen gilt als einer von Chinas „KI-Tigern“, einer Gruppe von sechs KI-Einhörnern, die an der Spitze der Ambitionen des Landes in der schnell wachsenden Branche stehen.

