Alibaba präsentiert neues Qwen KI-Modell und behauptet, es übertrifft DeepSeek-V3.
Der chinesische Riese Alibaba hat am Mittwoch die neueste Version seines Flaggschiff-KI-Modells, Qwen, veröffentlicht. Das Unternehmen behauptet, es könne besser abschneiden als das beliebte DeepSeek-V3.
In Eile? Hier sind die schnellen Fakten!
- Alibaba veröffentlichte diesen Mittwoch sein neuestes Reasoning-Modell Qwen 2.5-Max.
- Der chinesische Gigant behauptet, dass es beliebte Modelle wie DeepSeek-V3, GPT-4o und Llama-3.1-405B übertrifft.
- Das Unternehmen startete diese Woche auch Qwen2.5-VL, ein KI-Modell, das in der Lage ist, Bilder zu verarbeiten und als KI-Agent zu fungieren, der Computer und Mobiltelefone zur Ausführung von Aufgaben nutzt.
Laut Reuters hat Alibaba das neue Qwen 2.5-Max, wie das neue Argumentationsmodell genannt wurde, direkt während der Feiertage des chinesischen Neujahrsfestes auf den Markt gebracht, um sich den massiven KI-Entwicklungen der letzten Tage anzuschließen und den inländischen Wettbewerb zu erhöhen.
Am Montag hat DeepSeek den ersten Platz im App Store von Apple in den Vereinigten Staaten erreicht und dabei ChatGPT übertroffen, was andere Unternehmen in der KI-Branche beunruhigt und Anleger alarmiert hat – die Nvidia-Aktien sind an einem einzigen Tag um 17% gefallen.
Nun hat Alibaba die neuesten Versionen seines Qwen-Modells angekündigt – es hat im September letzten Jahres 100 Open-Source-KI-Modelle für die Qwen-Suite veröffentlicht – und verspricht bessere Ergebnisse als beliebte Grenzmodelle.
„Qwen 2.5-Max übertrifft (…) fast überall GPT-4o, DeepSeek-V3 und Llama-3.1-405B“, schrieb das Unternehmen auf seinem offiziellen WeChat-Konto.
Das neue logische Modell Qwen 2.5-Max’s API ist über Alibabas Cloud verfügbar und Benutzer können das Modell auch auf seiner Chat-Seite testen.
„Wir entwickeln Qwen2.5-Max, ein großangelegtes MoE-Modell, das auf über 20 Billionen Tokens vortrainiert wurde und mit kuratierten Methoden des Supervised Fine-Tuning (SFT) und des Reinforcement Learning from Human Feedback (RLHF) weiter nachtrainiert wurde“, schrieb das Qwen Team auf Github.
Der chinesische Riese veröffentlichte ebenfalls am Montag Qwen2.5-VL, eine Reihe von multimodalen KI-Modellen, die auch Bilder verarbeiten und auf Mobilgeräte und Computer zugreifen können, um Aufgaben auszuführen. OpenAI kündigte ein ähnliches Feature, den Operator, an, der es ChatGPT ermöglicht, autonom Aufgaben auszuführen, indem er die Kontrolle über den Computer des Benutzers übernimmt.
Laut dem Team von Alibaba übertreffen alle Qwen-Modelle ähnliche Versionen von OpenAI, Microsoft, Google, Meta und DeepSeek.
Hinterlasse einen Kommentar
Abbrechen