DeepSeeks KI lernt, für sich selbst zu denken

Image by Matheus Bertelli, from Pexels

DeepSeeks KI lernt, für sich selbst zu denken

Lesezeit: 2 Min.

Das chinesische Start-up DeepSeek hat in Zusammenarbeit mit der Tsinghua Universität nach eigenen Angaben einen klügeren Weg entwickelt, um künstlichen Intelligenzmodellen ein besseres und schnelleres Denkvermögen zu verleihen, ohne dabei riesige Computer oder kostspielige Ressourcen zu benötigen.

Eilt es? Hier sind die wichtigsten Fakten:

  • DeepSeek hat eine sich selbst verbessernde AI mit Hilfe von Self-Principled Critique Tuning (SPCT) entwickelt.
  • SPCT lehrt AI, ihre eigene Arbeit mit selbst generierten Regeln zu beurteilen.
  • Die Methode steigert die Leistung ohne massiven Computerleistung.

Der Durchbruch kommt von einer neuen Technik namens Self-Principled Critique Tuning (SPCT). SPCT unterscheidet sich von der einfachen Vergrößerung von KI-Modellen zur Leistungssteigerung – SPCT benötigt nicht viel Energie und Rechenleistung, um der KI das Beurteilen ihrer eigenen Arbeit anhand eines Sets von selbst erstellten Regeln beizubringen.

Die Funktionsweise basiert auf einem integrierten „Richter“, der überprüft, ob die AI-Antwort sowohl ihren internen Denkregeln entspricht, als auch für menschliche Ausgaben geeignet erscheint. Wenn die KI eine solide Antwort liefert, erhält sie positives Feedback, was ihr hilft, ihre Fähigkeit zu verbessern, ähnliche Fragen in zukünftigen Instanzen zu beantworten.

DeepSeek implementiert diese Methode als Teil seines DeepSeek-GRM-Systems, das für Generative Reward Modeling steht. GRM funktioniert anders als traditionelle Methoden, da es parallele Überprüfungen durchführt, um sowohl Genauigkeit als auch Konsistenz zu verbessern.

„Wir schlagen Self-Principled Critique Tuning (SPCT) vor, um skalierbare Verhaltensweisen zur Belohnungserzeugung zu fördern“, schrieben die Forscher in ihrem Paper. „SPCT ermöglicht es [dem Modell], adaptiv Prinzipien und Kritiken auf der Basis der Eingabeabfrage und Antworten zu formulieren, was zu besseren Belohnungsergebnissen führt.“

Mit diesem System behauptet DeepSeek, dass seine KI nun besser als Konkurrenten wie Googles Gemini, Metas Llama und OpenAIs GPT-4o performen kann, insbesondere bei komplexen Aufgaben wie dem logischen Denken oder der Entscheidungsfindung, wie Euronews bemerkt.

Wichtig ist, dass DeepSeek ankündigt, diese neuen Tools als Open-Source Software zu veröffentlichen, obwohl noch kein Veröffentlichungsdatum mitgeteilt wurde.

Hat dir der Artikel gefallen?
Wir freuen uns über eine Bewertung!
Ich mag es gar nicht Nicht so mein Fall War ok Ziemlich gut Ich liebe es

Wir freuen uns, dass dir unsere Arbeit gefallen hat!

Würdest du uns als geschätzte Leserin oder geschätzter Leser eine Bewertung auf Trustpilot schreiben? Das geht schnell und bedeutet uns sehr viel. Danke, dass du am Start bist!

Bewerte uns auf Trustpilot
0 Bewertet von 0 Nutzern
Titel
Kommentar
Danke für dein Feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Hinterlasse einen Kommentar

Loader
Loader Mehr anzeigen...