MCBO Magazin

Inhalt für jeden Tag

  • Start
  • Alltage
  • Finanzen
  • Gesundheit
  • Mode
  • Nachrichten
  • Sport
  • Tehnologie
  • Zeitschrift
  • Start
  • Alltage
  • Finanzen
  • Gesundheit
  • Mode
  • Nachrichten
  • Sport
  • Tehnologie
  • Zeitschrift
  • Nachrichten,  Finanzen

    Forscher entwickeln KI-System für eigenständiges Lernen ohne externe Belohnungen

    INTUITOR-Methode nutzt Selbstvertrauen des Modells als einziges Belohnungssignal und zeigt überlegene Generalisierung bei verschiedenen Aufgaben Wissenschaftler der UC Berkeley, Yale University und anderen Institutionen haben eine bahnbrechende Methode entwickelt, mit der große Sprachmodelle (LLMs) komplexe Denkfähigkeiten ohne externe Überwachung oder Belohnungssignale erlernen können. Die als INTUITOR bezeichnete Technik stellt einen bedeutenden Fortschritt im Bereich des Reinforcement Learning from Internal Feedback (RLIF) dar. Neues Paradigma des intrinsischen Lernens Das herkömmliche Training von KI-Modellen für komplexe Denkaufgaben basiert typischerweise auf Reinforcement Learning with Verifiable Rewards (RLVR), das kostspielige, domänenspezifische Überwachung erfordert. INTUITOR durchbricht diese Beschränkung, indem es ausschließlich auf das Selbstvertrauen des Modells – die sogenannte „Self-Certainty“ – als Belohnungssignal setzt. Die…

    weiterlesen

    Das könnte dich ebenfalls interessieren

    Black Forest Labs stellt FLUX.1 Kontext vor: Revolutionäre KI für kontextbewusste Bildbearbeitung

    Juni 2, 2025

    Wie Angriffe auf den Iran die Energiekosten und Benzinpreise beeinflussen könnten

    Juni 23, 2025

    Wie viele von uns werden mit ADHS diagnostiziert?

    Juni 15, 2025
Ashe Theme von WP Royal.