MCBO Magazin

  • Start
  • Alltage
  • Finanzen
  • Gesundheit
  • Mode
  • Nachrichten
  • Sport
  • Tehnologie
  • Zeitschrift
  • Start
  • Alltage
  • Finanzen
  • Gesundheit
  • Mode
  • Nachrichten
  • Sport
  • Tehnologie
  • Zeitschrift
  • Nachrichten,  Finanzen

    Forscher entwickeln KI-System für eigenständiges Lernen ohne externe Belohnungen

    INTUITOR-Methode nutzt Selbstvertrauen des Modells als einziges Belohnungssignal und zeigt überlegene Generalisierung bei verschiedenen Aufgaben Wissenschaftler der UC Berkeley, Yale University und anderen Institutionen haben eine bahnbrechende Methode entwickelt, mit der große Sprachmodelle (LLMs) komplexe Denkfähigkeiten ohne externe Überwachung oder Belohnungssignale erlernen können. Die als INTUITOR bezeichnete Technik stellt einen bedeutenden Fortschritt im Bereich des Reinforcement Learning from Internal Feedback (RLIF) dar. Neues Paradigma des intrinsischen Lernens Das herkömmliche Training von KI-Modellen für komplexe Denkaufgaben basiert typischerweise auf Reinforcement Learning with Verifiable Rewards (RLVR), das kostspielige, domänenspezifische Überwachung erfordert. INTUITOR durchbricht diese Beschränkung, indem es ausschließlich auf das Selbstvertrauen des Modells – die sogenannte „Self-Certainty“ – als Belohnungssignal setzt. Die…

    weiterlesen

    Das könnte dich ebenfalls interessieren

    Chiles Lachsfarmer setzen auf ruhigere Gewässer

    Juni 9, 2025

    Effektive Gestaltung von Schema-Fragebögen in der Forschung

    März 30, 2025

    Zunehmende internationale Forderungen an Israel nehmen zu

    Mai 19, 2025
Ashe Theme von WP Royal.