Dernières publications et brevets sur les grands modèles linguistiques (LLM)

Grands modèles linguistiques (LLM)

Conseil: suite à cette sélection sur l'aéronautique, vous pouvez rechercher et filtrer nos :
    * Outil de recherche de publications gratuit par auteur, sujet, mots-clés, date ou revue.
    * outil gratuit de recherche de brevets * pour les brevets en anglais de l'Office européen des brevets.

Il s'agit de notre dernière sélection de publications et de brevets mondiaux en anglais sur les grands modèles de langage (LLM), parmi de nombreuses revues scientifiques en ligne, classées et axées sur les thèmes suivants : grand modèle de langage, LLM, transformateur génératif pré-entraîné, pré-entraînement, architecture du transformateur, descente en gradient, GPT, tokenisation, modèle génératif, mécanisme d'auto-attention, modèle de langage masqué et MLM.

Brevets : pas d'actualité brevet sur ce sujet particulier. Veuillez essayer la recherche manuelle approfondie dans la base de données des brevets dont le lien figure juste au-dessus.

Improving Probability-based Prompt Selection Through Unified Evaluation and Analysis

Published on 2024-05-25 by Sohee Yang, Jonghyeon Kim, Joel Jang, Seonghyeon Ye, Hyunji Lee, Minjoon Seo @MIT

Abstract: Previous works in prompt engineering for large language models have introduced different gradient-free probability-based prompt selection methods that aim to choose the optimal prompt among the candidates for a given task but have failed to provide a comprehensive and fair comparison between each other. In this paper, we propose a unified framework to interpret and evaluate the existing probability-based prompt selection methods by performing extensive experiments on 13 common and diverse NLP ta[...]


Our summary: Evaluation of probability-based prompt selection methods through unified framework, Improving prompt selection effectiveness through combinatorial variants of mutual information, Introducing Calibration by Marginalization method for unbiased prompt selection, Achieving high performance in prompt selection without calibration by maximizing mutual information.

prompt selection, probability-based, unified evaluation, analysis, NLP tasks

Publication

Table of Contents
    Ajoutez un en-tête pour commencer à générer la table des matières

    DÉFI DE CONCEPTION ou DE PROJET ?
    Ingénieur mécanique, chef de projet ou de R&D
    Développement de produits efficace

    Disponible pour un nouveau défi à court terme en France et en Suisse.
    Contactez-moi sur LinkedIn
    Produits en plastique et en métal, Conception à coût réduit, Ergonomie, Volumes moyens à élevés, Secteurs réglementés, CE et FDA, CAO, Solidworks, Lean Sigma Black Belt, médical ISO 13485 Classes II et III

    Nous recherchons un nouveau sponsor

     

    Votre entreprise ou institution est dans le domaine de la technique, de la science ou de la recherche ?
    > envoyez-nous un message <

    Sujets abordés : Grands modèles de langage, LLM, transformateur génératif pré-entraîné, pré-entraînement, architecture de transformateur, descente en gradient, GPT, tokenisation, modèle génératif, mécanisme d'auto-attention, modèle de langage masqué, MLM, ISO/IEC 30170, ISO/IEC 27001, ISO/IEC 25000, ISO/IEC 30164, et ISO/IEC 27002.

    Retour en haut

    Vous aimerez peut-être aussi