Casa » Ultime pubblicazioni e brevetti sui modelli linguistici di grandi dimensioni (LLM)

Ultime pubblicazioni e brevetti sui modelli linguistici di grandi dimensioni (LLM)

Modelli linguistici di grandi dimensioni (LLM)

Questa è la nostra ultima selezione di pubblicazioni e brevetti in inglese su Large Language Models (LLM), tra numerose riviste scientifiche online, classificate e incentrate su large language model, LLM, generative pre-trained transformer, pre-training, transformer architecture, gradient descent, GPT, tokenization, generative model, self-attention mechanism, masked language model e MLM.

Brevetti: non recente brevetto su questo particolare argomento. Provate a effettuare una ricerca manuale approfondita nel Database dei brevetti, linkato poco sopra.

Improving Probability-based Prompt Selection Through Unified Evaluation and Analysis

Published on 2024-05-25 by Sohee Yang, Jonghyeon Kim, Joel Jang, Seonghyeon Ye, Hyunji Lee, Minjoon Seo @MIT

Abstract: Previous works in prompt engineering for large language models have introduced different gradient-free probability-based prompt selection methods that aim to choose the optimal prompt among the candidates for a given task but have failed to provide a comprehensive and fair comparison between each other. In this paper, we propose a unified framework to interpret and evaluate the existing probability-based prompt selection methods by performing extensive experiments on 13 common and diverse NLP ta[...]


Our summary: Evaluation of probability-based prompt selection methods through unified framework, Improving prompt selection effectiveness through combinatorial variants of mutual information, Introducing Calibration by Marginalization method for unbiased prompt selection, Achieving high performance in prompt selection without calibration by maximizing mutual information.

prompt selection, probability-based, unified evaluation, analysis, NLP tasks

Publication

Sommario
    Agregue un encabezado para comenzar a generar la tabla de contenido

    SFIDA DI DESIGN o DI PROGETTO?
    Ingegnere meccanico, responsabile di progetto o di ricerca e sviluppo
    Sviluppo efficace del prodotto

    Disponibile per una nuova sfida con breve preavviso in Francia e Svizzera.
    Contattami su LinkedIn
    Prodotti in plastica e metallo, Design-to-cost, Ergonomia, Volume medio-alto, Settori regolamentati, CE e FDA, CAD, Solidworks, Lean Sigma Black Belt, ISO 13485 Classe II e III

    Stiamo cercando un nuovo sponsor

     

    La tua azienda o istituzione si occupa di tecnica, scienza o ricerca?
    > inviaci un messaggio <

    Ricevi tutti i nuovi articoli
    Gratuito, no spam, email non distribuita né rivenduta

    oppure puoi ottenere la tua iscrizione completa -gratuitamente- per accedere a tutti i contenuti riservati >Qui<

    Argomenti trattati: Large Language Models, LLM, trasformatore generativo pre-addestrato, pre-addestramento, architettura del trasformatore, discesa del gradiente, GPT, tokenizzazione, modello generativo, meccanismo di auto-attenzione, modello linguistico mascherato, MLM, ISO/IEC 30170, ISO/IEC 27001, ISO/IEC 25000, ISO/IEC 30164 e ISO/IEC 27002.

    1. Kira Moody

      Interesting read! But arent we risking a bit by placing so much emphasis on LLMs? Just food for thought.

    2. Faith

      Interesting read! But dont you think we should also focus on the ethical implications of these LLM patents? Just food for thought guys!

      1. Fabrice

        Absolutely! Ethics in LLM patents is a crucial debate we often overlook. Thanks for bringing it up!

    I commenti sono chiusi.

    Post correlati

    Torna in alto

    Potrebbe anche piacerti