بيت » أحدث المنشورات وبراءات الاختراع حول نماذج اللغات الكبيرة (LLM)

أحدث المنشورات وبراءات الاختراع حول نماذج اللغات الكبيرة (LLM)

Large Language Models (LLM)

This is our latest selection of worldwide publications and patents in english on Large Language Models (LLM), between many scientific online journals, classified and focused on large language model, LLM, generative pre-trained transformer, pre-training, transformer architecture, gradient descent, GPT, tokenization, generative model, self-attention mechanism, masked language model and MLM.

براءات الاختراع: لا يوجد حديثاً براءة اختراع حول هذا الموضوع بالتحديد. يُرجى تجربة البحث اليدوي الشامل في قاعدة بيانات براءات الاختراع المرتبطة أعلاه.

Improving Probability-based Prompt Selection Through Unified Evaluation and Analysis

Published on 2024-05-25 by Sohee Yang, Jonghyeon Kim, Joel Jang, Seonghyeon Ye, Hyunji Lee, Minjoon Seo @MIT

Abstract: Previous works in prompt engineering for large language models have introduced different gradient-free probability-based prompt selection methods that aim to choose the optimal prompt among the candidates for a given task but have failed to provide a comprehensive and fair comparison between each other. In this paper, we propose a unified framework to interpret and evaluate the existing probability-based prompt selection methods by performing extensive experiments on 13 common and diverse NLP ta[...]


Our summary: Evaluation of probability-based prompt selection methods through unified framework, Improving prompt selection effectiveness through combinatorial variants of mutual information, Introducing Calibration by Marginalization method for unbiased prompt selection, Achieving high performance in prompt selection without calibration by maximizing mutual information.

prompt selection, probability-based, unified evaluation, analysis, NLP tasks

Publication

جدول المحتويات
    Agregue un encabezado para comenzar a generar la tabla de contenido

    تحدي التصميم أو المشروع؟
    مهندس ميكانيكي، مدير مشروع أو بحث وتطوير
    تطوير المنتج الفعال

    متاح لتحدي جديد في غضون مهلة قصيرة في فرنسا وسويسرا.
    تواصل معي على LinkedIn
    المنتجات البلاستيكية والمعدنية، التصميم حسب التكلفة، بيئة العمل، الحجم المتوسط إلى الكبير، الصناعات المنظمة، CE وFDA، التصميم بمساعدة الحاسوب، Solidworks، الحزام الأسود Lean Sigma، شهادة ISO 13485 الطبية من الفئة الثانية والثالثة

    نحن نبحث عن راعي جديد

     

    هل شركتك أو مؤسستك متخصصة في التقنية أو العلوم أو الأبحاث؟
    > أرسل لنا رسالة <

    احصل على جميع المقالات الجديدة
    مجاني، لا يوجد بريد عشوائي، ولا يتم توزيع البريد الإلكتروني ولا إعادة بيعه

    أو يمكنك الحصول على عضويتك الكاملة -مجانًا- للوصول إلى جميع المحتويات المحظورة >هنا<

    المواضيع المغطاة: Large Language Models, LLM, generative pre-trained transformer, pre-training, transformer architecture, gradient descent, GPT, tokenization, generative model, self-attention mechanism, masked language model, MLM, ISO/IEC 30170, ISO/IEC 27001, ISO/IEC 25000, ISO/IEC 30164, and ISO/IEC 27002..

    1. Kira Moody

      Interesting read! But arent we risking a bit by placing so much emphasis on LLMs? Just food for thought.

    2. Faith

      Interesting read! But dont you think we should also focus on the ethical implications of these LLM patents? Just food for thought guys!

      1. فابريس

        Absolutely! Ethics in LLM patents is a crucial debate we often overlook. Thanks for bringing it up!

    التعليقات مغلقة

    منشورات ذات صلة

    انتقل إلى الأعلى

    قد يعجبك أيضاً