Últimas publicaciones y patentes sobre grandes modelos lingüísticos (LLM)

This week: client system intelligence, distributed service configuration, machine learning model, client system descriptor file, video analytics, situational awareness, generative AI, alert processing, code validation, metadata processing, prompt templates, code modification, large language model, embedding layer, parameter space, transformer layers, dynamic retrieval-augmented generation, run-time prompt enrichment, Knowledge Base, Large Language Model, narrative generation, embeddings, data transformation, large language model, Keyword-RAG, retrieval-augmented generation, domain-specific knowledge, precision enhancement, medical AI, oversight, generative AI, FDA

junio 18, 2026

Emisiones de carbono, Diseño Generativo, Transformador Generativo Preentrenado (GPT), Modelos de lenguaje grandes (LLM), Procesamiento del lenguaje natural (PLN), Interfaz de usuario (UI)

Consejo: además de la selección siguiente, puede buscar y filtrar nuestras 2 bases de datos completas:

> herramienta de búsqueda gratuita de publicaciones < por autor, tema, palabras clave, fecha o revista.

> herramienta de búsqueda gratuita de patentes < para patentes en inglés de la Oficina Europea de Patentes.

Esta es nuestra última selección de publicaciones y patentes mundiales en inglés sobre Large Language Models (LLM), entre muchas revistas científicas en línea, clasificadas y centradas en large language model, LLM, generative pre-trained transformer, pre-training, transformer architecture, gradient descent, GPT, tokenization, generative model, self-attention mechanism, masked language model y MLM.

Systems and methods for using client system intelligence for distributed service system configuration

Patent published on the 2026-06-11 in US under Ref US20260163813 by STRIPE INC [US] (Gehman Samuel Ishmael [us], Jermsurawong Jermsak [us], Vafeias Efstathios [us], Brown Jonathon Daniel [us], Kedia Gautam [us])

Abstract: A method and apparatus for executing a service of a server computer system for a client system are described. The method may include defining a client system descriptor file that includes a set of signals suitable for input into a large language machine learning model (LLM), and collecting data associated with a first client system that is representative of the set of signals. The data can then be compressed into the set of signals for a first client system descriptor file allocated for the clie[...]

Our summary: The method involves defining a client system descriptor file with signals for a large language model. Data from a client system is collected and compressed into this descriptor file. A query is executed using the descriptor file, leading to actions by the server s service based on the model s output.

client system intelligence, distributed service configuration, machine learning model, client system descriptor file

Patent

Systems and methods for increasing situational awareness of alerts generated by a video monitoring system

Patent published on the 2026-06-11 in US under Ref US20260162431 by HONEYWELL INT INC [US] (Gupta Anchal [in], Eswara Lalitha M [in])

Abstract: Methods and systems are provided for increasing situational awareness of alerts from a video monitoring system. Video analytics algorithms detect conditions in a video stream and generate alerts. For each alert, a video clip is extracted containing frames before and/or after the alert. A Generative AI video-to-text summarization model generates text summaries of the video frames, which are processed by a Large Language Model to generate context for each alert. Enhanced alerts are output containi[...]

Our summary: The system enhances situational awareness by generating context for alerts from video monitoring. Video analytics detect conditions and produce alerts, with video clips extracted for analysis. A generative AI model creates text summaries, which are processed to improve alert information and support future predictions.

video analytics, situational awareness, generative AI, alert processing

Patent

Code infraction quality validator with llm proposed solutions

Patent published on the 2026-06-11 in US under Ref US20260161530 by SERVICENOW INC [US] (Dyson-coope Alexander Pierre [gb])

Abstract: [0000] A method includes obtaining a portion of a code file that is associated with metadata and selecting a prompt template from a set of prompt templates. Each of the prompt templates includes a respective request and a respective metadata placeholder. The method includes populating the respective metadata placeholder of the prompt template with the metadata associated with the portion of the code file. The method includes generating a code modification based on the portion of the code file, t[...]

Our summary: This method involves obtaining a code file portion linked to metadata. It selects a prompt template and populates it with the relevant metadata. Finally, it generates and applies a code modification based on the populated template.

code validation, metadata processing, prompt templates, code modification

Patent

Method and apparatus for modifying architecture of large language model

Patent published on the 2026-06-11 in US under Ref US20260161945 by LG ELECTRONICS INC [KR] (Byun Sanghyun [us], Gou Jimmy [us], Yildiz Bahattin [us], Malpeddi Nilesh [us], De Micheli Gabrielle [us], Chung Wooseong [us], Song Jacob [us])

Abstract: [0000] According to at least one embodiment, a computer-implemented method of modifying an architecture of a large language model (LLM) includes compressing an embedding layer of the LLM to reduce a size of a parameter space of the LLM, wherein the embedding layer has an embedding dimension of n, wherein compressing the embedding layer includes utilizing a first intermediate mapping configured to map a token to an m-dimensional vector, and wherein m is less than n. The method further includes co[...]

Our summary: The method modifies the architecture of a large language model by compressing its embedding layer and transformer layers. This compression reduces the size of the model s parameter space. It utilizes a mapping to convert tokens into lower-dimensional vectors.

large language model, embedding layer, parameter space, transformer layers

Patent

Enhancing a code base using dynamic retrieval-augmented generation (rag) with run-time prompt enrichment

Patent published on the 2026-06-11 in US under Ref US20260161371 by ZSCALER INC [US] (Venkatesh Golla Sai [in], Shyju Saurav [in])

Abstract: [0000] Systems and methods for enhancing software code are provided. A method, according to one implementation, includes receiving a code base developed by one or more software developers and receiving a prompt for requesting enhancement to the code base. Also, the method includes a step of using a dynamic Retrieval-Augmented Generation (RAG) component and a Knowledge Base (KB) repository to enrich the prompt. Based on the enriched prompt, the method further includes a step of using a Large Lang[...]

Our summary: The method enhances software code by using a dynamic RAG component to enrich prompts. It integrates a Knowledge Base repository for improved context. A Large Language Model tool is then employed to enhance the code base effectively.

dynamic retrieval-augmented generation, run-time prompt enrichment, Knowledge Base, Large Language Model

Patent

Systems and methods for narrative generation from embeddings

Patent published on the 2026-06-11 in US under Ref US20260162169 by ROYAL BANK OF CANADA [CA] (Tung Frederick [ca], Deng Ruizhi [ca], Zhao He [ca])

Abstract: [0000] Systems and methods for narrative generation. Data representations in a first data domain are received. The data representations of the first data domain are transformed into data representations of a second data domain by an adapter. Narratives corresponding to the data representations can be generated using a large language model by interpreting the data representations of the second data domain.[...]

Our summary: This document describes systems and methods for generating narratives from data embeddings. It involves transforming data representations from one domain to another using an adapter. A large language model is then utilized to create narratives based on the transformed data representations.

narrative generation, embeddings, data transformation, large language model

Patent

Enhancing precision in question-answering for FDM troubleshooting from technical documents

Published on 2026-05-27 by @OXFORD

Abstract: AbstractWith accelerating digital transformation in manufacturing, large language models (LLMs) are increasingly being considered for leveraging domain-specific knowledge for decision-making and problem-solving. However, LLMs are prone to exhibiting hallucination when dealing with external information or specialized domain knowledge that falls beyond their training scope. To mitigate this issue, a retrieval-augmented generation (RAG) approach that incorporates external documents is used. However[...]

Our summary: This study introduces Keyword-RAG, a novel method that enhances precision in question-answering for FDM troubleshooting. It integrates domain-specific keyword extraction to maintain semantic coherence during retrieval. Experimental results show significant improvements in context recall and precision, benefiting decision-making in manufacturing environments.

Keyword-RAG, retrieval-augmented generation, domain-specific knowledge, precision enhancement

Publication

Expert perspectives on the ecosystem of medical AI oversight in the GenAI era

Published on 2026-05-22 by Stephen Gilbert, Tinglong Dai @NATURE npj

Abstract: npj Digital Medicine, Published online: 22 May 2026; doi:10.1038/s41746-026-02785-1In this third article of a three-article series on interviews with Dr Shantanu Nundy, an advisor in the office of the Commissioner of the US FDA on AI governance and digital health policy, we explore how the oversight of generative AI (GenAI) and large language model (LLM)-enabled medical devices extends beyond the remit of any single regulator, requiring coordination among government agencies, health systems, and[...]

Our summary: The article discusses the complexities of overseeing medical AI in the GenAI era. It emphasizes the need for collaboration among various stakeholders, including regulators and health systems. Additionally, it provides practical guidance for innovators on engaging with the FDA.

medical AI, oversight, generative AI, FDA

Publication

Temas tratados: Grandes modelos lingüísticos, LLM, transformador generativo preentrenado, preentrenamiento, arquitectura del transformador, descenso por gradiente, GPT, tokenización, modelo generativo, mecanismo de autoatención, modelo lingüístico enmascarado, MLM, ISO/IEC 30170, ISO/IEC 27001, ISO/IEC 25000, ISO/IEC 30164 e ISO/IEC 27002.

Contexto histórico

Sistema láser de bloqueo de modo en un laboratorio de óptica moderno.

Mode-locking (lasers)

El bloqueo modal es una técnica para producir pulsos láser extremadamente cortos, del orden de picosegundos ([latex]10^{-12}[/latex] s) a femtosegundos ([latex]10^{-15}[/latex] s). Funciona forzando a los numerosos modos longitudinales de la cavidad láser a oscilar con una relación de fase fija. Esto hace que los modos interfieran constructivamente, creando un pulso único, intenso y ultracorto que circula por la cavidad.

Síntesis de nanomateriales de arriba hacia abajo

La síntesis descendente implica la creación de nanomateriales partiendo de un material más grande y voluminoso, descomponiéndolo o modelándolo a escala nanométrica. Las técnicas clave incluyen métodos mecánicos como el fresado de bolas y métodos litográficos como la fotolitografía, la litografía por haz de electrones y la litografía por nanoimpresión. Estos métodos se utilizan a menudo para crear superficies estructuradas y circuitos integrados, pero pueden presentar imperfecciones superficiales.

Sistema de almacenamiento de energía mediante volante de inercia en aplicaciones de mecánica industrial.

Almacenamiento de energía con volante de inercia (FES)

El almacenamiento de energía en volantes de inercia funciona acelerando un rotor (volante de inercia) a una velocidad muy alta y manteniendo la energía en el sistema como energía cinética rotacional. La energía almacenada es proporcional al cuadrado de la velocidad de rotación. Cuando se extrae energía, la rotación del volante se ralentiza. La fórmula de la energía almacenada es [latex]E = \frac{1}{2} I \omega^2[/latex], donde I es el momento de inercia y ω es la velocidad angular.

Electrónica molecular

La electrónica molecular explora el uso de moléculas individuales o conjuntos moleculares a escala nanométrica como componentes electrónicos fundamentales. Este enfoque busca construir circuitos en el límite máximo de la miniaturización, mucho más allá de la tecnología tradicional basada en silicio. Los componentes clave incluyen cables moleculares, interruptores y rectificadores, aprovechando propiedades de la mecánica cuántica, como el efecto túnel de electrones a través de orbitales moleculares, para su funcionamiento.

Ingenieros analizando componentes microelectrónicos para fatiga térmica y electromigración.

Física del fallo (PoF)

La Física de Fallas (PoF) es un enfoque de ingeniería de confiabilidad que utiliza conocimientos de la ciencia y la física de los materiales para comprender y modelar los mecanismos causantes de las fallas. En lugar de basarse únicamente en datos estadísticos de fallas pasadas, se centra en predecir fallas mediante el análisis de los procesos físicos (p. ej., fatiga, corrosión, fluencia) que conducen a la degradación y la avería.

Análisis de laboratorio de puntos cuánticos que demuestra el efecto del tamaño cuántico en la física de semiconductores.

Efecto del tamaño cuántico en nanomateriales

El efecto cuántico del tamaño describe el fenómeno por el cual las propiedades electrónicas y ópticas de un material cambian a medida que su tamaño se aproxima a la nanoescala. Cuando las dimensiones de un material son comparables a la longitud de onda de Broglie del electrón, se produce un confinamiento cuántico. Esto cuantiza los niveles de energía del electrón, dando lugar a una brecha de banda que depende del tamaño, [latex]E_g(R) \approx E_{g,\b\u\lk} + \frac{\hbar^2\pi^2}{2R^2}(\frac{1}{m_e^*} + \frac{1}{m_h^*})[/latex].

Higrómetro de alta precisión en un laboratorio para medir factores de mejora de la presión de vapor.

Factor de mejora de la presión de vapor

La presión de vapor de equilibrio del agua sobre una superficie líquida en aire húmedo ([latex]p^*_{H_2O,a}[/latex]) es ligeramente superior a la presión de vapor de equilibrio sobre una superficie de agua pura ([latex]p^*_{H_2O}[/latex]). Esta diferencia se cuantifica mediante el factor de aumento del vapor de agua, [latex]f_w[/latex], que depende de la temperatura y de la presión del aire húmedo. La relación es [latex]p^*_{H_2O,a} = f_w(T, p_{ms}) \cdot p^*_{H_2O}[/latex].

1965

1970

1974-11-15

1980

1964

1968

1970

1975

1980

Análisis de laboratorio de fósforos de vanadato de itrio dopados con europio para aplicaciones de televisión en color.

Fósforos de europio para televisión en color

El descubrimiento de que el vanadato de itrio dopado con europio ([latex]YVO_4:Eu^{3+}[/latex]) podía actuar como fósforo rojo brillante supuso un avance decisivo para la televisión en color. Antes, los fósforos rojos eran débiles y producían colores apagados. La emisión roja, intensa y de banda estrecha, del ion [latex]Eu^{3+}[/latex] permitió obtener pantallas de colores brillantes y vibrantes, mejorando drásticamente la calidad de la televisión en color y estableciendo el estándar de la tecnología de visualización.

Estudio de diseño automotriz con diseñador que utiliza software CAD para crear curvas Bézier para carrocerías de automóviles.

Curvas de Bézier

Desarrollado por el ingeniero francés Pierre Bézier para Renault en la década de 1960, UNISURF fue uno de los primeros sistemas CAD/CAM 3D auténticos. Su principal innovación fue el uso de lo que hoy conocemos como curvas y superficies de Bézier. Se trata de curvas paramétricas definidas por un conjunto de puntos de control, que permiten la creación intuitiva y matemática de formas libres complejas para carrocerías.

Receptor GPS que muestra señales de satélite y mediciones de distancia en física de ondas de radio.

Principio de trilateración GPS

El GPS determina la posición de un receptor mediante trilateración. Midiendo la distancia a al menos tres satélites, el receptor puede determinar su ubicación exacta en la superficie terrestre. La distancia se calcula multiplicando el tiempo de viaje de la señal por la velocidad de la luz. Se requiere un cuarto satélite para sincronizar el reloj del receptor, resolviendo las cuatro incógnitas: latitud, longitud, altitud y hora.

Sistema de almacenamiento de energía magnética superconductor en un laboratorio para aplicaciones de física del estado sólido.

Almacenamiento de energía magnética superconductor (SMES)

Los sistemas de almacenamiento de energía magnética superconductora (SMES) almacenan energía en el campo magnético creado por el flujo de corriente continua en una bobina superconductora. La energía puede almacenarse indefinidamente siempre que la bobina se mantenga a temperaturas superconductoras, ya que prácticamente no hay pérdida de energía debido a la resistencia eléctrica. La energía almacenada viene dada por [latex]E = \frac{1}{2} L I^2[/latex].

Técnico de laboratorio midiendo índice de blancura de textiles utilizando espectrofotómetro en colorimetría.

Índice de blancura de Ganz-Griesser

El índice de blancura Ganz-Griesser es una fórmula lineal muy utilizada, especialmente en la industria textil. Se deriva de los valores triestímulos CIE y se define como [latex]W_{GG} = Y - Px - Qy + C[/latex], donde P, Q y C son constantes específicas del iluminante y del observador. Para la condición D65/10°, la fórmula es [latex]W_{GG} = Y - 1868,322x - 3695,690y + 1809,441[/latex].

Proceso de desmontaje de baterías de iones de litio en laboratorio de electroquímica.

Mecanismo de intercalación de iones de litio

Las baterías de iones de litio funcionan mediante un mecanismo de intercalación, una inserción reversible de iones en un material huésped estratificado. Durante la descarga, los iones de litio ([latex]Li^+[/latex]) se desintercalan de un electrodo negativo (ánodo), normalmente grafito, y se desplazan a través de un electrolito no acuoso para intercalarse en un electrodo positivo (cátodo), normalmente un óxido metálico. Los electrones viajan por el circuito externo, creando corriente.

Interfaz del sistema de gestión de batería que muestra métricas de profundidad de descarga para vehículos eléctricos.

Profundidad de descarga (DoD)

La profundidad de descarga (DoD) indica el porcentaje de la capacidad de una batería que se ha descargado. Es el inverso del estado de carga (SoC), donde el 100 % de DoD significa que la batería está descargada. La vida útil de una batería depende en gran medida de su DoD promedio; ciclos de DoD más bajos (por ejemplo, una descarga de solo el 80 % de su capacidad) aumentan significativamente la cantidad de ciclos que una batería puede soportar.

Ingenieros ensamblando sistemas microelectromecánicos en un entorno de sala limpia.

Leyes de escala de MEMS

Las leyes de escala de los MEMS describen cómo cambian las fuerzas y propiedades físicas a medida que las dimensiones de los dispositivos se reducen hasta la microescala. A diferencia del mundo macroscópico, dominado por la gravedad y la inercia, los microdominios se rigen por fuerzas superficiales como la tensión superficial, la viscosidad y las fuerzas electrostáticas. Por ejemplo, la fuerza debida a la gravedad escala con el volumen ([latex]L^3[/latex]), mientras que la fuerza electrostática escala con el área ([latex]L^2[/latex]), haciéndose relativamente más fuerte a tamaños más pequeños.

(Si la fecha es desconocida o no es relevante, por ejemplo "mecánica de fluidos", se proporciona una estimación redondeada de su aparición notable)