Ultime pubblicazioni e brevetti sui modelli linguistici di piccole dimensioni (SLM)

This week: aluminum alloy, selective laser melting, intermetallic lamellae, high-strength, Quantization, LoRA, fine-tuning, LLM, marine machine equipment, operational advice, Small Language Model, real-time data, speculative decoding, LLM inference, token sequence selection, text data statistics, mechanism synthesis, deep learning, contrastive graph learning, optimization stability, Fine-Tuning, Discrete Wavelet Transform, Low-Rank Adaptation, Automatic Speech Recognition, Selective Laser Melting, Surface Roughness, Process Parameters, Response Surface Methodology, LLM, semantic inference, spatial analysis, fine-grained POI

Giugno 18, 2026

Intelligenza artificiale (IA), Apprendimento profondo, Inferenza dell'intelligenza artificiale sui bordi, Sistemi integrati, Trasformatore generativo preaddestrato (GPT), Apprendimento automatico, Elaborazione del linguaggio naturale (NLP), Rete neurale, Sistema su chip (SoC)

Suggerimento: oltre alla selezione sottostante, è possibile cercare e filtrare i nostri 2 interi database:

> strumento di ricerca di pubblicazioni gratuite < per autore, argomento, parole chiave, data o rivista.

> strumento di ricerca brevetti gratuito < per brevetti in inglese dall'Ufficio europeo dei brevetti.

I modelli linguistici di piccole dimensioni designano i sistemi di elaborazione del linguaggio naturale basati su transformer che operano al di sotto di circa 7 miliardi di parametri: una soglia definita meno da un confine formale che dal vincolo pratico di implementabilità su hardware di consumo, dispositivi mobili e sistemi embedded senza infrastruttura di inferenza cloud.

Questo ambito di ricerca è emerso come risposta diretta ai costi computazionali ed economici dei modelli di frontiera: sebbene le architetture con oltre un miliardo di parametri dimostrino un'ampia capacità generale, il loro ingombro di memoria, la latenza di inferenza e il consumo energetico le rendono strutturalmente incompatibili con l'implementazione su dispositivo, le applicazioni sensibili alla privacy e i contesti operativi a bassa larghezza di banda o offline.

Il programma di ricerca centrale mira a colmare il divario di capacità tra modelli compatti e modelli di frontiera attraverso una combinazione di distillazione della conoscenza (addestramento di un modello studente più piccolo rispetto alle distribuzioni di output di un modello insegnante più grande), potatura strutturata e non strutturata, quantizzazione aggressiva dei pesi fino alle rappresentazioni INT4 e INT8 e metodi di fine-tuning efficienti in termini di parametri come LoRA e QLoRA, che adattano un modello base compresso a compiti specifici del dominio con un costo computazionale aggiuntivo minimo.

Le pubblicazioni e i brevetti elencati di seguito trattano tecniche di compressione dei modelli, algoritmi di quantizzazione, protocolli di distillazione, architetture di trasformatori efficienti, ottimizzazione dell'inferenza su dispositivo e pipeline di fine-tuning specifiche per dominio:

Questa è la nostra ultima selezione di pubblicazioni e brevetti in inglese su Small Language Models (SLM), tra numerose riviste scientifiche online, classificate e focalizzate su small language model, SLM, on-device language model, edge language model, compact transformer, sub-7B parameter model, language model compression, knowledge distillation NLP, structured pruning language model, modello linguistico di potatura non strutturato, modello linguistico di quantizzazione del peso, NLP di quantizzazione INT4, NLP di quantizzazione INT8, fine-tuning efficiente dei parametri, fine-tuning LoRA, fine-tuning QLoRA, modello linguistico di sintonizzazione dell'adattatore, inferenza su dispositivo, NLP di inferenza sul bordo, decodifica speculativa, trasformatore di distillazione del modello, formato di quantizzazione GGUF e modello compatto misto di esperti.

Deformable high-strength aluminum alloy compositions and methods of making the same

Patent published on the 2026-06-04 in US under Ref US20260152827 by PURDUE RES FOUNDATION [US] (Zhang Xinghang [us], Wang Haiyan [us], Stegman Benjamin Thomas [us], Shang Anyu [us])

Abstract: [0000] An alloy comprising 92 at % aluminum, 2 at % titanium, 2 at % iron, 2 at % cobalt, and 2 at % nickel. A method of making an alloy is disclosed. The method contains the steps of providing particles of desired composition, utilizing a selective leaser melting (SLM) apparatus producing a first layer of the particles on a substrate and melting and solidifying a first group selected areas of the layer of particles, wherein the melting and the solidification results in an alloy of desired compo[...]

Our summary: The content describes a high-strength aluminum alloy with specific composition percentages. It outlines a method for creating the alloy using selective laser melting to achieve desired thickness and shape. The process involves layering particles, melting, and solidifying selected areas to form intermetallic structures.

aluminum alloy, selective laser melting, intermetallic lamellae, high-strength

Patent

Quantization-aware lora fine-tuning for llm

Patent published on the 2026-06-04 in US under Ref US20260154540 by MEDIATEK SINGAPORE PTE LTD [SG] (Lim Jia Yao Christopher [sg], Huang Ya-lin [tw], Li Huai-ting [tw], Wong Wai Mun [sg], Liang Jen-wei [tw], Lee Timothy Jun Jie [sg])

Abstract: [0000] In an aspect of the disclosure, a method of using a LoRA for inference with a FC layer of a LLM is provided. The method includes: dequantizing an INT input to an FP output; processing the FP output from the DQ and a first FP input from first weights of a down projection module of the LoRA, to output a first FP output; processing the first FP output from the first BMM and a second FP input from second weights of an up projection module of the LoRA, to output a second FP output; quantizing [...]

Our summary: The method describes using LoRA for inference in a fully connected layer of a large language model. It involves dequantizing inputs, processing them through down and up projection modules, and quantizing outputs. The final output is an INT inference result derived from the LoRA adjustments.

Quantization, LoRA, fine-tuning, LLM

Patent

Systems and methods for assisting operation and maintenance of marine machine equipment

Patent published on the 2026-06-03 in EP under Ref EP4752805 by ALFA LAVAL CORP AB [SE] (Karlsson Jimmie [se], Boman Jesper [se])

Abstract: [0001] The present invention relates to a method of operating and maintaining a piece of marine machine equipment. The piece of marine machine equipment is connected to a local processor. The method comprising the steps of obtaining a set of training data specific to the piece of marine machine equipment and training a Small Language Model (SLM) with the set of training data specific to the piece of marine machine equipment. The method further comprising the step of executing the trained SLM on [...]

Our summary: The invention describes a method for operating and maintaining marine machine equipment using a local processor. It involves training a Small Language Model (SLM) with specific training data for the equipment. The trained SLM provides offline operational advice utilizing real-time data from the equipment.

marine machine equipment, operational advice, Small Language Model, real-time data

Patent

Parameter-free method for efficient and accurate llm inference acceleration via speculative decoding

Patent published on the 2026-05-07 in WO under Ref WO2026092843 by MARZOLLO MICHELE [DE] (Marzollo Michele [de], Mueller Lorenz [de], Zhuang Jiawei [de], Roemer Niklas [de], Cavigelli Lukas [de])

Abstract: In some examples, apparatus and methods are provided for selecting a draft token sequence for verification by using a large language model, LLM. Different sources of statistics on text data (prompt, generated output, large dataset of text data) can be utilized in order to choose candidates to use for speculative decoding via look-ups.[...]

Our summary: This method accelerates LLM inference without parameters by using speculative decoding. It selects draft token sequences for verification through statistical analysis of text data. The approach utilizes various sources of statistics to optimize candidate selection for decoding.

speculative decoding, LLM inference, token sequence selection, text data statistics

Patent

Automated synthesis of planar linkage mechanisms with diverse joint types via spring-connected link models and contrastive graph learning

Published on 2026-03-28 by @OXFORD

Abstract: AbstractThe automated synthesis of planar linkage mechanisms has long been a challenge in mechanism design, requiring both geometric feasibility and motion accuracy. Recent advances in data-driven and neural network–based methods have shown promise in automating linkage synthesis, improving efficiency and scalability compared to traditional analytical or optimization-based techniques. Nevertheless, existing data-driven approaches remain limited in handling diverse joint configurations and ofte[...]

Our summary: This study presents a framework for automating the synthesis of planar linkage mechanisms using deep learning and physics-based modeling. It employs a spring-connected link model for diverse joint configurations and utilizes contrastive graph learning for efficient linkage retrieval. The method demonstrates improved accuracy and optimization stability compared to traditional approaches.

mechanism synthesis, deep learning, contrastive graph learning, optimization stability

Publication

Enhancing Whisper Fine-Tuning with Discrete Wavelet Transform-Based LoRA Initialization

Published on 2026-01-29 by Liang Lan, Molin Fang, Yuxuan Chen, Daliang Wang, Wenyong Wang @MDPI

Abstract: In low-resource automatic speech recognition (ASR) scenarios, parameter-efficient fine-tuning (PEFT) has become a crucial approach for adapting large pre-trained speech models. Although low-rank adaptation (LoRA) offers clear advantages in efficiency, stability, and deployment friendliness, its performance remains constrained because random initialization fails to capture the time&ndash;frequency structural characteristics of speech signals. To address this limitation, this work proposes[...]

Our summary: This work introduces a structured initialization mechanism combining LoRA with discrete wavelet transform for fine-tuning in low-resource ASR. The proposed DWTLoRA method enhances convergence speed, stability, and accuracy by aligning with speech signal characteristics. Experimental results show DWTLoRA outperforms standard LoRA and other PEFT methods in character error rate and training efficiency.

Fine-Tuning, Discrete Wavelet Transform, Low-Rank Adaptation, Automatic Speech Recognition

Publication

Influence and Optimization of Process Parameters on Surface Roughness of Selective Laser Melting of 316L Stainless Steel

Published on 2026-01-20 by Pin Dong, Kamonpong Jamkamon, Suppawat Chuvaree @MDPI

Abstract: To achieve better surface quality in selective laser melting (SLM), this study used 316L stainless steel powder and conducted a systematic design experiment to investigate the influence mechanism of process parameters on the surface roughness of the top and vertical surfaces. Response surface methodology (RSM) was then used for parameter optimization. The results showed that scanning speed has the greatest impact on surface roughness, followed by laser power, while scanning spacing has the least[...]

Our summary: This study investigates the impact of process parameters on the surface roughness of 316L stainless steel in selective laser melting. Scanning speed significantly affects surface quality, with optimal conditions identified for minimal roughness. The findings validate the effectiveness of the response surface methodology used for parameter optimization.

Selective Laser Melting, Surface Roughness, Process Parameters, Response Surface Methodology

Publication

A Lightweight LLM-Based Semantic–Spatial Inference Framework for Fine-Grained Urban POI Analysis

Published on 2026-01-16 by Zhuo Huang, Yixing Guo, Shuo Huang, Miaoxi Zhao @MDPI

Abstract: Unstructured POI name texts are widely used in fine-grained urban analysis, yet missing labels and semantic ambiguity often limit their value for spatial inference. This study proposes a large language model-based semantic&ndash;spatial inference framework (LLM-SSIF), a lightweight semantic&ndash;spatial pipeline that translates POI texts into interpretable, fine-grained spatial evidence through an end-to-end workflow that couples scalable label expansion with scale-controlled sp[...]

Our summary: This study introduces LLM-SSIF, a lightweight framework for translating unstructured POI texts into spatial evidence. It employs LoRA-based fine-tuning for efficient adaptation and enhances label coverage. The model demonstrates strong performance in urban analysis, revealing cultural differences between cities.

LLM, semantic inference, spatial analysis, fine-grained POI

Publication

Argomenti trattati: Modelli linguistici di piccole dimensioni, elaborazione del linguaggio naturale, sistemi basati su trasformatori, efficienza dei parametri, distillazione della conoscenza, compressione dei modelli, potatura strutturata, potatura non strutturata, quantizzazione dei pesi, INT4, INT8, metodi di regolazione fine, distribuzione sul dispositivo, latenza dell'inferenza, consumo energetico, applicazioni sensibili alla privacy, operazioni a bassa larghezza di banda, contesti operativi non in linea, IEEE 80211, ISO/IEC 30170, ISO/IEC 27001, ISO/IEC 25010 e NIST SP 800-53.

Glossario dei termini utilizzati

Natural Language Processing (NLP): Un campo dell'intelligenza artificiale incentrato sull'interazione tra computer e linguaggio umano, che consente alle macchine di comprendere, interpretare e generare testo o discorso in linguaggio naturale. Comprende attività come la traduzione linguistica, l'analisi del sentiment e il riconoscimento vocale.

Small Language Models (SLM): Reti neurali compatte progettate per attività di elaborazione del linguaggio naturale, tipicamente caratterizzate da un numero inferiore di parametri e requisiti computazionali ridotti rispetto a modelli più grandi, pur essendo in grado di generare testo coerente e comprendere il contesto entro ambiti limitati.

Contesto storico

Sistema laser a bloccaggio di modalità in un moderno laboratorio di ottica.

Mode-locking (lasers)

Il mode-locking è una tecnica per produrre impulsi laser estremamente brevi, dell'ordine dei picosecondi ([latex]10^{-12}[/latex] s) e dei femtosecondi ([latex]10^{-15}[/latex] s). Funziona forzando i numerosi modi longitudinali della cavità laser a oscillare con una relazione di fase fissa. Questo fa sì che i modi interferiscano in modo costruttivo, creando un singolo impulso intenso e ultracorto che circola nella cavità.

Ricercatore che utilizza un mulino a sfere per la sintesi top-down di nanomateriali in una camera bianca.

Sintesi di nanomateriali dall'alto verso il basso

La sintesi top-down prevede la creazione di nanomateriali partendo da un materiale più grande e sfuso e scomponendolo o modellandolo fino alla scala nanometrica. Le tecniche chiave includono metodi meccanici come la macinazione a sfere e metodi litografici come la fotolitografia, la litografia a fascio elettronico e la litografia a nanoimpronta. Questi metodi sono spesso utilizzati per creare superfici strutturate e circuiti integrati, ma possono presentare imperfezioni superficiali.

Sistema di accumulo di energia a volano in applicazioni meccaniche industriali.

Accumulo di energia a volano (FES)

L'accumulo di energia su volano (FES) funziona accelerando un rotore (volano) a una velocità molto elevata e mantenendo l'energia nel sistema come energia cinetica di rotazione. L'energia immagazzinata è proporzionale al quadrato della velocità di rotazione. Quando l'energia viene estratta, la rotazione del volano rallenta. La formula dell'energia immagazzinata è [latex]E = \frac{1}{2} I \omega^2[/latex], dove I è il momento di inerzia e ω è la velocità angolare.

Componenti elettronici molecolari in un ambiente di laboratorio, tra cui fili e interruttori molecolari.

Elettronica molecolare

L'elettronica molecolare esplora l'utilizzo di singole molecole o di insiemi molecolari su scala nanometrica come componenti elettronici fondamentali. Questo approccio mira a costruire circuiti al limite estremo della miniaturizzazione, ben oltre la tradizionale tecnologia basata sul silicio. I componenti chiave includono fili molecolari, interruttori e raddrizzatori, che sfruttano proprietà della meccanica quantistica come l'effetto tunnel degli elettroni attraverso gli orbitali molecolari per il loro funzionamento.

Ingegneri che analizzano i componenti microelettronici per verificarne la fatica termica e l'elettromigrazione.

Fisica del guasto (PoF)

La fisica dei guasti (Physics of Failure, PoF) è un approccio ingegneristico all'affidabilità che utilizza le conoscenze della scienza dei materiali e della fisica per comprendere e modellare i meccanismi alla radice dei guasti. Invece di basarsi esclusivamente sui dati statistici dei guasti passati, si concentra sulla previsione dei guasti analizzando i processi fisici (ad esempio, fatica, corrosione, creep) che portano al degrado e alla rottura.

Analisi di laboratorio dei punti quantici che dimostrano l'effetto della dimensione quantistica nella fisica dei semiconduttori.

Quantum Size Effect in Nanomaterials

L'effetto di dimensione quantistica descrive il fenomeno per cui le proprietà elettroniche e ottiche di un materiale cambiano quando le sue dimensioni si avvicinano alla scala nanometrica. Quando le dimensioni di un materiale diventano paragonabili alla lunghezza d'onda di de Broglie dell'elettrone, si verifica un confinamento quantistico. Questo quantizza i livelli energetici degli elettroni, portando a un band gap dipendente dalle dimensioni, [latex]E_g(R) ´approssimativamente E_{g,\b\u\lk} + \frac{\hbar^2\pi^2}{2R^2}(\frac{1}{m_e^*} + \frac{1}{m_h^*})[/latex].

Igrometro ad alta precisione in laboratorio per la misurazione dei fattori di aumento della pressione del vapore.

Fattore di miglioramento della pressione del vapore

La pressione di vapore di equilibrio dell'acqua su una superficie liquida in aria umida ([latex]p^*_{H_2O,a}[/latex]) è leggermente superiore alla pressione di vapore di equilibrio su una superficie di acqua pura ([latex]p^*_{H_2O}[/latex]). Questa differenza è quantificata dal fattore di potenziamento del vapore acqueo, [latex]f_w[/latex], che dipende dalla temperatura e dalla pressione dell'aria umida. La relazione è [latex]p^*_{H_2O,a} = f_w(T, p_{ms}) \cdot p^*_{H_2O}[/latex].

1965

1970

1974-11-15

1980

1964

1968

1970

1975

1980

Analisi di laboratorio di fosfori di vanadato di ittrio drogati con europio per applicazioni televisive a colori.

Fosfori di europio per la televisione a colori

La scoperta che il vanadato di ittrio drogato di europio ([latex]YVO_4:Eu^{3+}[/latex]) poteva fungere da fosforo rosso brillante è stata una svolta fondamentale per la televisione a colori. Prima di allora, i fosfori rossi erano deboli e davano luogo a colori spenti. L'emissione rossa intensa e a banda stretta dello ione [latex]Eu^{3+}[/latex] ha permesso di ottenere display dai colori brillanti e vivaci, migliorando drasticamente la qualità della TV a colori e stabilendo lo standard per la tecnologia dei display.

Curve di Bézier

Sviluppato dall'ingegnere francese Pierre Bézier per Renault negli anni '60, UNISURF è stato uno dei primi veri sistemi CAD/CAM 3D. La sua principale innovazione è stata l'utilizzo di quelle che oggi sono note come curve e superfici di Bézier. Si tratta di curve parametriche definite da un insieme di punti di controllo, che consentono la creazione intuitiva e matematica di forme libere complesse per le carrozzerie delle auto.

Ricevitore GPS che visualizza i segnali satellitari e le misurazioni della distanza nella fisica delle onde radio.

Principio di trilaterazione GPS

Il GPS determina la posizione di un ricevitore tramite trilaterazione. Misurando la distanza di almeno tre satelliti, il ricevitore può individuare la sua posizione sulla superficie terrestre. La distanza viene calcolata moltiplicando il tempo di percorrenza del segnale per la velocità della luce. Un quarto satellite è necessario per sincronizzare l'orologio del ricevitore, risolvendo le quattro incognite: latitudine, longitudine, altitudine e ora.

Sistema di accumulo di energia magnetica superconduttiva in un laboratorio per applicazioni di fisica dello stato solido.

Accumulo di energia magnetica superconduttiva (SMES)

I sistemi di accumulo di energia magnetica superconduttiva (SMES) immagazzinano energia nel campo magnetico creato dal flusso di corrente continua in una bobina superconduttiva. L'energia può essere immagazzinata indefinitamente finché la bobina viene mantenuta a temperature di superconduzione, in quanto non vi è praticamente alcuna perdita di energia dovuta alla resistenza elettrica. L'energia immagazzinata è data da [latex]E = \frac{1}{2} L I^2[/latex].

Tecnico di laboratorio che misura l'indice di bianchezza dei tessuti utilizzando uno spettrofotometro in colorimetria.

Indice di bianchezza Ganz-Griesser

L'indice di bianchezza Ganz-Griesser è una formula lineare ampiamente utilizzata, in particolare nell'industria tessile. Deriva dai valori tristimolo CIE ed è definito come [latex]W_{GG} = Y - Px - Qy + C[/latex], dove P, Q e C sono costanti specifiche dell'illuminante e dell'osservatore. Per la condizione D65/10°, la formula è [latex]W_{GG} = Y - 1868,322x - 3695,690y + 1809,441[/latex].

Processo di smontaggio della batteria agli ioni di litio nel laboratorio di elettrochimica.

Meccanismo di intercalazione degli ioni di litio

Le batterie agli ioni di litio funzionano attraverso un meccanismo di intercalazione, un inserimento reversibile di ioni in un materiale ospite stratificato. Durante la scarica, gli ioni di litio ([latex]Li^+[/latex]) si deintercalano da un elettrodo negativo (anodo), tipicamente grafite, e si muovono attraverso un elettrolita non acquoso per intercalarsi in un elettrodo positivo (catodo), tipicamente un ossido metallico. Gli elettroni viaggiano attraverso il circuito esterno, creando corrente.

Interfaccia del sistema di gestione della batteria che mostra le metriche della profondità di scarica per i veicoli elettrici.

Profondità di scarica (DoD)

La profondità di scarica (DoD) indica la percentuale di capacità di una batteria che è stata scaricata. È l'inverso dello stato di carica (SoC), dove un DoD del 100% indica che la batteria è scarica. La durata di una batteria dipende fortemente dalla sua DoD media; cicli DoD inferiori (ad esempio, scaricando solo l'80% della capacità) aumentano significativamente il numero di cicli che una batteria può sopportare.

Ingegneri che assemblano sistemi microelettromeccanici in un ambiente di camera bianca.

Leggi di scala MEMS

Le leggi di scala dei MEMS descrivono come cambiano le forze fisiche e le proprietà quando le dimensioni del dispositivo si riducono alla microscala. A differenza del mondo macroscopico, dominato dalla gravità e dall'inerzia, i microdomini sono governati da forze superficiali come la tensione superficiale, la viscosità e le forze elettrostatiche. Per esempio, la forza dovuta alla gravità scala con il volume ([latex]L^3[/latex]), mentre la forza elettrostatica scala con l'area ([latex]L^2[/latex]), diventando relativamente più forte alle dimensioni più piccole.

(se la data è sconosciuta o non rilevante, ad esempio "meccanica dei fluidi", viene fornita una stima approssimativa della sua notevole comparsa)

Ultime pubblicazioni e brevetti sui modelli linguistici di piccole dimensioni (SLM)

Deformable high-strength aluminum alloy compositions and methods of making the same

Quantization-aware lora fine-tuning for llm

Systems and methods for assisting operation and maintenance of marine machine equipment

Parameter-free method for efficient and accurate llm inference acceleration via speculative decoding

Automated synthesis of planar linkage mechanisms with diverse joint types via spring-connected link models and contrastive graph learning

Enhancing Whisper Fine-Tuning with Discrete Wavelet Transform-Based LoRA Initialization

Influence and Optimization of Process Parameters on Surface Roughness of Selective Laser Melting of 316L Stainless Steel

A Lightweight LLM-Based Semantic–Spatial Inference Framework for Fine-Grained Urban POI Analysis

Glossario dei termini utilizzati

Contesto storico

Articoli e post più popolari

La guida del dittatore alla gestione del mercato (o l'arte di essere sia giocatore che arbitro)

Prodotto minimo praticabile (MVP): consigli professionali

I 10 migliori errori di progettazione da evitare

90 principi meccanici per ottenere soluzioni di progettazione intelligenti

Le forme seguono la funzione... soprattutto nel design del prodotto

Meno è di più. Perché vuoi progettare in modo semplice

Strumenti originali di alta qualità

Elenco di proxy gratuiti (aggiornato continuamente)

Editor di formule LaTeX

Concept Explorer™ di Innovation.world

Il Design Review Tree™ (DRT): Ricontrollare il Design del Prodotto

Ricerca gratuita dei brevetti più recenti

Ricerca gratuita delle ultime pubblicazioni scientifiche