Large Language Models

GPT, Claude, Gemini, and other LLMs

This Week's Best | Monthly Best | Guide | Trending

Top This Week

Llms

An attack class that passes every current LLM filter - no payload, no injection signature, no log trace

https://shapingrooms.com/research I published a paper today on something I've been calling postural manipulation. The short version: ordi...

Reddit - Artificial Intelligence · 1 min · 31 minutes ago

Llms

[R] An attack class that passes every current LLM filter - no payload, no injection signature, no log trace

https://shapingrooms.com/research I've been documenting what I'm calling postural manipulation: a specific class of language that install...

Reddit - Machine Learning · 1 min · about 1 hour ago

Llms

What does Gemini think of you?

I noticed that Gemini was referring back to a lot of queries I've made in the past and was using that knowledge to drive follow up prompt...

Reddit - Artificial Intelligence · 1 min · about 3 hours ago

All Content

Llms

[2603.23004] Can Large Language Models Reason and Optimize Under Constraints?

Abstract page for arXiv paper 2603.23004: Can Large Language Models Reason and Optimize Under Constraints?

arXiv - AI · 3 min · 5 days ago

Llms

[2603.22978] JFTA-Bench: Evaluate LLM's Ability of Tracking and Analyzing Malfunctions Using Fault Trees

Abstract page for arXiv paper 2603.22978: JFTA-Bench: Evaluate LLM's Ability of Tracking and Analyzing Malfunctions Using Fault Trees

arXiv - AI · 3 min · 5 days ago

Llms

[2603.22942] Optimizing Small Language Models for NL2SQL via Chain-of-Thought Fine-Tuning

Abstract page for arXiv paper 2603.22942: Optimizing Small Language Models for NL2SQL via Chain-of-Thought Fine-Tuning

arXiv - AI · 3 min · 5 days ago

Llms

[2603.22370] FAAR: Format-Aware Adaptive Rounding for NVFP4

Abstract page for arXiv paper 2603.22370: FAAR: Format-Aware Adaptive Rounding for NVFP4

arXiv - AI · 4 min · 5 days ago

Llms

[2603.22935] Ran Score: a LLM-based Evaluation Score for Radiology Report Generation

Abstract page for arXiv paper 2603.22935: Ran Score: a LLM-based Evaluation Score for Radiology Report Generation

arXiv - AI · 4 min · 5 days ago

Llms

[2603.22934] ProGRank: Probe-Gradient Reranking to Defend Dense-Retriever RAG from Corpus Poisoning

Abstract page for arXiv paper 2603.22934: ProGRank: Probe-Gradient Reranking to Defend Dense-Retriever RAG from Corpus Poisoning

arXiv - AI · 4 min · 5 days ago

Llms

[2603.22904] Separating Diagnosis from Control: Auditable Policy Adaptation in Agent-Based Simulations with LLM-Based Diagnostics

Abstract page for arXiv paper 2603.22904: Separating Diagnosis from Control: Auditable Policy Adaptation in Agent-Based Simulations with ...

arXiv - AI · 3 min · 5 days ago

Llms

[2603.22352] WIST: Web-Grounded Iterative Self-Play Tree for Domain-Targeted Reasoning Improvement

Abstract page for arXiv paper 2603.22352: WIST: Web-Grounded Iterative Self-Play Tree for Domain-Targeted Reasoning Improvement

arXiv - AI · 4 min · 5 days ago

Llms

[2603.22871] Dynamical Systems Theory Behind a Hierarchical Reasoning Model

Abstract page for arXiv paper 2603.22871: Dynamical Systems Theory Behind a Hierarchical Reasoning Model

arXiv - AI · 4 min · 5 days ago

Llms

[2603.22869] Chain-of-Authorization: Internalizing Authorization into Large Language Models via Reasoning Trajectories

Abstract page for arXiv paper 2603.22869: Chain-of-Authorization: Internalizing Authorization into Large Language Models via Reasoning Tr...

arXiv - AI · 4 min · 5 days ago

Llms

[2603.22339] Problems with Chinchilla Approach 2: Systematic Biases in IsoFLOP Parabola Fits

Abstract page for arXiv paper 2603.22339: Problems with Chinchilla Approach 2: Systematic Biases in IsoFLOP Parabola Fits

arXiv - Machine Learning · 4 min · 5 days ago

Llms

[2603.22333] Graph Signal Processing Meets Mamba2: Adaptive Filter Bank via Delta Modulation

Abstract page for arXiv paper 2603.22333: Graph Signal Processing Meets Mamba2: Adaptive Filter Bank via Delta Modulation

arXiv - AI · 3 min · 5 days ago

Llms

[2603.22332] Large Language Models for Missing Data Imputation: Understanding Behavior, Hallucination Effects, and Control Mechanisms

Abstract page for arXiv paper 2603.22332: Large Language Models for Missing Data Imputation: Understanding Behavior, Hallucination Effect...

arXiv - AI · 4 min · 5 days ago

Llms

[2603.22829] Improving Safety Alignment via Balanced Direct Preference Optimization

Abstract page for arXiv paper 2603.22829: Improving Safety Alignment via Balanced Direct Preference Optimization

arXiv - AI · 3 min · 5 days ago

Llms

[2603.22329] Trained Persistent Memory for Frozen Decoder-Only LLMs

Abstract page for arXiv paper 2603.22329: Trained Persistent Memory for Frozen Decoder-Only LLMs

arXiv - AI · 4 min · 5 days ago

Llms

[2603.22777] AgriPestDatabase-v1.0: A Structured Insect Dataset for Training Agricultural Large Language Model

Abstract page for arXiv paper 2603.22777: AgriPestDatabase-v1.0: A Structured Insect Dataset for Training Agricultural Large Language Model

arXiv - AI · 4 min · 5 days ago

Llms

[2603.22767] Can LLM Agents Generate Real-World Evidence? Evaluating Observational Studies in Medical Databases

Abstract page for arXiv paper 2603.22767: Can LLM Agents Generate Real-World Evidence? Evaluating Observational Studies in Medical Databases

arXiv - AI · 4 min · 5 days ago

Llms

[2603.22324] DAQ: Delta-Aware Quantization for Post-Training LLM Weight Compression

Abstract page for arXiv paper 2603.22324: DAQ: Delta-Aware Quantization for Post-Training LLM Weight Compression

arXiv - AI · 3 min · 5 days ago

Llms

[2603.22744] Beyond Binary Correctness: Scaling Evaluation of Long-Horizon Agents on Subjective Enterprise Tasks

Abstract page for arXiv paper 2603.22744: Beyond Binary Correctness: Scaling Evaluation of Long-Horizon Agents on Subjective Enterprise T...

arXiv - AI · 4 min · 5 days ago

Llms

[2603.22651] Benchmarking Multi-Agent LLM Architectures for Financial Document Processing: A Comparative Study of Orchestration Patterns, Cost-Accuracy Tradeoffs and Production Scaling Strategies

Abstract page for arXiv paper 2603.22651: Benchmarking Multi-Agent LLM Architectures for Financial Document Processing: A Comparative Stu...

arXiv - AI · 4 min · 5 days ago

Previous Page 26 Next

Stay updated with AI News

Get the latest news, tools, and insights delivered to your inbox.

Subscribe to Newsletter

Daily or weekly digest • Unsubscribe anytime

Large Language Models

Top This Week

An attack class that passes every current LLM filter - no payload, no injection signature, no log trace

[R] An attack class that passes every current LLM filter - no payload, no injection signature, no log trace

What does Gemini think of you?

All Content

[2603.23004] Can Large Language Models Reason and Optimize Under Constraints?

[2603.22978] JFTA-Bench: Evaluate LLM's Ability of Tracking and Analyzing Malfunctions Using Fault Trees

[2603.22942] Optimizing Small Language Models for NL2SQL via Chain-of-Thought Fine-Tuning

[2603.22370] FAAR: Format-Aware Adaptive Rounding for NVFP4

[2603.22935] Ran Score: a LLM-based Evaluation Score for Radiology Report Generation

[2603.22934] ProGRank: Probe-Gradient Reranking to Defend Dense-Retriever RAG from Corpus Poisoning

[2603.22904] Separating Diagnosis from Control: Auditable Policy Adaptation in Agent-Based Simulations with LLM-Based Diagnostics

[2603.22352] WIST: Web-Grounded Iterative Self-Play Tree for Domain-Targeted Reasoning Improvement

[2603.22871] Dynamical Systems Theory Behind a Hierarchical Reasoning Model

[2603.22869] Chain-of-Authorization: Internalizing Authorization into Large Language Models via Reasoning Trajectories

[2603.22339] Problems with Chinchilla Approach 2: Systematic Biases in IsoFLOP Parabola Fits

[2603.22333] Graph Signal Processing Meets Mamba2: Adaptive Filter Bank via Delta Modulation

[2603.22332] Large Language Models for Missing Data Imputation: Understanding Behavior, Hallucination Effects, and Control Mechanisms

[2603.22829] Improving Safety Alignment via Balanced Direct Preference Optimization

[2603.22329] Trained Persistent Memory for Frozen Decoder-Only LLMs

[2603.22777] AgriPestDatabase-v1.0: A Structured Insect Dataset for Training Agricultural Large Language Model

[2603.22767] Can LLM Agents Generate Real-World Evidence? Evaluating Observational Studies in Medical Databases

[2603.22324] DAQ: Delta-Aware Quantization for Post-Training LLM Weight Compression

[2603.22744] Beyond Binary Correctness: Scaling Evaluation of Long-Horizon Agents on Subjective Enterprise Tasks

[2603.22651] Benchmarking Multi-Agent LLM Architectures for Financial Document Processing: A Comparative Study of Orchestration Patterns, Cost-Accuracy Tradeoffs and Production Scaling Strategies

Related Topics

Stay updated with AI News