Machine Learning

ML algorithms, training, and inference

This Week's Best | Monthly Best | Guide | Trending

Top This Week

Machine Learning

I got tired of 3 AM PagerDuty alerts, so I built an AI agent to fix cloud outages while I sleep. (Built with GLM-5.1)

If you've ever been on-call, you know the nightmare. It’s 3:15 AM. You get pinged because heavily-loaded database nodes in us-east-1 are ...

Reddit - Artificial Intelligence · 1 min · 15 minutes ago

Llms

Attention Is All You Need, But All You Can't Afford | Hybrid Attention

Repo: https://codeberg.org/JohannaJuntos/Sisyphus I've been building a small Rust-focused language model from scratch in PyTorch. Not a f...

Reddit - Artificial Intelligence · 1 min · 15 minutes ago

Ai Infrastructure

UMKC Announces New Master of Science in Artificial Intelligence

UMKC announces a new Master of Science in Artificial Intelligence program aimed at addressing workforce demand for AI expertise, set to l...

AI News - General · 4 min · 31 minutes ago

All Content

Machine Learning

[2603.22518] High Resolution Flood Extent Detection Using Deep Learning with Random Forest Derived Training Labels

Abstract page for arXiv paper 2603.22518: High Resolution Flood Extent Detection Using Deep Learning with Random Forest Derived Training ...

arXiv - AI · 4 min · 13 days ago

Machine Learning

[2603.22401] Probabilistic modeling over permutations using quantum computers

Abstract page for arXiv paper 2603.22401: Probabilistic modeling over permutations using quantum computers

arXiv - Machine Learning · 4 min · 13 days ago

Llms

[2603.22510] Do Large Language Models Reduce Research Novelty? Evidence from Information Systems Journals

Abstract page for arXiv paper 2603.22510: Do Large Language Models Reduce Research Novelty? Evidence from Information Systems Journals

arXiv - AI · 3 min · 13 days ago

Llms

[2603.22492] Tiny Inference-Time Scaling with Latent Verifiers

Abstract page for arXiv paper 2603.22492: Tiny Inference-Time Scaling with Latent Verifiers

arXiv - AI · 4 min · 13 days ago

Llms

[2603.22479] Cognitive Training for Language Models: Towards General Capabilities via Cross-Entropy Games

Abstract page for arXiv paper 2603.22479: Cognitive Training for Language Models: Towards General Capabilities via Cross-Entropy Games

arXiv - AI · 3 min · 13 days ago

Llms

[2603.22473] Functional Component Ablation Reveals Specialization Patterns in Hybrid Language Model Architectures

Abstract page for arXiv paper 2603.22473: Functional Component Ablation Reveals Specialization Patterns in Hybrid Language Model Architec...

arXiv - AI · 3 min · 13 days ago

Llms

[2603.22355] Demystifying Low-Rank Knowledge Distillation in Large Language Models: Convergence, Generalization, and Information-Theoretic Guarantees

Abstract page for arXiv paper 2603.22355: Demystifying Low-Rank Knowledge Distillation in Large Language Models: Convergence, Generalizat...

arXiv - Machine Learning · 4 min · 13 days ago

Llms

[2603.22344] Errors in AI-Assisted Retrieval of Medical Literature: A Comparative Study

Abstract page for arXiv paper 2603.22344: Errors in AI-Assisted Retrieval of Medical Literature: A Comparative Study

arXiv - Machine Learning · 4 min · 13 days ago

Machine Learning

[2603.22342] Neutrino Oscillation Parameter Estimation Using Structured Hierarchical Transformers

Abstract page for arXiv paper 2603.22342: Neutrino Oscillation Parameter Estimation Using Structured Hierarchical Transformers

arXiv - Machine Learning · 4 min · 13 days ago

Llms

[2603.22446] Sparse but Critical: A Token-Level Analysis of Distributional Shifts in RLVR Fine-Tuning of LLMs

Abstract page for arXiv paper 2603.22446: Sparse but Critical: A Token-Level Analysis of Distributional Shifts in RLVR Fine-Tuning of LLMs

arXiv - AI · 4 min · 13 days ago

Llms

[2603.22330] Fair splits flip the leaderboard: CHANRG reveals limited generalization in RNA secondary-structure prediction

Abstract page for arXiv paper 2603.22330: Fair splits flip the leaderboard: CHANRG reveals limited generalization in RNA secondary-struct...

arXiv - Machine Learning · 3 min · 13 days ago

Machine Learning

[2603.23496] Estimating Flow Velocity and Vehicle Angle-of-Attack from Non-invasive Piezoelectric Structural Measurements Using Deep Learning

Abstract page for arXiv paper 2603.23496: Estimating Flow Velocity and Vehicle Angle-of-Attack from Non-invasive Piezoelectric Structural...

arXiv - Machine Learning · 4 min · 13 days ago

Machine Learning

[2603.23472] Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions

Abstract page for arXiv paper 2603.23472: Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions

arXiv - Machine Learning · 3 min · 13 days ago

Llms

[2603.22376] AI Co-Scientist for Ranking: Discovering Novel Search Ranking Models alongside LLM-based AI Agents with Cloud Computing Access

Abstract page for arXiv paper 2603.22376: AI Co-Scientist for Ranking: Discovering Novel Search Ranking Models alongside LLM-based AI Age...

arXiv - AI · 4 min · 13 days ago

Machine Learning

[2603.23436] Similarity-Aware Mixture-of-Experts for Data-Efficient Continual Learning

Abstract page for arXiv paper 2603.23436: Similarity-Aware Mixture-of-Experts for Data-Efficient Continual Learning

arXiv - Machine Learning · 4 min · 13 days ago

Llms

[2603.23414] SortedRL: Accelerating RL Training for LLMs through Online Length-Aware Scheduling

Abstract page for arXiv paper 2603.23414: SortedRL: Accelerating RL Training for LLMs through Online Length-Aware Scheduling

arXiv - AI · 4 min · 13 days ago

Machine Learning

[2603.23398] Graph Energy Matching: Transport-Aligned Energy-Based Modeling for Graph Generation

Abstract page for arXiv paper 2603.23398: Graph Energy Matching: Transport-Aligned Energy-Based Modeling for Graph Generation

arXiv - AI · 4 min · 13 days ago

Llms

[2603.22368] When Visuals Aren't the Problem: Evaluating Vision-Language Models on Misleading Data Visualizations

Abstract page for arXiv paper 2603.22368: When Visuals Aren't the Problem: Evaluating Vision-Language Models on Misleading Data Visualiza...

arXiv - AI · 4 min · 13 days ago

Machine Learning

[2603.23361] Central Dogma Transformer III: Interpretable AI Across DNA, RNA, and Protein

Abstract page for arXiv paper 2603.23361: Central Dogma Transformer III: Interpretable AI Across DNA, RNA, and Protein

arXiv - Machine Learning · 3 min · 13 days ago

Llms

[2603.23355] Off-Policy Value-Based Reinforcement Learning for Large Language Models

Abstract page for arXiv paper 2603.23355: Off-Policy Value-Based Reinforcement Learning for Large Language Models

arXiv - Machine Learning · 3 min · 13 days ago

Previous Page 130 Next

Stay updated with AI News

Get the latest news, tools, and insights delivered to your inbox.

Subscribe to Newsletter

Daily or weekly digest • Unsubscribe anytime

Machine Learning

Top This Week

I got tired of 3 AM PagerDuty alerts, so I built an AI agent to fix cloud outages while I sleep. (Built with GLM-5.1)

Attention Is All You Need, But All You Can't Afford | Hybrid Attention

UMKC Announces New Master of Science in Artificial Intelligence

All Content

[2603.22518] High Resolution Flood Extent Detection Using Deep Learning with Random Forest Derived Training Labels

[2603.22401] Probabilistic modeling over permutations using quantum computers

[2603.22510] Do Large Language Models Reduce Research Novelty? Evidence from Information Systems Journals

[2603.22492] Tiny Inference-Time Scaling with Latent Verifiers

[2603.22479] Cognitive Training for Language Models: Towards General Capabilities via Cross-Entropy Games

[2603.22473] Functional Component Ablation Reveals Specialization Patterns in Hybrid Language Model Architectures

[2603.22355] Demystifying Low-Rank Knowledge Distillation in Large Language Models: Convergence, Generalization, and Information-Theoretic Guarantees

[2603.22344] Errors in AI-Assisted Retrieval of Medical Literature: A Comparative Study

[2603.22342] Neutrino Oscillation Parameter Estimation Using Structured Hierarchical Transformers

[2603.22446] Sparse but Critical: A Token-Level Analysis of Distributional Shifts in RLVR Fine-Tuning of LLMs

[2603.22330] Fair splits flip the leaderboard: CHANRG reveals limited generalization in RNA secondary-structure prediction

[2603.23496] Estimating Flow Velocity and Vehicle Angle-of-Attack from Non-invasive Piezoelectric Structural Measurements Using Deep Learning

[2603.23472] Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions

[2603.22376] AI Co-Scientist for Ranking: Discovering Novel Search Ranking Models alongside LLM-based AI Agents with Cloud Computing Access

[2603.23436] Similarity-Aware Mixture-of-Experts for Data-Efficient Continual Learning

[2603.23414] SortedRL: Accelerating RL Training for LLMs through Online Length-Aware Scheduling

[2603.23398] Graph Energy Matching: Transport-Aligned Energy-Based Modeling for Graph Generation

[2603.22368] When Visuals Aren't the Problem: Evaluating Vision-Language Models on Misleading Data Visualizations

[2603.23361] Central Dogma Transformer III: Interpretable AI Across DNA, RNA, and Protein

[2603.23355] Off-Policy Value-Based Reinforcement Learning for Large Language Models

Related Topics

Stay updated with AI News