Generative AI

Image, video, audio, and text generation

This Week's Best | Monthly Best | Guide | Trending

RSS

Top This Week

Generative Ai

[2602.08277] PISCO: Precise Video Instance Insertion with Sparse Control

Abstract page for arXiv paper 2602.08277: PISCO: Precise Video Instance Insertion with Sparse Control

arXiv - AI · 4 min · about 16 hours ago

Machine Learning

[2511.18746] Any4D: Open-Prompt 4D Generation from Natural Language and Images

Abstract page for arXiv paper 2511.18746: Any4D: Open-Prompt 4D Generation from Natural Language and Images

arXiv - AI · 4 min · about 16 hours ago

Llms

[2512.14549] Dual-objective Language Models: Training Efficiency Without Overfitting

Abstract page for arXiv paper 2512.14549: Dual-objective Language Models: Training Efficiency Without Overfitting

arXiv - AI · 3 min · about 16 hours ago

All Content

Generative Ai

[2508.12811] Next Visual Granularity Generation

Abstract page for arXiv paper 2508.12811: Next Visual Granularity Generation

arXiv - Machine Learning · 4 min · 28 days ago

Machine Learning

[2508.04663] HierarchicalPrune: Position-Aware Compression for Large-Scale Diffusion Models

Abstract page for arXiv paper 2508.04663: HierarchicalPrune: Position-Aware Compression for Large-Scale Diffusion Models

arXiv - AI · 4 min · 28 days ago

Machine Learning

[2507.02314] MAGIC: Few-Shot Mask-Guided Anomaly Inpainting with Prompt Perturbation, Spatially Adaptive Guidance, and Context Awareness

Abstract page for arXiv paper 2507.02314: MAGIC: Few-Shot Mask-Guided Anomaly Inpainting with Prompt Perturbation, Spatially Adaptive Gui...

arXiv - AI · 4 min · 28 days ago

Machine Learning

[2507.00445] Iterative Distillation for Reward-Guided Fine-Tuning of Diffusion Models in Biomolecular Design

Abstract page for arXiv paper 2507.00445: Iterative Distillation for Reward-Guided Fine-Tuning of Diffusion Models in Biomolecular Design

arXiv - Machine Learning · 4 min · 28 days ago

Machine Learning

[2506.24108] Navigating with Annealing Guidance Scale in Diffusion Space

Abstract page for arXiv paper 2506.24108: Navigating with Annealing Guidance Scale in Diffusion Space

arXiv - Machine Learning · 4 min · 28 days ago

Machine Learning

[2504.14814] A Diagnostic Evaluation of Neural Networks Trained with the Error Diffusion Learning Algorithm

Abstract page for arXiv paper 2504.14814: A Diagnostic Evaluation of Neural Networks Trained with the Error Diffusion Learning Algorithm

arXiv - Machine Learning · 4 min · 28 days ago

Machine Learning

[2505.22973] EquiReg: Equivariance Regularized Diffusion for Inverse Problems

Abstract page for arXiv paper 2505.22973: EquiReg: Equivariance Regularized Diffusion for Inverse Problems

arXiv - Machine Learning · 4 min · 28 days ago

Machine Learning

[2502.21278] Does Generation Require Memorization? Creative Diffusion Models using Ambient Diffusion

Abstract page for arXiv paper 2502.21278: Does Generation Require Memorization? Creative Diffusion Models using Ambient Diffusion

arXiv - Machine Learning · 4 min · 28 days ago

Machine Learning

[2505.17561] Model Already Knows the Best Noise: Bayesian Active Noise Selection via Attention in Video Diffusion Model

Abstract page for arXiv paper 2505.17561: Model Already Knows the Best Noise: Bayesian Active Noise Selection via Attention in Video Diff...

arXiv - AI · 4 min · 28 days ago

Machine Learning

[2503.09642] Open-Sora 2.0: Training a Commercial-Level Video Generation Model in $200k

Abstract page for arXiv paper 2503.09642: Open-Sora 2.0: Training a Commercial-Level Video Generation Model in $200k

arXiv - AI · 4 min · 28 days ago

Llms

[2404.08480] Using ChatGPT for Data Science Analyses

Abstract page for arXiv paper 2404.08480: Using ChatGPT for Data Science Analyses

arXiv - Machine Learning · 3 min · 28 days ago

Generative Ai

[2404.00962] Distributional Priors Guided Diffusion for Generating 3D Molecules in Low Data Regimes

Abstract page for arXiv paper 2404.00962: Distributional Priors Guided Diffusion for Generating 3D Molecules in Low Data Regimes

arXiv - Machine Learning · 4 min · 28 days ago

Machine Learning

[2603.01623] Adaptive Spectral Feature Forecasting for Diffusion Sampling Acceleration

Abstract page for arXiv paper 2603.01623: Adaptive Spectral Feature Forecasting for Diffusion Sampling Acceleration

arXiv - Machine Learning · 4 min · 28 days ago

Machine Learning

[2509.23589] BridgeDrive: Diffusion Bridge Policy for Closed-Loop Trajectory Planning in Autonomous Driving

Abstract page for arXiv paper 2509.23589: BridgeDrive: Diffusion Bridge Policy for Closed-Loop Trajectory Planning in Autonomous Driving

arXiv - Machine Learning · 4 min · 28 days ago

Machine Learning

[2506.12664] Behavioral Generative Agents for Energy Operations

Abstract page for arXiv paper 2506.12664: Behavioral Generative Agents for Energy Operations

arXiv - AI · 4 min · 28 days ago

Machine Learning

[2603.01068] LLaDA-o: An Effective and Length-Adaptive Omni Diffusion Model

Abstract page for arXiv paper 2603.01068: LLaDA-o: An Effective and Length-Adaptive Omni Diffusion Model

arXiv - Machine Learning · 3 min · 28 days ago

Machine Learning

[2603.01019] BadRSSD: Backdoor Attacks on Regularized Self-Supervised Diffusion Models

Abstract page for arXiv paper 2603.01019: BadRSSD: Backdoor Attacks on Regularized Self-Supervised Diffusion Models

arXiv - Machine Learning · 4 min · 28 days ago

Machine Learning

[2603.00772] Initialization-Aware Score-Based Diffusion Sampling

Abstract page for arXiv paper 2603.00772: Initialization-Aware Score-Based Diffusion Sampling

arXiv - Machine Learning · 3 min · 28 days ago

Machine Learning

[2603.02190] Sketch2Colab: Sketch-Conditioned Multi-Human Animation via Controllable Flow Distillation

Abstract page for arXiv paper 2603.02190: Sketch2Colab: Sketch-Conditioned Multi-Human Animation via Controllable Flow Distillation

arXiv - Machine Learning · 3 min · 28 days ago

Machine Learning

[2603.02129] LiftAvatar: Kinematic-Space Completion for Expression-Controlled 3D Gaussian Avatar Animation

Abstract page for arXiv paper 2603.02129: LiftAvatar: Kinematic-Space Completion for Expression-Controlled 3D Gaussian Avatar Animation

arXiv - AI · 4 min · 28 days ago

Previous Page 19 Next

Stay updated with AI News

Get the latest news, tools, and insights delivered to your inbox.

Subscribe to Newsletter

Daily or weekly digest • Unsubscribe anytime

Generative AI

Top This Week

[2602.08277] PISCO: Precise Video Instance Insertion with Sparse Control

[2511.18746] Any4D: Open-Prompt 4D Generation from Natural Language and Images

[2512.14549] Dual-objective Language Models: Training Efficiency Without Overfitting

All Content

[2508.12811] Next Visual Granularity Generation

[2508.04663] HierarchicalPrune: Position-Aware Compression for Large-Scale Diffusion Models

[2507.02314] MAGIC: Few-Shot Mask-Guided Anomaly Inpainting with Prompt Perturbation, Spatially Adaptive Guidance, and Context Awareness

[2507.00445] Iterative Distillation for Reward-Guided Fine-Tuning of Diffusion Models in Biomolecular Design

[2506.24108] Navigating with Annealing Guidance Scale in Diffusion Space

[2504.14814] A Diagnostic Evaluation of Neural Networks Trained with the Error Diffusion Learning Algorithm

[2505.22973] EquiReg: Equivariance Regularized Diffusion for Inverse Problems

[2502.21278] Does Generation Require Memorization? Creative Diffusion Models using Ambient Diffusion

[2505.17561] Model Already Knows the Best Noise: Bayesian Active Noise Selection via Attention in Video Diffusion Model

[2503.09642] Open-Sora 2.0: Training a Commercial-Level Video Generation Model in $200k

[2404.08480] Using ChatGPT for Data Science Analyses

[2404.00962] Distributional Priors Guided Diffusion for Generating 3D Molecules in Low Data Regimes

[2603.01623] Adaptive Spectral Feature Forecasting for Diffusion Sampling Acceleration

[2509.23589] BridgeDrive: Diffusion Bridge Policy for Closed-Loop Trajectory Planning in Autonomous Driving

[2506.12664] Behavioral Generative Agents for Energy Operations

[2603.01068] LLaDA-o: An Effective and Length-Adaptive Omni Diffusion Model

[2603.01019] BadRSSD: Backdoor Attacks on Regularized Self-Supervised Diffusion Models

[2603.00772] Initialization-Aware Score-Based Diffusion Sampling

[2603.02190] Sketch2Colab: Sketch-Conditioned Multi-Human Animation via Controllable Flow Distillation

[2603.02129] LiftAvatar: Kinematic-Space Completion for Expression-Controlled 3D Gaussian Avatar Animation

Related Topics

Stay updated with AI News