Generative AI

Image, video, audio, and text generation

This Week's Best | Monthly Best | Guide | Trending

RSS

Top This Week

Generative Ai

[2602.08277] PISCO: Precise Video Instance Insertion with Sparse Control

Abstract page for arXiv paper 2602.08277: PISCO: Precise Video Instance Insertion with Sparse Control

arXiv - AI · 4 min · about 11 hours ago

Machine Learning

[2511.18746] Any4D: Open-Prompt 4D Generation from Natural Language and Images

Abstract page for arXiv paper 2511.18746: Any4D: Open-Prompt 4D Generation from Natural Language and Images

arXiv - AI · 4 min · about 11 hours ago

Llms

[2512.14549] Dual-objective Language Models: Training Efficiency Without Overfitting

Abstract page for arXiv paper 2512.14549: Dual-objective Language Models: Training Efficiency Without Overfitting

arXiv - AI · 3 min · about 11 hours ago

All Content

Machine Learning

[2507.08965] Improving Classifier-Free Guidance in Masked Diffusion: Low-Dim Theoretical Insights with High-Dim Impact

Abstract page for arXiv paper 2507.08965: Improving Classifier-Free Guidance in Masked Diffusion: Low-Dim Theoretical Insights with High-...

arXiv - Machine Learning · 4 min · 26 days ago

Machine Learning

[2312.15490] Diffusion-EXR: Controllable Review Generation for Explainable Recommendation via Diffusion Models

Abstract page for arXiv paper 2312.15490: Diffusion-EXR: Controllable Review Generation for Explainable Recommendation via Diffusion Models

arXiv - AI · 4 min · 26 days ago

Machine Learning

[2506.05668] RNE: plug-and-play diffusion inference-time control and energy-based training

Abstract page for arXiv paper 2506.05668: RNE: plug-and-play diffusion inference-time control and energy-based training

arXiv - Machine Learning · 4 min · 26 days ago

Machine Learning

[2505.20934] NatADiff: Adversarial Boundary Guidance for Natural Adversarial Diffusion

Abstract page for arXiv paper 2505.20934: NatADiff: Adversarial Boundary Guidance for Natural Adversarial Diffusion

arXiv - Machine Learning · 4 min · 26 days ago

Machine Learning

[2603.03281] CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance

Abstract page for arXiv paper 2603.03281: CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance

arXiv - Machine Learning · 4 min · 26 days ago

Machine Learning

[2603.03163] Conditioned Activation Transport for T2I Safety Steering

Abstract page for arXiv paper 2603.03163: Conditioned Activation Transport for T2I Safety Steering

arXiv - AI · 3 min · 26 days ago

Machine Learning

[2603.03143] Geometry-Guided Reinforcement Learning for Multi-view Consistent 3D Scene Editing

Abstract page for arXiv paper 2603.03143: Geometry-Guided Reinforcement Learning for Multi-view Consistent 3D Scene Editing

arXiv - AI · 4 min · 26 days ago

Machine Learning

[2603.02829] Toward Early Quality Assessment of Text-to-Image Diffusion Models

Abstract page for arXiv paper 2603.02829: Toward Early Quality Assessment of Text-to-Image Diffusion Models

arXiv - Machine Learning · 4 min · 26 days ago

Generative Ai

[2603.03074] Design Generative AI for Practitioners: Exploring Interaction Approaches Aligned with Creative Practice

Abstract page for arXiv paper 2603.03074: Design Generative AI for Practitioners: Exploring Interaction Approaches Aligned with Creative ...

arXiv - AI · 3 min · 26 days ago

Machine Learning

[2603.02667] DREAM: Where Visual Understanding Meets Text-to-Image Generation

Abstract page for arXiv paper 2603.02667: DREAM: Where Visual Understanding Meets Text-to-Image Generation

arXiv - Machine Learning · 3 min · 26 days ago

Machine Learning

[2603.02919] Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers

Abstract page for arXiv paper 2603.02919: Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion T...

arXiv - Machine Learning · 3 min · 26 days ago

Machine Learning

[2603.02816] BrandFusion: A Multi-Agent Framework for Seamless Brand Integration in Text-to-Video Generation

Abstract page for arXiv paper 2603.02816: BrandFusion: A Multi-Agent Framework for Seamless Brand Integration in Text-to-Video Generation

arXiv - AI · 4 min · 26 days ago

Llms

[2603.02760] Efficient Self-Evaluation for Diffusion Language Models via Sequence Regeneration

Abstract page for arXiv paper 2603.02760: Efficient Self-Evaluation for Diffusion Language Models via Sequence Regeneration

arXiv - AI · 3 min · 26 days ago

Generative Ai

[2603.02417] Fisher-Geometric Diffusion in Stochastic Gradient Descent: Optimal Rates, Oracle Complexity, and Information-Theoretic Limits

Abstract page for arXiv paper 2603.02417: Fisher-Geometric Diffusion in Stochastic Gradient Descent: Optimal Rates, Oracle Complexity, an...

arXiv - Machine Learning · 4 min · 26 days ago

Machine Learning

[2603.02697] ShareVerse: Multi-Agent Consistent Video Generation for Shared World Modeling

Abstract page for arXiv paper 2603.02697: ShareVerse: Multi-Agent Consistent Video Generation for Shared World Modeling

arXiv - AI · 3 min · 26 days ago

Llms

[2603.02547] CoDAR: Continuous Diffusion Language Models are More Powerful Than You Think

Abstract page for arXiv paper 2603.02547: CoDAR: Continuous Diffusion Language Models are More Powerful Than You Think

arXiv - Machine Learning · 3 min · 26 days ago

Machine Learning

[2603.03238] On Geometry Regularization in Autoencoder Reduced-Order Models with Latent Neural ODE Dynamics

Abstract page for arXiv paper 2603.03238: On Geometry Regularization in Autoencoder Reduced-Order Models with Latent Neural ODE Dynamics

arXiv - Machine Learning · 3 min · 26 days ago

Machine Learning

[2603.02650] Improving Diffusion Planners by Self-Supervised Action Gating with Energies

Abstract page for arXiv paper 2603.02650: Improving Diffusion Planners by Self-Supervised Action Gating with Energies

arXiv - AI · 3 min · 26 days ago

Machine Learning

[2603.02613] Real-Time Generative Policy via Langevin-Guided Flow Matching for Autonomous Driving

Abstract page for arXiv paper 2603.02613: Real-Time Generative Policy via Langevin-Guided Flow Matching for Autonomous Driving

arXiv - Machine Learning · 4 min · 26 days ago

Llms

[2603.03147] Agentic AI-based Coverage Closure for Formal Verification

Abstract page for arXiv paper 2603.03147: Agentic AI-based Coverage Closure for Formal Verification

arXiv - AI · 3 min · 26 days ago

Previous Page 16 Next

Stay updated with AI News

Get the latest news, tools, and insights delivered to your inbox.

Subscribe to Newsletter

Daily or weekly digest • Unsubscribe anytime

Generative AI

Top This Week

[2602.08277] PISCO: Precise Video Instance Insertion with Sparse Control

[2511.18746] Any4D: Open-Prompt 4D Generation from Natural Language and Images

[2512.14549] Dual-objective Language Models: Training Efficiency Without Overfitting

All Content

[2507.08965] Improving Classifier-Free Guidance in Masked Diffusion: Low-Dim Theoretical Insights with High-Dim Impact

[2312.15490] Diffusion-EXR: Controllable Review Generation for Explainable Recommendation via Diffusion Models

[2506.05668] RNE: plug-and-play diffusion inference-time control and energy-based training

[2505.20934] NatADiff: Adversarial Boundary Guidance for Natural Adversarial Diffusion

[2603.03281] CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance

[2603.03163] Conditioned Activation Transport for T2I Safety Steering

[2603.03143] Geometry-Guided Reinforcement Learning for Multi-view Consistent 3D Scene Editing

[2603.02829] Toward Early Quality Assessment of Text-to-Image Diffusion Models

[2603.03074] Design Generative AI for Practitioners: Exploring Interaction Approaches Aligned with Creative Practice

[2603.02667] DREAM: Where Visual Understanding Meets Text-to-Image Generation

[2603.02919] Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers

[2603.02816] BrandFusion: A Multi-Agent Framework for Seamless Brand Integration in Text-to-Video Generation

[2603.02760] Efficient Self-Evaluation for Diffusion Language Models via Sequence Regeneration

[2603.02417] Fisher-Geometric Diffusion in Stochastic Gradient Descent: Optimal Rates, Oracle Complexity, and Information-Theoretic Limits

[2603.02697] ShareVerse: Multi-Agent Consistent Video Generation for Shared World Modeling

[2603.02547] CoDAR: Continuous Diffusion Language Models are More Powerful Than You Think

[2603.03238] On Geometry Regularization in Autoencoder Reduced-Order Models with Latent Neural ODE Dynamics

[2603.02650] Improving Diffusion Planners by Self-Supervised Action Gating with Energies

[2603.02613] Real-Time Generative Policy via Langevin-Guided Flow Matching for Autonomous Driving

[2603.03147] Agentic AI-based Coverage Closure for Formal Verification

Related Topics

Stay updated with AI News