Adapting Diverse Controls: Ctrl-Adapter, HQ-Edit, Tango 2
MP3•Maison d'episode
Manage episode 413674097 series 3568650
Contenu fourni par PocketPod. Tout le contenu du podcast, y compris les épisodes, les graphiques et les descriptions de podcast, est téléchargé et fourni directement par PocketPod ou son partenaire de plateforme de podcast. Si vous pensez que quelqu'un utilise votre œuvre protégée sans votre autorisation, vous pouvez suivre le processus décrit ici https://fr.player.fm/legal.
AI Papers Podcast for 04/21/2024 Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model HQ-Edit: A High-Quality Dataset for Instruction-based Image Editing Tango 2: Aligning Diffusion-based Text-to-Audio Generations through Direct Preference Optimization TextHawk: Exploring Efficient Fine-Grained Perception of Multimodal Large Language Models On Speculative Decoding for Multimodal Large Language Models
…
continue reading
25 episodes