August 24th, 2023 - Revolutionizing Pixels and Prose: Breakthroughs in Diffusion Models, Multimodal Language Learning, and Media Editing
MP3•Źródło odcinka
Manage episode 375164891 series 3485608
Treść dostarczona przez Marcus Edel. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Marcus Edel lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.
…
continue reading
Rozdziały
1. Intro (00:00:00)
2. Scalable Diffusion Models with Transformers (00:01:18)
3. BLIVA: A Simple Multimodal LLM for Better Handling of Text-Rich Visual Questions (00:03:02)
4. StableVideo: Text-driven Consistency-aware Diffusion Video Editing (00:04:10)
5. Exploiting Diffusion Prior for Real-World Image Super-Resolution (00:06:36)
75 odcinków