October 24th, 2023 - Neural Visions Unveiled: From FreeNoise's Video Clarity, HallusionBench's Reality Check, to FlashEdit's Instant Image Refinements
MP3•Źródło odcinka
Manage episode 380721281 series 3485608
Treść dostarczona przez Marcus Edel. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Marcus Edel lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.
- FreeNoise: Tuning-Free Longer Video Diffusion Via Noise Rescheduling
- HallusionBench: You See What You Think? Or You Think What You See? An Image-Context Reasoning Benchmark Challenging for GPT-4V(ision), LLaVA-1.5, and Other Multi-modality Models
- Localizing and Editing Knowledge in Text-to-Image Generative Models
Rozdziały
1. Intro (00:00:00)
2. FreeNoise: Tuning-Free Longer Video Diffusion Via Noise Rescheduling (00:01:14)
3. HallusionBench: You See What You Think? Or You Think What You See? An Image-Context Reasoning Benchmark Challenging for GPT-4V(ision), LLaVA-1.5, and Other Multi-modality Models (00:03:17)
4. Localizing and Editing Knowledge in Text-to-Image Generative Models (00:05:16)
75 odcinków