Artwork

Treść dostarczona przez Nicolay Gerold. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Nicolay Gerold lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.
Player FM - aplikacja do podcastów
Przejdź do trybu offline z Player FM !

From PDFs to Pixels: How ColPali is Changing Information Retrieval | S2 E7

54:57
 
Udostępnij
 

Manage episode 442279090 series 3585930
Treść dostarczona przez Nicolay Gerold. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Nicolay Gerold lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.

ColPali makes us rethink how we approach document processing.

ColPali revolutionizes visual document search by combining late interaction scoring with visual language models. This approach eliminates the need for extensive text extraction and preprocessing, handling messy real-world data more effectively than traditional methods.

In this episode, Jo Bergum, chief scientist at Vespa, shares his insights on how ColPali is changing the way we approach complex document formats like PDFs and HTML pages.

Introduction to ColPali:

  • Combines late interaction scoring from Colbert with visual language model (PoliGemma)
  • Represents screenshots of documents as multi-vector representations
  • Enables searching across complex document formats (PDFs, HTML)
  • Eliminates need for extensive text extraction and preprocessing

Advantages of ColPali:

  • Handles messy, real-world data better than traditional methods
  • Considers both textual and visual elements in documents
  • Potential applications in various domains (finance, medical, legal)
  • Scalable to large document collections with proper optimization

Jo Bergum:

Nicolay Gerold:

00:00 Messy Data in AI 01:19 Challenges in Search Systems 03:41 Understanding Representational Approaches 08:18 Dense vs Sparse Representations 19:49 Advanced Retrieval Models and ColPali 30:59 Exploring Image-Based AI Progress 32:25 Challenges and Innovations in OCR 33:45 Understanding ColPali and MaxSim 38:13 Scaling and Practical Applications of ColPali 44:01 Future Directions and Use Cases

  continue reading

28 odcinków

Artwork
iconUdostępnij
 
Manage episode 442279090 series 3585930
Treść dostarczona przez Nicolay Gerold. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Nicolay Gerold lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.

ColPali makes us rethink how we approach document processing.

ColPali revolutionizes visual document search by combining late interaction scoring with visual language models. This approach eliminates the need for extensive text extraction and preprocessing, handling messy real-world data more effectively than traditional methods.

In this episode, Jo Bergum, chief scientist at Vespa, shares his insights on how ColPali is changing the way we approach complex document formats like PDFs and HTML pages.

Introduction to ColPali:

  • Combines late interaction scoring from Colbert with visual language model (PoliGemma)
  • Represents screenshots of documents as multi-vector representations
  • Enables searching across complex document formats (PDFs, HTML)
  • Eliminates need for extensive text extraction and preprocessing

Advantages of ColPali:

  • Handles messy, real-world data better than traditional methods
  • Considers both textual and visual elements in documents
  • Potential applications in various domains (finance, medical, legal)
  • Scalable to large document collections with proper optimization

Jo Bergum:

Nicolay Gerold:

00:00 Messy Data in AI 01:19 Challenges in Search Systems 03:41 Understanding Representational Approaches 08:18 Dense vs Sparse Representations 19:49 Advanced Retrieval Models and ColPali 30:59 Exploring Image-Based AI Progress 32:25 Challenges and Innovations in OCR 33:45 Understanding ColPali and MaxSim 38:13 Scaling and Practical Applications of ColPali 44:01 Future Directions and Use Cases

  continue reading

28 odcinków

Alle episoder

×
 
Loading …

Zapraszamy w Player FM

Odtwarzacz FM skanuje sieć w poszukiwaniu wysokiej jakości podcastów, abyś mógł się nią cieszyć już teraz. To najlepsza aplikacja do podcastów, działająca na Androidzie, iPhonie i Internecie. Zarejestruj się, aby zsynchronizować subskrypcje na różnych urządzeniach.

 

Skrócona instrukcja obsługi