Artwork

Treść dostarczona przez Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.
Player FM - aplikacja do podcastów
Przejdź do trybu offline z Player FM !

#33 Guillaume Lample (Co-fondateur & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models

38:44
 
Udostępnij
 

Manage episode 378496374 series 3426234
Treść dostarczona przez Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.

Guillaume Lample, Cofounder & Chief Scientist chez Mistral AI est l’invité de l’épisode 33 de Data Driven 101. Mistral AI entraîne des modèles de langues à destination des entreprises avec un accès open source. Il nous explique notamment :

  • les difficultés et subtilités pour entraîner un LLM
  • les découvertes inattendues faites sur le chemin
  • les caractéristiques de leur premier modèle à destination du grand public

🔑 MOTS CLÉS

  • Dataset : un ensemble de données utilisé pour entraîner un modèle d'apprentissage automatique.
  • Token : un morceau de mot utilisé pour entraîner un modèle de langage. Un mot peut être découpé en plusieurs tokens.
  • Embedding : une représentation vectorielle d'un mot ou d'une phrase utilisée pour entraîner un modèle de langage.
  • Open source : un logiciel dont le code source est disponible pour tout le monde et peut être modifié et distribué librement.
  • Fine-tuning : une technique d'entraînement de modèles de langage qui consiste à ajuster un modèle pré-entraîné sur un ensemble de données spécifique à une tâche donnée.
  • NLP (Natural Language Processing) : un domaine de l'informatique qui se concentre sur l'interaction entre les ordinateurs et le langage humain.

🎙 SOUTENEZ LE PODCAST GRATUITEMENT

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

👉🏼Episode 29 : Arthur André ( Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA

👉🏼 Episode 23 : Hamza Tajmo uati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments

👉🏼Episode HS1 : Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA

👋 PLUS DE CONTENU DATA ?

> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

> Suivez-nous sur Tiktok 📳

> Abonnez-vous à notre chaîne Youtube

🚀 BESOIN D’EXPERTISE IA & DATA ?

Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.

Réservez votre séance de 30 minutes maintenant


Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

  continue reading

64 odcinków

Artwork
iconUdostępnij
 
Manage episode 378496374 series 3426234
Treść dostarczona przez Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.

Guillaume Lample, Cofounder & Chief Scientist chez Mistral AI est l’invité de l’épisode 33 de Data Driven 101. Mistral AI entraîne des modèles de langues à destination des entreprises avec un accès open source. Il nous explique notamment :

  • les difficultés et subtilités pour entraîner un LLM
  • les découvertes inattendues faites sur le chemin
  • les caractéristiques de leur premier modèle à destination du grand public

🔑 MOTS CLÉS

  • Dataset : un ensemble de données utilisé pour entraîner un modèle d'apprentissage automatique.
  • Token : un morceau de mot utilisé pour entraîner un modèle de langage. Un mot peut être découpé en plusieurs tokens.
  • Embedding : une représentation vectorielle d'un mot ou d'une phrase utilisée pour entraîner un modèle de langage.
  • Open source : un logiciel dont le code source est disponible pour tout le monde et peut être modifié et distribué librement.
  • Fine-tuning : une technique d'entraînement de modèles de langage qui consiste à ajuster un modèle pré-entraîné sur un ensemble de données spécifique à une tâche donnée.
  • NLP (Natural Language Processing) : un domaine de l'informatique qui se concentre sur l'interaction entre les ordinateurs et le langage humain.

🎙 SOUTENEZ LE PODCAST GRATUITEMENT

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

👉🏼Episode 29 : Arthur André ( Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA

👉🏼 Episode 23 : Hamza Tajmo uati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments

👉🏼Episode HS1 : Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA

👋 PLUS DE CONTENU DATA ?

> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

> Suivez-nous sur Tiktok 📳

> Abonnez-vous à notre chaîne Youtube

🚀 BESOIN D’EXPERTISE IA & DATA ?

Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.

Réservez votre séance de 30 minutes maintenant


Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

  continue reading

64 odcinków

Wszystkie odcinki

×
 
Loading …

Zapraszamy w Player FM

Odtwarzacz FM skanuje sieć w poszukiwaniu wysokiej jakości podcastów, abyś mógł się nią cieszyć już teraz. To najlepsza aplikacja do podcastów, działająca na Androidzie, iPhonie i Internecie. Zarejestruj się, aby zsynchronizować subskrypcje na różnych urządzeniach.

 

Skrócona instrukcja obsługi