Artwork

Treść dostarczona przez Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.
Player FM - aplikacja do podcastów
Przejdź do trybu offline z Player FM !

Episode 118 -Sleeper Agent - Backdoors in Sprachmodellen

27:58
 
Udostępnij
 

Manage episode 406099931 series 2911119
Treść dostarczona przez Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.

Heute sprechen wir über Hintertüren bei Sprachmodellen und was dies für die Sicherheit von LLMs bedeutet. Wir zeigen auf wie Backdoors entstehen könnten und diskutieren die Konsequenz daraus.
Eine spannende Sendung. Hören Sie rein.
Sleeper Agents: https://arxiv.org/abs/2401.05566
Poisoning Language Models During Instruction Tuning https://arxiv.org/abs/2305.00944

Support the Show.

  continue reading

165 odcinków

Artwork
iconUdostępnij
 
Manage episode 406099931 series 2911119
Treść dostarczona przez Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.

Heute sprechen wir über Hintertüren bei Sprachmodellen und was dies für die Sicherheit von LLMs bedeutet. Wir zeigen auf wie Backdoors entstehen könnten und diskutieren die Konsequenz daraus.
Eine spannende Sendung. Hören Sie rein.
Sleeper Agents: https://arxiv.org/abs/2401.05566
Poisoning Language Models During Instruction Tuning https://arxiv.org/abs/2305.00944

Support the Show.

  continue reading

165 odcinków

Wszystkie odcinki

×
 
Loading …

Zapraszamy w Player FM

Odtwarzacz FM skanuje sieć w poszukiwaniu wysokiej jakości podcastów, abyś mógł się nią cieszyć już teraz. To najlepsza aplikacja do podcastów, działająca na Androidzie, iPhonie i Internecie. Zarejestruj się, aby zsynchronizować subskrypcje na różnych urządzeniach.

 

Skrócona instrukcja obsługi