Artwork

Treść dostarczona przez Nyedis. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Nyedis lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.
Player FM - aplikacja do podcastów
Przejdź do trybu offline z Player FM !

Alignment Faking: The dark side of LLMs

23:48
 
Udostępnij
 

Manage episode 458305353 series 3463727
Treść dostarczona przez Nyedis. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Nyedis lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.

Recently, Anthropic caught Claude faking alignment. This is going to create a brand new set of issues with AI that we previously did not see happening this quickly. We discuss where AI is headed and what new dangers this will pose.

You can read more about this here: https://www.reddit.com/r/singularity/comments/1hh7w9g/anthropic_caught_claude_faking_alignment_and/

And watch the panel from Anthropic covering this important topic: https://www.youtube.com/watch?v=9eXV64O2Xp8

For full video of this episode, head over to our Youtube channel at http://youtube.com/@nyedisiam

Follow us on your favorite platform for full episodes, shorts, and community feedback:

📺 Linkedin: https://www.linkedin.com/company/77611909/

🆇 X: https://x.com/nyedisiam

📷 Instagram: https://www.instagram.com/nyedisiam

🪩 TikTok: https://www.tiktok.com/@nyedisiam

Nyedis Website: https://www.Nyedis.com

  continue reading

232 odcinków

Artwork
iconUdostępnij
 
Manage episode 458305353 series 3463727
Treść dostarczona przez Nyedis. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Nyedis lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.

Recently, Anthropic caught Claude faking alignment. This is going to create a brand new set of issues with AI that we previously did not see happening this quickly. We discuss where AI is headed and what new dangers this will pose.

You can read more about this here: https://www.reddit.com/r/singularity/comments/1hh7w9g/anthropic_caught_claude_faking_alignment_and/

And watch the panel from Anthropic covering this important topic: https://www.youtube.com/watch?v=9eXV64O2Xp8

For full video of this episode, head over to our Youtube channel at http://youtube.com/@nyedisiam

Follow us on your favorite platform for full episodes, shorts, and community feedback:

📺 Linkedin: https://www.linkedin.com/company/77611909/

🆇 X: https://x.com/nyedisiam

📷 Instagram: https://www.instagram.com/nyedisiam

🪩 TikTok: https://www.tiktok.com/@nyedisiam

Nyedis Website: https://www.Nyedis.com

  continue reading

232 odcinków

כל הפרקים

×
 
Loading …

Zapraszamy w Player FM

Odtwarzacz FM skanuje sieć w poszukiwaniu wysokiej jakości podcastów, abyś mógł się nią cieszyć już teraz. To najlepsza aplikacja do podcastów, działająca na Androidzie, iPhonie i Internecie. Zarejestruj się, aby zsynchronizować subskrypcje na różnych urządzeniach.

 

Skrócona instrukcja obsługi

Posłuchaj tego programu podczas zwiedzania
Odtwarzanie