Artwork

Treść dostarczona przez Michał Dulemba. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Michał Dulemba lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.
Player FM - aplikacja do podcastów
Przejdź do trybu offline z Player FM !

Spichlerz / Speakleash - open source dataset z polskimi tekstami - Sebastian Kondracki

43:20
 
Udostępnij
 

Manage episode 360368173 series 2987467
Treść dostarczona przez Michał Dulemba. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Michał Dulemba lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.

Rozmowa z Sebastianem Kondrackim - jednym z założycieli projektu Spichlerz / Speakleash
Rozmawiamy na temat:
- czym jest projekt Spichlerz / speakleash
- ścieżce jaką przeszedł Sebastian poznając m.in ludzi z HuggingFace
- ilości danych potrzebnych, żeby trenować dobry model języka polskiego
- ochotnikach, którzy pracują przy projekcie
- etapie na jakim jest teraz projekt (update - ponad 140GB!)
- promowaniu polskich projektów Open Source
- osobach i organizacjach, które wspierają aktualnie Spichlerz
Codebooster - szkolenie z AI dla programistów
https://codebooster.pl
PDF - Jak generować dane za pomocą chatGPT:
PDF “Jak generować dane w chatGPT” (codebooster.pl)
Jak zacząć podcast - kurs i książka - Michał Dulemba
Oficjalna strona
https://speakleash.org/
Repo na github:
https://github.com/speakleash
Dashboard pokazujący ilość danych:
Speakleash Dashboard · Streamlit
LinekdIn:
https://www.linkedin.com/company/speakleash/
Twitter
https://twitter.com/Speak_Leash
Discord
https://discord.gg/a2rz3v9e
Email
team@speakleash.org
PyPi
https://pypi.org/project/speakleash/
Linkedin Sebastiana:
Sebastian Kondracki | LinkedIn
Osoby zaangażowane w projekt:
Jacek Chwiła (Credit Agricole Bank Polska)
Adrian Gwoździej (BTC)
Jan Maria Kowalski (Bank Pekao SA)
Izabela Babis (Deviniti)
Mateusz Kuras (Deviniti)
Maciej Ogrodnik (Deviniti)
Maria Filipkowska
Tomasz Siedlecki
Marcin Kurzyna (Wirtualna Polska S.A.)
Waldemar Boszko
i inni anonimowi pasjonaci AI

Napisz do mnie:
Michal Dulemba | LinkedIn
Subskrybuj podcast:
Apple Podcasts
Spotify
Google Podcasts
Podcast Addict
RSS
Korzystam z:
Buzzsprout (hosting odcinków):
https://www.buzzsprout.com/?referrer_id=1783532
Riverside (aplikacja do zdalnego nagrywania):
https://www.riverside.fm/?via=dulemba

  continue reading

86 odcinków

Artwork
iconUdostępnij
 
Manage episode 360368173 series 2987467
Treść dostarczona przez Michał Dulemba. Cała zawartość podcastów, w tym odcinki, grafika i opisy podcastów, jest przesyłana i udostępniana bezpośrednio przez Michał Dulemba lub jego partnera na platformie podcastów. Jeśli uważasz, że ktoś wykorzystuje Twoje dzieło chronione prawem autorskim bez Twojej zgody, możesz postępować zgodnie z procedurą opisaną tutaj https://pl.player.fm/legal.

Rozmowa z Sebastianem Kondrackim - jednym z założycieli projektu Spichlerz / Speakleash
Rozmawiamy na temat:
- czym jest projekt Spichlerz / speakleash
- ścieżce jaką przeszedł Sebastian poznając m.in ludzi z HuggingFace
- ilości danych potrzebnych, żeby trenować dobry model języka polskiego
- ochotnikach, którzy pracują przy projekcie
- etapie na jakim jest teraz projekt (update - ponad 140GB!)
- promowaniu polskich projektów Open Source
- osobach i organizacjach, które wspierają aktualnie Spichlerz
Codebooster - szkolenie z AI dla programistów
https://codebooster.pl
PDF - Jak generować dane za pomocą chatGPT:
PDF “Jak generować dane w chatGPT” (codebooster.pl)
Jak zacząć podcast - kurs i książka - Michał Dulemba
Oficjalna strona
https://speakleash.org/
Repo na github:
https://github.com/speakleash
Dashboard pokazujący ilość danych:
Speakleash Dashboard · Streamlit
LinekdIn:
https://www.linkedin.com/company/speakleash/
Twitter
https://twitter.com/Speak_Leash
Discord
https://discord.gg/a2rz3v9e
Email
team@speakleash.org
PyPi
https://pypi.org/project/speakleash/
Linkedin Sebastiana:
Sebastian Kondracki | LinkedIn
Osoby zaangażowane w projekt:
Jacek Chwiła (Credit Agricole Bank Polska)
Adrian Gwoździej (BTC)
Jan Maria Kowalski (Bank Pekao SA)
Izabela Babis (Deviniti)
Mateusz Kuras (Deviniti)
Maciej Ogrodnik (Deviniti)
Maria Filipkowska
Tomasz Siedlecki
Marcin Kurzyna (Wirtualna Polska S.A.)
Waldemar Boszko
i inni anonimowi pasjonaci AI

Napisz do mnie:
Michal Dulemba | LinkedIn
Subskrybuj podcast:
Apple Podcasts
Spotify
Google Podcasts
Podcast Addict
RSS
Korzystam z:
Buzzsprout (hosting odcinków):
https://www.buzzsprout.com/?referrer_id=1783532
Riverside (aplikacja do zdalnego nagrywania):
https://www.riverside.fm/?via=dulemba

  continue reading

86 odcinków

Wszystkie odcinki

×
 
Loading …

Zapraszamy w Player FM

Odtwarzacz FM skanuje sieć w poszukiwaniu wysokiej jakości podcastów, abyś mógł się nią cieszyć już teraz. To najlepsza aplikacja do podcastów, działająca na Androidzie, iPhonie i Internecie. Zarejestruj się, aby zsynchronizować subskrypcje na różnych urządzeniach.

 

Skrócona instrukcja obsługi

Posłuchaj tego programu podczas zwiedzania
Odtwarzanie