Ep 83 - Pablo Samuel Castro (Google) - Reinforcement Learning, feedback de humanos y ChatGPT

Hacia Afuera con Omar Espejel

Feb 17 2023 • 51 mins

Pablo Samuel Castro (@pcastr en Twitter) es Staff Research Software Developer en Google donde ha trabajado durante más de 11 años. Su enfoque se centra en Reinforcement Learning. Tiene un doctorado en Computer Science en la McGill University.  En este episodio, Pablo nos cuenta cómo funciona el Reinforcement Learning (RL) y el RL from Human Feedback (RLHF), clave para el desarrollo de modelos de lenguaje como el ChatGPT. Pablo también aplica el RL a actividades creativas como la música y nos platica sobre ello.

You Might Like

Acquired
Acquired
Ben Gilbert and David Rosenthal
Darknet Diaries
Darknet Diaries
Jack Rhysider
Hard Fork
Hard Fork
The New York Times
Marketplace Tech
Marketplace Tech
Marketplace
WSJ’s The Future of Everything
WSJ’s The Future of Everything
The Wall Street Journal
Search Engine
Search Engine
PJ Vogt, Audacy, Jigsaw
TechStuff
TechStuff
iHeartPodcasts
Rich On Tech
Rich On Tech
Rich DeMuro
The Vergecast
The Vergecast
The Verge
Fortnite Emotes
Fortnite Emotes
Lawrence Hopkinson
Waveform: The MKBHD Podcast
Waveform: The MKBHD Podcast
Vox Media Podcast Network