Як навчали ChatGPT?

Як навчали ChatGPT?

Чи знаєте ви, як навчали ChatGPT?

ChatGPT — це «просто» налаштована модель GPT-3 із напрочуд малою кількістю даних! Крім того, InstructGPT (модель-брат ChatGPT), схоже, використовує параметри 1.3B, тоді як GPT-3 використовує параметри 175B!

Спочатку його налаштовують за допомогою навчання під наглядом, а потім додатково налаштовують за допомогою навчання з підкріпленням. Для отримання навчальних даних вони найняли 40 осіб, які займаються етикетуванням.