Tahap training LLM

Data teks skala besar
Pretraining
Instruction tuning
RLHF / alignment
Safety tuning
Deployment
Penjelasan singkat
  • Pretraining — model belajar pola bahasa dan pengetahuan umum dari teks besar
  • Instruction tuning — model dilatih mengikuti instruksi, bukan sekadar melanjutkan teks
  • RLHF / alignment — model diarahkan agar jawabannya lebih membantu dan aman
  • Deployment — model dipasang di produk: chatbot, IDE, atau API
Info

Pipeline ini disederhanakan — tiap perusahaan punya variannya sendiri. Intinya: model dasar yang hanya bisa memprediksi teks perlu dilatih lagi untuk jadi asisten yang mengikuti instruksi.

16 / 52