Tahap training LLM

Data teks skala besar

Pretraining

Instruction tuning

RLHF / alignment

Safety tuning

Deployment

Penjelasan singkat

Pretraining — model belajar pola bahasa dan pengetahuan umum dari teks besar
Instruction tuning — model dilatih mengikuti instruksi, bukan sekadar melanjutkan teks
RLHF / alignment — model diarahkan agar jawabannya lebih membantu dan aman
Deployment — model dipasang di produk: chatbot, IDE, atau API

Info

Pipeline ini disederhanakan — tiap perusahaan punya variannya sendiri. Intinya: model dasar yang hanya bisa memprediksi teks perlu dilatih lagi untuk jadi asisten yang mengikuti instruksi.