Tahap training LLM
Data teks skala besar
Pretraining
Instruction tuning
RLHF / alignment
Safety tuning
Deployment
Penjelasan singkat
- Pretraining — model belajar pola bahasa dan pengetahuan umum dari teks besar
- Instruction tuning — model dilatih mengikuti instruksi, bukan sekadar melanjutkan teks
- RLHF / alignment — model diarahkan agar jawabannya lebih membantu dan aman
- Deployment — model dipasang di produk: chatbot, IDE, atau API
Info
Pipeline ini disederhanakan — tiap perusahaan punya variannya sendiri. Intinya: model dasar yang hanya bisa memprediksi teks perlu dilatih lagi untuk jadi asisten yang mengikuti instruksi.