Decoding

  • Model menghasilkan skor untuk banyak kandidat token berikutnya
  • Decoding = proses memilih token dari kandidat tersebut
  • Temperature — mengatur tingkat variasi
  • Top-p — membatasi pilihan pada kandidat dengan probabilitas paling masuk akal
  • Output bisa berbeda karena proses pemilihan token tidak selalu deterministik
Contoh kandidat token berikutnya
"adalah"      42%
"merupakan"   30%
"bisa"        10%
"terjadi"      5%
...
Tip

Untuk tugas faktual atau coding → temperature rendah lebih aman. Untuk brainstorming → temperature tinggi kadang berguna. Di banyak chatbot, pengaturan ini disembunyikan dari pengguna.

19 / 52