Post-Training > Pre-Training

Trend toward post-training refinement instead of building larger models — RL and fine-tuning become the key.

Major trend: instead of training larger models (pre-training costs $100M+), focus shifts to post-training refinement using RLHF, DPO, RLAIF. Fine-tuning becomes the key — small models + good fine-t...