主题

对齐

让模型行为更符合偏好、更安全或更有用的训练方法。