11
11
2024
speak to和talk to的区别
"Speak to"用于正式场合,强调对特定个人的直接交流,而"Talk to"用于非正式场合,指更一般的谈话或对话。...
04
03
2024
模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分
在目前的模型训练范式中,偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中,偏好数据通常被用作对齐(alignment)时的训练优化目标,如基于人类或AI反馈的强化学习(RLHF/RLAIF)或...




