07 02 2025 817样本激发7倍推理性能:上交大「少即是多」定律挑战RL Scaling范式 上海交大最新研究颠覆传统认知:只需817个样本,AI数学推理能力即可超越众多顶尖模型!这项名为LIMO(LessIsMoreforReasoning)的研究成果,挑战了“更大即更强”的行业共识,证明了... Read&More 首页 上一页 12 下一页 末页