标签页_萌爵百货商业网

首页>TAG列表

经过计算最优抽样训练大言语模型推理器更弱却更优更小

2024-11-14 521

一、论断写在前面论文题目，Smaller，Weaker，YetBetter，TrainingLLMReasonersviaCompute，OptimalSampling论文链接，https，arx...

共1页 1条