AI界惊现50美元奇迹，李飞飞团队复刻DeepSeek，真相竟是基于阿里通义千问模型！

5 0 2025-02-07

人工智能领域再掀波澜：低成本AI推理模型s1横空出世一、低成本AI模型s1引发业界热议近日，一则关于人工智能领域的新闻引起了广泛关注。据悉，斯坦福大学和华盛顿大学的研究人员李飞飞等人，仅花费不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。这一模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。二、s1模型背后的秘密：基于阿里云通义千问模型微调经过《科创板日报》记者的调查和采访，业内人士透露，s1模型的训练并非从零开始，而是基于阿里云通义千问（Qwen）模型进行监督微调。这意味着，s1模型的低成本优势，实际上建立在已具备强大能力的开源基础模型之上。三、1000个样本数据，s1模型的“神奇”之处根据李飞飞等人的研究论文，s1模型的训练仅使用了1000个样本数据。这一数据量在AI训练中可谓微乎其微，通常不足以训练出一个具备推理能力的模型。s1模型却以惊人的表现，证明了其强大的推理能力。四、专家解读：s1模型的神奇源于通义千问模型青年AI科学家、上海交通大学人工智能学院谢伟迪副教授在接受采访时表示，s1模型的神奇之处在于其基于通义千问模型进行微调。这1000个样本数据在训练中的作用更像是“锦上添花”，而非“从零开始”。 “以通义千问模型作为基座，确实可以用很少的样本数据就达到产生新的推理模型的效果，但如果换成其他基座模型，新模型能力却没有任何的提升。能力真正神奇的是Qwen模型，而不是s1。” 谢伟迪说。五、总结 s1模型的横空出世，无疑为人工智能领域带来了新的启示。低成本、高效的AI模型，有望在未来为更多领域带来变革。而s1模型背后的通义千问模型，也成为了业界关注的焦点。