每日經濟新聞 2025-11-27 21:45:09
每經AI快訊,11月27日,DeepSeek在HuggingFace推出新型數(shù)學推理模型DeepSeekMath-V2,采用可自我驗證的訓練框架。該模型基于DeepSeek-V3.2-Exp-Base構建,通過LLM驗證器自動審查生成的數(shù)學證明,并利用高難度樣本持續(xù)優(yōu)化性能。在IMO 2025和CMO 2024中均達到金牌水平,Putnam 2024獲118/120分。團隊表示,該成果驗證了自驗證推理路徑的可行性,為構建可靠數(shù)學智能系統(tǒng)提供新方向。模型代碼與權重已開源,發(fā)布于Hugging Face及GitHub平臺。
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP