Tina Dong

Tina Dong

DeepSeek Prover V2 671B 發布速報

2025 年 4 月 30 日 ——AI 領域出現一位超級新星:DeepSeek-Prover-V2-671B。 這款由 DeepSeek 團隊最新推出的超大模型,參數量高達 6710 億(671B),主打自動證明與高階推理能力,一登場就引發科技圈熱議。官方同步上架 HuggingFace,無論是技術規模還是潛在應用層面,都讓人相當期待。 本文會根據目前公開的初步資訊與網路社群的討論內容,整理這款模型的特點與市場反應,提供一個第一手的觀察角度。提醒大家,目前資料仍屬早期階段,實際表現仍需以官方後續釋出的詳細資訊為主。 延伸閱讀:《DeepSeek再推出新模型 專注數學推理開源大語言模型》 技術亮點:結合「規模」與「專精」的深度設計 DeepSeek-Prover-V2-671B 的問世,在多個技術層面展現出其獨特優勢,可說是將大規模架構與針對性應用巧妙結合的代表作。 超大規模參數量 DeepSeek-Prover-V2-671B 搭載高達 6710 億個參數,穩坐目前全球開源 AI 模型的頂規行列。這樣的龐大規模,
3 min read

Gemini 2.5 Flash 登場:平價又聰明,這款推理模型到底多厲害?

自從 Google 推出 Gemini 2.5 Pro 之後,我就一路關注他們在 AI 領域的最新進展。現在,隨著全新 AI 推理模型 Gemini 2.5 Flash 的登場——這是一款強調高效能又具性價比的模型——Google 再次讓像我這樣的開發者眼睛一亮。 如果你跟我一樣在乎成本、速度,以及大規模推理的能力,那麼 Gemini 2.5 Flash 絕對是個值得關注的突破。 Gemini 2.5 Flash:新功能亮點與實測體驗 相較於主打極致效能與深層推理的 Pro 系列,Gemini 2.5 Flash 則走的是速度、成本與效能之間的聰明平衡。我個人認為,這樣的設計方向非常貼近當前 AI 發展的主流趨勢:
6 min read

Subscribe to Monica Blog

Don’t miss out on the latest issues. Sign up now to get access to the library of members-only issues.
[email protected]
Subscribe