DeepSeekr1更新：提高思想和推理能力的深度_黑料百科解析吃瓜网51官网版的内幕与特点

小编：公司DeepSeek的伟大模型的公司发表了详细的更新广告，这些广告解释了DeepSeek-R1更新的具体情况

DeepSeek是一家大型国家模型，宣布了详细的更新公告，该公告解释了DeepSeek-R1更新的特定情况。根据DeepSeek的公告，5月29日，DeepSeek R1型号完成了小型更新，当前版本的DeepSeek-R1-0528。用户通过官方网站，应用程序或迷你程序输入对话接口后，可以使用“深思熟虑”功能来体验最新版本。 API也已同步更新，呼叫方法没有更改。该公告使用DeepSeek-R1-0528用作2024年12月发布的基于DeepSeek V3的模型，但在培训后将在此过程中投入更多的计算机功能，从而大大改善了该模型的思想深度和推理模型。更新的R1模型在多种参考评估中实现了所有国家模型的Wickedres结果，例如数学，编程，一般逻辑，并且接近其他具有一般性能的主要国际模型，例如O3和Gemini-2.5-Pro。与以前的R1版本相比，复杂的推理任务中模型的新版本的性能改进得到了显着改善。例如，在AIME2025测试中，该模型的最新版本的精度从上一个版本增加到了87.5％。这种进步是由于推理过程中改进模型的思想深度造成的。在AIME2025测试集中，最古老的型号每个问题平均使用12K令牌，而新模型的每个问题平均使用23K令牌，表明它们在解决问题的过程中具有更详细，更详细的思想。 DeepSeek说，认为ChainDeepseek-R1-0528的融合对于研究学术推理模型和行业中小型模型的发展极为重要。 DeepSeek R1的最新版本针对主题“白痴”进行了优化。与以前的版本相比，更新的模型在重写，抛光，汇总和阅读理解等方案中降低了大约45-50％的幻觉率。根据R1的先前版本，更新的R1模型进一步优化了讨论，小说，散文和其他流派，这使您可以使用更完整的长度和结构进行更长的工作，从而呈现与人类偏好相近的写作风格。根据该公告，当前模型评估的结果与OpenAI O1-High相当，但是O3高和十四行诗Claude4之间仍然存在差距。在此更新R1之后，官方网站，Mini程序，APP和API的P上下文的长度仍然为64K。如果用户想要更长的上下文长度，则可以通过其他第三方平台调用R1-0528模型的开源版本，其上下文长度为128K。根据DeepSeek-R1的先前版本，此更新仍然是一个开放的S我们的模型，允许用户使用模型输出对模型进行蒸馏训练其他模型。此前，DePseek在5月28日向官方微信集团发布了一条消息，据说DeepSeekr1模型完成了“小测试更新”。欢迎来到官方网站，应用程序和迷你程序测试（开放深思熟虑），API接口和使用尚未更改。根据互联网用户的说法，此更新的有效性令人惊讶。从社交网络的评论来看，互联网用户更担心的是DeepSeekr1更新之后的漫长时刻。根据评估，DeepSeek中此独特任务的处理时间可以达到30-60分钟。（原始标题：DeepSeek正式宣布了R1更新：一般性能更接近国际模型的上部，以提高思想和推理能力的深度）

当前网址：https://www.zona-d.com//a/keji/168.html

你可能喜欢的：