老将 – 今日看料：暗黑爆料免费版揭开神秘面纱

21日，DePseek宣布DeepSeek推出了其最新的主要语言模型DeepSeek-V3.1。通过引入明显改进的代理（代理）代理（代理）功能，这进一步增强了全球AI市场的技术竞争。 v3.1的亮点是采用了新的混合推理体系结构，该结构允许模型在统一框架中支持两个“思想”和“不思想”。根据官方公告，新版本在培训后的优化中通过优化实现了工具，编程，搜索和其他任务的使用方面的重大改进。请注意，DeepSeek-V3.1使用EU8M0 FP8量表上参数的精度。 EU8M0 FP8专为未来的下一个国内筹码而设计。根据社区测试的数据，新的模型是Anthrope的Opus Claude 4，他在Aider的多语言编程参考点上保持了逐渐重要的成本Taja。这个经历Rmance Advance吸引了开发人员社区的普遍关注，并且这些模型在面部平台上的流行迅速。 DeepSeek同步并更新API接口，将上下文窗口扩展到128K，并增加对人API格式的支持以简化迁移。更重要的是，该公司宣布将从2025年9月6日实施新的API价格计划，并将取消夜间折扣。根据官方DeepSeek网站的说法，该网站是一种朝着代理商时代发展的混合推理体系结构，此更新包括以下重要更改：混合推理体系结构：该模型承认思想方式和没有思考的方式。更高的思想效率：与DeepSeek-R1-0528相比，DeepSeek-V3.1-bayardsiiento可以在更少的时间内给出答案。改进的代理能力：通过训练后的优化，新模型在使用工具中的性能以及代理的任务具有得到了显着改善。有效地，对新的思维方式（v3.1 Thought）进行了训练，可以考虑链条压缩。与上一代模型（R1-0528）相比，如果任务的性能基本相同，则令牌的消费量可能会降低20％-50％。新模型的重点是改善以编程和搜索为代表的代理的功能。根据DePeeek发布的数据，与公司以前的模型相比，代码维修测试V3.1（SWE）和命令行终端任务（终端银行）的性能已得到显着改善。在搜索任务中，这也是领导者在复杂的搜索测试（BrowseComp）中的指导模型，这需要几个步骤推断。社区进行的第三项测试进一步证实了编程功能的跳跃。根据数据，v3.1在辅助机构编程时获得了71.6％ssing claude 4o几种已知模型，包括pu。同时，该测试强调盈利能力，完成编程任务的成本仅为$ 1.01，这远低于某些封闭代码的专利模型。这些绩效指标的改进直接改善了商业场景中的DepSeek吸引力，例如自动编程和复杂的信息处理。开源和API更新已同步DepSeek，以继续其开源策略，并通过面部和魔术社区发布了V3.1的基础和培训模型。这次推出的模型的包机是685B，据说基本模型还具有基于V3的其他令牌840b。该公司特别提醒开发人员，新模型使用EU8M0 FP8量表的参数的精确度，而Sameder（Tokensor）一词（Tokensor）和聊天模板已进行了显着修改，因此它们必须在实现时指出最后一个文档。同样时间，API服务也已完全更新。除了将上下文长度扩展到128K外，DePseek还提供了输出格式的标准化。向开发人员援引更强大的工具的一份，例如承认维护它们的严格方法的功能调用。此外，为了降低生态过渡的成本，API增加了对人API格式的兼容性支持，这使开发人员更容易访问Deventive模型。商业化加速：API价格设置即将到来，除了技术和产品更新外，DePseek还采取了明确的营销步骤。该公司于2025年9月6日清晨宣布，该公司将自北京时间以来调整API接口的呼叫价格，此时将实施新版本的价格表，同时取消长期存在的夜间折扣。入口：0.5元/百万个令牌（缓存打击）； 4元/m令牌的文化（缓存小姐）。出发：12元/数百万个令牌。所有API服务将根据原始价格政策进行计费，直到启用价格设置为止。该公司表示，该措施最好满足用户电话需求并扩展其API服务资源。
声明特性：以前的内容（包括照片和视频（如果有），如有）已由Netase Auto-Media平台的用户收费和发布。该平台仅提供信息存储服务。
注意：以前的内容（如果您有照片或视频）将由社交媒体平台NetEase Hao的用户收取和发布，仅提供信息存储服务。

发表回复 取消回复

发表回复取消回复