老将

老将

21日,DePseek宣布DeepSeek推出了其最新的主要语言模型DeepSeek-V3.1。通过引入明显改进的代理(代理)代理(代理)功能,这进一步增强了全球AI市场的技术竞争。 v3.1的亮点是采用了新的混合推理体系结构,该结构允许模型在统一框架中支持两个“思想”和“不思想”。根据官方公告,新版本在培训后的优化中通过优化实现了工具,编程,搜索和其他任务的使用方面的重大改进。请注意,DeepSeek-V3.1使用EU8M0 FP8量表上参数的精度。 EU8M0 FP8专为未来的下一个国内筹码而设计。根据社区测试的数据,新的模型是Anthrope的Opus Claude 4,他在Aider的多语言编程参考点上保持了逐渐重要的成本Taja。这个经历Rmance Advance吸引了开发人员社区的普遍关注,并且这些模型在面部平台上的流行迅速。 DeepSeek同步并更新API接口,将上下文窗口扩展到128K,并增加对人API格式的支持以简化迁移。更重要的是,该公司宣布将从2025年9月6日实施新的API价格计划,并将取消夜间折扣。根据官方DeepSeek网站的说法,该网站是一种朝着代理商时代发展的混合推理体系结构,此更新包括以下重要更改:混合推理体系结构:该模型承认思想方式和没有思考的方式。更高的思想效率:与DeepSeek-R1-0528相比,DeepSeek-V3.1-bayardsiiento可以在更少的时间内给出答案。改进的代理能力:通过训练后的优化,新模型在使用工具中的性能以及代理的任务具有得到了显着改善。有效地,对新的思维方式(v3.1 Thought)进行了训练,可以考虑链条压缩。与上一代模型(R1-0528)相比,如果任务的性能基本相同,则令牌的消费量可能会降低20%-50%。新模型的重点是改善以编程和搜索为代表的代理的功能。根据DePeeek发布的数据,与公司以前的模型相比,代码维修测试V3.1(SWE)和命令行终端任务(终端银行)的性能已得到显着改善。在搜索任务中,这也是领导者在复杂的搜索测试(BrowseComp)中的指导模型,这需要几个步骤推断。社区进行的第三项测试进一步证实了编程功能的跳跃。根据数据,v3.1在辅助机构编程时获得了71.6%ssing claude 4o几种已知模型,包括pu。同时,该测试强调盈利能力,完成编程任务的成本仅为$ 1.01,这远低于某些封闭代码的专利模型。这些绩效指标的改进直接改善了商业场景中的DepSeek吸引力,例如自动编程和复杂的信息处理。开源和API更新已同步DepSeek,以继续其开源策略,并通过面部和魔术社区发布了V3.1的基础和培训模型。这次推出的模型的包机是685B,据说基本模型还具有基于V3的其他令牌840b。该公司特别提醒开发人员,新模型使用EU8M0 FP8量表的参数的精确度,而Sameder(Tokensor)一词(Tokensor)和聊天模板已进行了显着修改,因此它们必须在实现时指出最后一个文档。同样时间,API服务也已完全更新。除了将上下文长度扩展到128K外,DePseek还提供了输出格式的标准化。向开发人员援引更强大的工具的一份,例如承认维护它们的严格方法的功能调用。此外,为了降低生态过渡的成本,API增加了对人API格式的兼容性支持,这使开发人员更容易访问Deventive模型。商业化加速:API价格设置即将到来,除了技术和产品更新外,DePseek还采取了明确的营销步骤。该公司于2025年9月6日清晨宣布,该公司将自北京时间以来调整API接口的呼叫价格,此时将实施新版本的价格表,同时取消长期存在的夜间折扣。入口:0.5元/百万个令牌(缓存打击); 4元/m令牌的文化(缓存小姐)。出发:12元/数百万个令牌。所有API服务将根据原始价格政策进行计费,直到启用价格设置为止。该公司表示,该措施最好满足用户电话需求并扩展其API服务资源。
声明特性:以前的内容(包括照片和视频(如果有),如有)已由Netase Auto-Media平台的用户收费和发布。该平台仅提供信息存储服务。
注意:以前的内容(如果您有照片或视频)将由社交媒体平台NetEase Hao的用户收取和发布,仅提供信息存储服务。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注