月球的黑暗面返回基本模型的战场：赌注“模型

日期：2025-07-13 浏览：

图片来源：视觉中国谈判行动时，您可以查看Jin Qilin分析师的研究报告。这是授权，专业，及时和包容的，可帮助他利用潜在的主题机会。图像来源：视觉中国六个月后，蓝鲸新闻（Zhuxxi记者）7月12日（Zhuxxi记者），《六个小龙》的“大型模型”之一，终于推出了新一代的春季模特Kimi K2。根据官方报道，Kimi K2是一种基本的MOE架构模型，具有强大的代码功能，非常适合常见代理。总参数为10亿，激活参数为320亿。同步开源于7月11日发布，包括两个版本：KIMI-K2基本基本模型和Kimi-K2-Instructure培训模型的模型，该模型更适合常见的聊天任务和代理。 Kimi K2在评估与自主编程有关的技能，工具调用和数学推断方面取得了出色的表现。例如，Swevityó银行，AIME 2025和其他资格集，例如，Kimi-K2指令得分超过DeepSeek-V3和Alibaba Qwen3。通过将其与新的经纪人“ Kimi-Osearcher”结合起来，该公司于6月底开始进行内部测试，并不难知道月球黑暗面的想法已成为“模型或代理人”。模型本身可以整合做出独立决策和执行任务的能力，作为代理，您可以解决复杂的任务。在官方使用的情况下，用户要求Kimi K2帮助计划Coldplay乐队之旅的行程。该型号使用17个工具调用来涵盖搜索，日历，电子邮件，航班，餐厅储备和其他链接，制定了飞机，葡萄酒和旅游业的完整计划以及视觉报告。敏捷能力正成为国家和外国模式的主要制造商试图下注的进化方向。本周，马斯克Xai的人工智能创业公司推出了新一代的大型模型Grok 4，其中包括一个具有特征的一个和多个代理的版本，例如使用工具和实时搜索。人类在启动Claude 4系列模型时也脱颖而出，该模型为编程，推理和可以处理复杂的长期任务的编程，推理和代理商“建立新标准”。月亮的黑暗面在Kimi K2技术博客中分享了他对开放代理商的智能创造的看法。 Pette是代理智能的重要基础，它允许模型具有基本知识，理解和推理能力，并且可以通过随后的强化学习来更有效地学习。但是，“人类数据就像是“有限的化石燃料”，因此在训练之前提高数据的效率是扩大当前AI的关键挑战。在训练之后的舞台上，最大的模型不再仅取决于人类数据，而是开始获得奖励并自我优化。Haviors和结果。，以实现超越人类技能的可能性。 Yueji的黑暗面说：“您的K2受这些想法的训练。”它还强调，Kimi K2是建立一般代理功能的稳定基础，但是总代理商需要更高级的功能，例如思考和理解视觉，并计划将来将这些功能添加到模型中。此外，长文本处理功能曾经是您的核心优势。这次ES 128K的Kimi K2的上下文长度比最近启动的模型少。值得指出的是，Kimi K2是中国开源参数级别的第一个模型。其他出色的型号制造商已经使用封闭的代码路线训练了数十亿美元参数的型号，例如腾讯Hunyuan Turbo和Minimax Abab 6.5。通过培训巨型模型，以数十亿个参数（例如Kimi K2）的级别，Moutyls的黑暗面使创新和创新的Muones Optimizer。与传统的Adam Optimizer相比，MON具有更高的代币使用效率，这使您可以更快，更有效地学习更大的模型。同时，为了解决超大训练期间发现月球的不稳定问题，该团队提出了稳定性改进技术的粘膜胶囊，以支持Kimi K2，以完成155亿个令牌的文件，而训练损失的值则没有异常的峰值。自从今年年初出现DeepSeek以来，月球的黑暗面已经发布了几次技术或产品的更新，但从未恢复过对外界的热情期望，一旦它非常适度和沉默。随着Kimi K2的推出，这位创业明星终于在基本模型的舞台上重新引起了人们的关注，并且该纸牌游戏尚未结束。官方NINA Finance帐户 24-最新信息和财务视频的流离失所以及扫描QR码以下更多粉丝（sinafinance）

月球的黑暗面返回基本模型的战场：赌注“模型

推荐阅读