
7月13日的新闻,美国创业公司困惑性首席执行官Aravind Srinivas今天发布了一条信息,即月亮黑暗面的Kimi K2模型将在测试中很好地运作,并且可以在将来根据K2进行培训后实施。 Live Mint在今年1月报道说,DeepSeek R1以前曾被用于模型培训。您的K2是月球的黑暗面。 Kimi昨天刚刚启动了他的第一个开源型号,该模型昨天启动了数十亿个参数,突出了代理商任务的代码特征和一般特征。这是用于通用代理任务的良好MOE体系结构的基本模型,总1T参数和32B的激活参数。他从Moon Dark Side了解到,Kimi K2在参考性能测试中使用开源模型实现了SOTA的结果,例如Banco SWE,Tau2,Acebench和Demustraight在代码,代理和数学推断任务中其关键能力。