根据Kuai Technology 4月29日,今年早晨,开放的阿里巴巴新一代Tongyi Qianwen Model Qwen3(定义为Qianwen3),参数量为DeepSeek-R1的1/3,成本下降大幅下降。 Qianwen3是“混合推理模型”。 “快速思考”和“缓慢思考”被整合到同一模型中。对于简单的要求,您可以在几秒钟内“还原”答案。对于复杂的问题,您可以在许多步骤中“深入思考”以节省计算强度消耗。作为QWEN系列混合推理模型的新一代,QWEN3在许多权威评论(例如计算资源)中表现出了过于竞争性的结果,QWEN3模型已超过了先前的生成模型,其尺寸较小,真正实现了“小型和Fierceas”。 Qianwen3具有参数235B的总量,该参数在开放资源模型的明智级别上设定了一个新的高度。阿里巴巴说,只有4 H20可以用来部署Qianwen3全血版本,而VIDEO内存消耗只是具有相似性能的模型的三分之一。 30B和235B MOE模型,以及6个密集型模型,包括0.6b,1.7b,4b,8b,14b和32b。