3月1日晚间消息,DeepSeek开源周第六日,DeepSeek官方团队在Github和知乎上公布了DeepSeek-V3/R1推理系统的技术解读。据官方介绍,通过优化吞吐和延迟,DeepSeek“理论上一天的总收入为562027美元,成本利润率545%”。
在该技术解读发布后,硅基流动创始人、CEO袁进辉第一时间现身评论区点评道:“DeepSeek 官方披露大规模部署成本和收益,又一次颠覆了很多人认知。”他指出,“现在很多供应商还做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,由大量小Expert组成,导致瞄准其它主流模型结构开发的系统都不再有效,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。”
袁进辉表示,“这些成果充分体现了DeepSeek团队第一性原理的思考方式和强悍的意志,他们应该是首先是基于某些原因想到了用这样的模型结构,然后发现这样的结构无论是训练还是推理,要做好都有非常大的工程挑战,不过这些问题在他们工程团队来说并不是搞不定的,关键是花那么大力气做完是否有大的收益呢,在最终结果出来前,谁也说不准,他们还是赌了,结果是赌对了。”
当然,对于上述推测,袁进辉也进一步表示,“这也可能是反过来的,基于系统的出发点设计了这样一个全新的模型结构。”
今年春节期间,在DeepSeek-R1、DeepSeek-V3 开源并引发广泛关注后,硅基流动作为初创企业,领先业内绝大多数企业率先宣布大模型云服务平台 SiliconCloud 上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1,允许用户通过SiliconCloud使用稳定的DeepSeek访问服务。
据袁进辉个人透露,公司是赌DeepSeek最早的团队了,DeepSeek V2时,很长一段时间公司是官方之外唯一第三方供应商。“我们当时眼光为什么那么好呢?其实主要是赌开源,也只能用开源模型,但当时开源模型普遍还不太行,DeepSeek恰好开源了,编程能力非常突出,很多人想用,就只好硬着头皮把DeepSeek支持了。”袁进辉表示。(文猛)
北京...
11月30日下午消息,广汽集团与华为举行智能汽车战略合作签约活动,双方签署了深化合作协议。广汽集团董事长曾庆洪、总经理冯兴亚,华为轮值董事长徐直军、智能汽车解决方案BU...
早上好,黄金、原油周一开盘暴跌。 刚刚,现货黄金开盘跳空低开15美元/盎司,报2731美元...
金融界5月27日消息,天眼查App显示,近日,国家集成电路产业投资基金三期股份有限公司成立,法定代表人为张新,注册资本3440亿人民币,经营范围为私募股权投资基金管理、创业投资基金...