3月1日晚间消息,DeepSeek开源周第六日,DeepSeek官方团队在Github和知乎上公布了DeepSeek-V3/R1推理系统的技术解读。据官方介绍,通过优化吞吐和延迟,DeepSeek“理论上一天的总收入为562027美元,成本利润率545%”。
在该技术解读发布后,硅基流动创始人、CEO袁进辉第一时间现身评论区点评道:“DeepSeek 官方披露大规模部署成本和收益,又一次颠覆了很多人认知。”他指出,“现在很多供应商还做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,由大量小Expert组成,导致瞄准其它主流模型结构开发的系统都不再有效,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。”
袁进辉表示,“这些成果充分体现了DeepSeek团队第一性原理的思考方式和强悍的意志,他们应该是首先是基于某些原因想到了用这样的模型结构,然后发现这样的结构无论是训练还是推理,要做好都有非常大的工程挑战,不过这些问题在他们工程团队来说并不是搞不定的,关键是花那么大力气做完是否有大的收益呢,在最终结果出来前,谁也说不准,他们还是赌了,结果是赌对了。”
当然,对于上述推测,袁进辉也进一步表示,“这也可能是反过来的,基于系统的出发点设计了这样一个全新的模型结构。”
今年春节期间,在DeepSeek-R1、DeepSeek-V3 开源并引发广泛关注后,硅基流动作为初创企业,领先业内绝大多数企业率先宣布大模型云服务平台 SiliconCloud 上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1,允许用户通过SiliconCloud使用稳定的DeepSeek访问服务。
据袁进辉个人透露,公司是赌DeepSeek最早的团队了,DeepSeek V2时,很长一段时间公司是官方之外唯一第三方供应商。“我们当时眼光为什么那么好呢?其实主要是赌开源,也只能用开源模型,但当时开源模型普遍还不太行,DeepSeek恰好开源了,编程能力非常突出,很多人想用,就只好硬着头皮把DeepSeek支持了。”袁进辉表示。(文猛)
周一(7月8日)亚市盘中,法国左派人士在选举中赢得多数席位,宽松财政政策的前景令投资者不安,欧元承压下滑,不过亚股整体上涨,因上周美国非农数据证实“软着陆”前景。投资者本周关注美联储主席鲍威尔在...
专题:2024中国品牌节女性论坛 “2024中国品牌节女性论坛”于5月25日-26日在北京举办。阳光媒体集团董事长杨澜出席并以“AI时代创造的文...
11...
当地时间10月20日下午,为期12天的联合国《生物多样性公约》第十六次缔约方大会(COP16)在哥伦比亚的卡利举行仪式性开幕式。联合国秘书长古特雷斯、哥伦比亚总统佩特罗、...