过去一个月,DeepSeek以惊人之势席卷全球AI市场。据Sensor Tower统计,其移动应用上线仅18天便斩获1600万次下载,几乎是ChatGPT同期数据的两倍,目前已在140个市场成为下载量最高的移动应用,在国内掀起的热潮,远远超过了当年ChatGPT横空出世时的热度。
作为业内首个支撑联网功能的开源推理模型,DeepSeek以完全免费的策略迅速俘获全球用户,然而,“泼天的流量”加上大规模DDOS攻击,也让DeepSeek也面临了严峻挑战。出现包括无法注册、“当前操作暂时无法完成”提示和API服务中断等问题,用户体验大打折扣。
面对DeepSeek官方服务频频宕机的现状,国内开发者和企业用户迫切需要更稳定、更可靠的推理服务。
2月1日,以快速上线最新模型,甚至有时候比官方服务还要快而著称的“卷王”硅基流动,终于上线了期待已久的R1服务。
硅基流动创始人、CEO 袁进辉在社交媒体也透露了合作开发过程。
显然,这次最令人兴奋的是,这是一个与HUAWEI云合作推出的,基于昇腾云的DeepSeek R1&V3推理服务。
而根据多方消息,它也是业内首个基于国产昇腾910B芯片提供推理服务的R1模型产品。
根据硅基流动先容:通过双方联合创新,并借助自研推理加速引擎,硅基流动团队基于HUAWEI云昇腾云服务部署的DeepSeek模型,已达全球高端GPU部署模型的同等效果。API定价与DeepSeek官方优惠期价格保持一致。
在此之前,英伟达和AMAZON等头部算力平台也已经快速提供DeepSeek的模型服务,硅基流动在此提到的“全球高端GPU”直指英伟达。
一个中国自己的顶级模型,一个中国厂商的推理芯片,在中国的新一代AI云技术平台推动下,有了放在全球范围都属一流的全过程部署方案。这显然是中国AI生态又一个历史时刻。
一直在关注DeepSeek的 a16z 知名投资人 Marc Andreessen在推特上也转发了这个信息,并发了一个侧目的表情。
硅基流动与HUAWEI云此次合作,重新部署了完整的R1和V3模型,并提供便捷的API调用方式,不仅有效缓解了DeepSeek官方服务器的压力,避免了频繁掉线的问题,更满足了企业级业务的商用部署需求。通过API与本地客户端结合,企业和开发者还可以进行个人常识库配置等更多自定义操作,灵活度更高。
DeepSeekR1使用英伟达H800 GPU 进行训练,此前有分析师Alexander Doria推测,DeepSeek在推理阶段主要依赖HUAWEI自研的Ascend AI加速器,以降低成本并减少对西方硬件的依赖,这次也算是某种程度上的“官宣”了。
在DeepSeek全球爆火引发算力紧张之际,硅基流动与HUAWEI云联手推出的国产化解决方案的意义,或许超出了缓解算力压力的初衷,更是为国产AI算力在大模型部署中开辟新赛道,同时也为更多企业提供了一个可借鉴的国产化落地思路。
这也是开源的魅力所在,基于开源的策略,DeepSeek不是在分割一个固定的蛋糕。云服务商可以自主部署获得收益。应用开发商能以更低成本接入服务。全球各地的技术团队都能基于开源模型搭建本地化服务。还削弱了闭源AI模型企业依靠技术壁垒独占市场的做法,促使产业链利润向两端流动,从而撬动了更大的市场空间。这也说明了为何包括MicroSoft、AMAZON和NVIDIA在内的科技巨头,也纷纷选择接入DeepSeek的模型。
|