C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  上尉

注册:2015-11-144
发表于 2025-2-8 11:27:16 |显示全部楼层


亚星游戏官网-yaxin222


智东西(公众号:zhidxcom)

编辑 | 程茜

编辑 | 云鹏

44天,狂揽7.8万星的DeepSeek又创造了历史!

智东西2月7日消息,刚刚,DeepSeek在开源社区GitHub上的Star数首次超越OpenAI。

DeepSeek-V3的Star数为7.78万,OpenAI项目中,Star数最高的是实时音频转文本模型Whisper的,为7.57万

DeepSeek-R1的Star数也超过OpenAI其他项目,达到6.59万。openai-cookbook为OpenAI Star数第二高的项目6.15万,该项目是提供使用OpenAI示例代码和指南的官方开源项目。

这也是DeepSeek力压ChatGPT登顶美区App Store免费榜,在国内App Store免费榜同样位居第一后,创下的又一个历史时刻。
亚星游戏官网-yaxin222

▲DeepSeek开源项目(左)、OpenAI开源项目(右)(图源:GitHub)

在一众开源模型玩家中,DeepSeek的Star数也远超其他模型。

Meta的Llama系列模型中,2023年推出的开源模型Llama最高为5.75万,Llama 3次之为2.82万;阿里云通义千问的开源模型中,1月29日发布的Qwen2.5的Star数最高,达到1.49万;零一万物的Yi为7800;Anthropic的热门项目Anthropic-cookbook Star数为1.02万,该项目是提供样例实现参考的开源项目。

DeepSeek V3和DeepSeek R1分别于2024年12月26日和今年1月20日发布。

DeepSeek V3为DeepSeek自研MoE模型,参数量达到671B,激活参数量37B,在14.8T token上进行了预训练,该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。

DeepSeek R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。

当下,全球已经掀起了从芯片企业、云计算巨头到各路基础设施企业适配、接入DeepSeek的热潮,DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。

来源:智东西

举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2025-2-23 18:08 , Processed in 0.125675 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图