C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  一级通信军士

注册:2018-6-2420
发表于 2025-2-6 09:08:44 来自手机 |显示全部楼层
本帖最后由 dingyan1314 于 2025-2-6 09:52 编辑

国产模型近期取得了哪些显著突破,以及对行业的影响是什么?
答:近期国产模型如deepseek等取得了显著突破,deepseek实现了工程上的优化,降低了成本。在保持良好效果的同时,其性能和定价策略使其成为强有力的竞争者,并且开源特性有望加速国产应用开发及推广应用。此外,Deepseek的R1模型在解决复杂数知识题方面表现出高效性,适用于教育科研等领域,算法创新带来的模型优化空间很大,有助于缩小国内模型与海外模型的差距。
算力需求在未来会如何变化?
答:算力需求在未来不会一定下降,尽管在有限算力基础上的算法优化取得突破,但更大的制动模型训练仍需大量算力。随着应用的加速发展,推理算力的需求将显著增长,因此算力投入应侧重于推理侧。
对于AI应用投资方向的看法如何?
答: 2025年AI应用将是重要的投资方向,尤其是agent或AI应用。随着部署模型及推理成本下降,AI应用的渗透和普及将得到推动。同时,R1的经典版能在高端工作场景下本地运行,小米的端侧模型也有望在较短时间内得到普及,这将进一步促进AI智能终端的发展。关注AI应用生态打造,如字节跳动的相关进展。
对于后续AI领域发展的展望是什么?
答:总体来看,在有限算力基础上通过算法优化的突破将带来持续的创新迭代空间,有助于加速应用进展。因此,大家对AI从投资到应用阶段的发展越来越看好,特别是端侧发展。
DEEPSEEK R1模型发布的重要性及特点是什么?
答:DEEPSEEK R1模型是其企业1月20日发布的重大成果,第一,其创新性在于首次完全通过强化学习训练大语言模型,不依赖监督微调或人工标注数据。这一突破得到了业内广泛认可,证明了仅通过奖励信号就能训练出强大的推理能力,对整个大模型领域具有重要贡献。第二,从评分上来看,该模型与O系列模型(如O1系列)非常接近,甚至在某些测评集中的表现超过了O1系列模型,例如在数学测评集中的评分达到了97.3%,而OpenAI的O1是96.4%。第三个事实是关于该模型的成本问题,包括V3模型的训练成本和DEEPSEEK R1 API的成本。其中,V3模型的训练成本大约为600万美金,但这个数字仅指GPU花费,不包括前期研究、架构算法、实验等其他成本。此外,其发布的DEEPSEEK R1 API定价显著低于O1模型的API成本,调用成本随着调用规模和当前发展阶段的定价策略而降低。
在成本方面,V3模型有何特点?
答:V3模型在训练成本上有所下降,这得益于工程优化以及创新算法如通信重叠、FP8混合精度框架和多头注意机制的应用。从V2到V3再到发布的R1模型,整个系列一直保持着在工程优化上降低成本的优势。
R1模型为何能引起广泛的关注?
答:R1模型受到广泛的关注是因为产业发展到了一个关键阶段,开源模型能力接近甚至超越闭源模型成为事实,而R1模型的出现进一步推动了这一趋势,并且其训练成本和API调用成本的显著降低使得它在全球范围内获得了广泛关注。
模型的最新表现和发展情况如何?
答:模型在算法上具有显著创新,评分接近广泛使用的O1系列模型,但可能仍不及O3模型。训练成本有较大下降,不仅体现在论文提及的600万美金范围内,API成本也显著低于O1模型。此外,其APP在全球范围内登顶美国和中国APP榜单,保持在总榜和效率榜第一名的位置,显示了其快速出圈的现象。最后,开源模型在这一阶段超越闭源模型的趋势明显,模型的开源举措加速了这一传播过程。
在假期期间,美股科技股的股价表现如何,特别是头部科技企业的表现?AI技术突破对整个科技行业的影响以及头部科技企业在交流会上分享的核心观点是什么?
答:在假期期间,美股科技企业的股价出现显著分化。其中,英伟达股价下跌了18.44%,MicroSoft股价下跌7%。而像苹果、meta、google等应用型科技企业股价表现强劲,苹果上涨了5.52%,meta上涨8.3%,google大概上涨了2%。扎克伯格在meta的交流会上认为每家企业的技术突破和产品发布都会带来新的理念,从而推动整个行业进步。对于算力和应用,meta的核心观点是计算资源将更多用于推理阶段,这将提升智能水平和服务质量,使得推理模型受到更多重视。MicroSoft则认为云计算的发展将促使更多人购买云服务器,并且随着推理计算成本下降,将带动人工智能服务消费增加和更多应用程序开发。MicroSoft已提前提供DEEPSEEK模型,并预计能通过云服务和智能终端优势,在模型提升和成本下降中获得业务增长。
过去一周内,国内外科技巨头对DEEPSEEK模型的反应和应用情况如何?
答:过去一周,包括英伟达、AMAZON、MicroSoft等海外企业以及中国电信天翼云、百度智能云在内的国内企业,都将DEEPSEEK部署在其平台和云服务上。同时,C端应用如秘塔AI搜索已接入DEEPSEEK API,结合实时搜索能力和高质量常识库,实现了最强推理与全网实时搜索结合的用户体验。这表明整个行业都在积极拥抱算法创新带来的模型提升和成本下降。
对AI行业的意义是什么?
答:首先,模型优化实现成本降低,中长期仍需关注其突破节奏和达到预期API所需时间。其次,DEEPSEEK模型在教育、科研、数学等领域具有更强的推理能力,将带来积极影响。此外,尽管短期内对正开支缩减的担忧,但海外大厂仍保持积极态度。从投资方向上看,agent和端侧是未来两三年的重要发展方向,尤其是随着模型体量缩小和训练推理成本下降,端侧应用有望快速普及。
DEEPSEEK的出圈意味着什么,对中国的AI科技企业有何影响?
答:DEEPSEEK的出圈意味着中国的AI模型在追赶海外投资模型方面取得了显著进展,这得益于中国在工程和算法上的创新以及开源努力。整体上,这有利于提升中国AI科技企业的估值。短期来看,通过EPS实现估值提升存在较大不确定性,但该事件有助于整体提升中国AI科技企业的估值,并表明中国科技企业在全球大模型和应用竞争中有一定的话语权。
哪些标的值得关注?
答:有五个主要的应用方向:一是AI玩具和情感陪伴,基于文字大语言模型的应用在情感陪伴上有重要场景,如实丰学问、乐鑫科技、昆仑万维等企业可能受益;二是AI电商,作为生产力工具能提高匹配效率并获取客户认可,焦点科技、值得买等已推出相关产品;三是AI工具,如美图、创业黑马等提供的企业痛点解决方案,可优化政策解读、文档撰写等效率;四是AI游戏,游戏行业估值较低,3D模型突破将助力效率提升,巨人网络、恺英网络等有望受益;五是港股科技企业,如小米、alibaba、Tencent、金山云等,它们在模型、广告匹配、电商和云计算等领域具有投资潜力。



举报本楼

您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2025-2-23 17:06 , Processed in 0.259840 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图