知识库精选- 2025 年 2 月 9 日
type
status
summary
date
slug
tags
category
password
icon
- 《110页ARK重磅报告:AI颠覆一切,但没来得及覆盖DeepSeek》ARK 发布的 110 页重磅报告强调 AI 将彻底颠覆消费和企业软件领域,AI 购物代理将简化购物体验,推动在线消费增长。同时,核电被寄予厚望,以满足 AI 发展带来的能源需求。尽管其他章节更新不多,AI 在药物研发中的应用仍被强调,助力提高效率、降低成本。报告略去 Web3 和加密货币相关内容,反映市场的波动。“AI 技术将是未来的核心驱动力。”

- 《前DeepSeek科学家万字大揭秘,RL与MoE如何点燃大模型革命》前 DeepSeek 科学家 Zihan Wang 在直播中深入探讨了 RL 与大语言模型(LLM)结合的创新训练框架 RAGEN。他强调,DeepSeek 的成功源于团队对代码细节的极致追求,"Talk is cheap, show me the code"。通过专家专注微调(ESFT),模型在任务适应性和泛化能力上显著提升,相比 LoRA 更具优势。

- 《陈巍:DeepSeek是否有国运级的创新?(下)从V3到R1的架构创新与误传的2万字长文分析》深入分析了 DeepSeek 的 V3 与 R1 架构创新,揭示了其训练流程的独特之处。V3 通过长文本扩展、精细调优和强化学习,提升了推理能力;而 R1 则在无监督强化学习下,突破了传统人类思维限制,展现出 “超越自然语言” 的逻辑推理潜力。“大模型的未来,不仅在于数据的丰富,更在于训练的创新。”

- 《2025DeepSeek爆火详细报告:回顾DeepSeek的爆火过程》该报告完整回顾了DeepSeek的爆火过程,它的成功引发了国际关注,其技术实力获得广泛认可,用户数快速增长。其爆火原因包括免费使用策略、开源架构、技术创新、自媒体传播、云厂支持、硬件兼容性以及创始人的励志背景等。
- 《DeepSeekV3技术报告》中文翻译版
- 中信建投:《DeepSeek R1深度解析及算力影响几何》
- 来觅研究院:《机器人2024年四季度投融市场报告》
