直达「 通往AGI之路 」飞书知识库 →
知识库精选- 2025 年 3 月 3 日
知识库精选- 2025 年 3 月 3 日
知识库精选|2025-3-3|最后更新: 2025-3-3
type
status
summary
date
slug
tags
category
password
icon
  • 大模型 “注意力简史”:与两位 AI 研究者从 DeepSeek、Kimi 最新改进聊起》本期节目邀请了两位 AI 研究者探讨大模型中的注意力机制改进。肖朝军与傅天予分别分享了 InfLLM 和 MoBA 的创新,聚焦于如何在推阶段高效处理超长文本。注意力机制的核心在于理解词与上下文的关系,克服了传统 RNN 的遗忘问题,推动了长文本处理的革命。正如他们所言:“注意力机制就是让模型记住过去的每一个词,进而理解未来。”
notion image
  • 你的职业规划跟上AI节奏了吗?Anthropic CEO:初级程序员确定将在18个月内被淘汰》在 Hard Fork 播客中,Anthropic CEO Dario Amodei 透露,AI 将在 18 个月内替代初级程序员,强调 "现实世界任务" 和 "扩展思考模式" 是 Claude 3.7 的创新之处。虽然短期内 AI 助力程序员提升生产力,但长远看,编程领域将迎来颠覆性变化。此外,他对中美 AI 竞争表示关注,指出中国企业在技术创新上已与西方并肩,Dario公开支持通过技术封锁来遏制中国发展。
notion image
  • DeepSeek源神!Deepseek不语,只是一味开源》DeepSeek 于 2025 年 3 月 1 日圆满结束为期六天的 “开源周”,推出六项颠覆性技术,涵盖 AI 计算、通信和存储等领域,开启 AI 时代的 “基建革命”。其创新如 FlashMLA 优化 GPU 资源分配,DeepEP 提升数据传输效率,DeepGEMM 简化矩阵乘法代码,极大提升算力和效率。
notion image
知识库精选- 2025 年 3 月 4 日知识库精选- 2025 年 3 月 2 日