知识库精选- 12 月 27 日
type
status
summary
date
slug
tags
category
password
icon
- 《DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力》DeepMind 最新研究表明,逆向思维训练可以显著提升大语言模型(LLM)的推理能力。研究通过构建逆向推理数据集,并利用知识蒸馏方法指导模型训练,验证了逆向思维在多种推理任务中的有效性。文章指出,结合正向和逆向问题能够提高模型性能,尤其在中等难度问题上表现最佳。这一发现为未来 LLM 研究提供了新的思路。
- 《国产开源模型,代码能力比肩 Claude,DeepSeek-V3 正式发布》DeepSeek 发布了其开源模型 DeepSeek-V3,具备 671B 参数,性能接近顶尖闭源模型 Claude 3.5-Sonnet。相比前代,DeepSeek-V3 在知识、长文本和数学任务上均有显著提升,并且生成速度提升至每秒 60 个令牌。API 服务定价调整为每百万输入 tokens 0.5 元,优惠期内维持 0.1 元。模型支持 FP8 训练并已开源权重,旨在缩小开源与闭源模型之间的能力差距,未来将继续扩展功能。
- 《谷歌首次公开:321个世界级企业AI应用实战,6大场景加速商业落地》谷歌首次公开了 321 个企业 AI 应用案例,归纳为六大核心场景:客户服务、员工赋能、创意内容、数据分析、代码生成和网络安全。这些案例展示了 AI 如何提升客户体验、优化运营、提高员工效率以及增强创意生产,助力企业在竞争中脱颖而出。通过深度分析,各企业借助 AI 技术实现商业化落地,为决策者提供了宝贵的经验借鉴。
- 《李想谈“理想”最新战略 —— 转型 AI 公司,目标国内大模型 Top3,未来构建统一 VLA 模型,成为你的硅基家人》理想汽车在 2024 年宣布转型为 AI 公司,目标是成为国内大模型领域的 Top3。CEO 李想指出,汽车的智能化将超越传统软件,进化为 AI 驱动的 “空间机器人”。理想的 AI 战略包括推出 “理想同学” 助手和 L4 级自动驾驶技术,同时提出 VLA 模型(视觉、语言、行动)概念,旨在将 AI 深度融入家庭生活。李想相信,随着中国智能汽车的崛起,理想有潜力成为全球领先的 AI 企业。