知识库精选- 2025 年 1 月 29 日
type
status
summary
date
slug
tags
category
password
icon
- 《DeepSeek 为什么省钱 》DeepSeek相关的基本术语,阐述其省钱原因,包括高效硬件使用、创新训练方法、高效模型压缩、避免无效尝试等,还提及成本对比及创新蒸馏技术。接着从核心思想、技术实现方式(知识表示、温度调节)、训练过程(基本流程、关键点)、DeepSeek的创新及有效性原因(信息压缩、概率分布学习、泛化能力)等方面详细讲述了蒸馏工作原理
