-
从0开始理解DeepSeek如何实现低成本的高效训练
DeepSeek-R1使用极低的训练成本实现了高效的训练,其模型性能在某些任务上能够达到与ChatGPT-o1相近甚至更优的水平。本文从其训练方法进行对比分析,浅析DeepSeek的系列模型实现高效训练的原理。 从V1到R1在DeepSeek系列的模型演进的过程中,引入了众多优化方法。以下依次列举V1到R1的各个模型,并简单列举其引入的创新方法。在后文中,会对其进行具体的分析说明。 Deep... -
美赛时间表
2025-1-24上午: 选题(A/B/C),每人分别借助GPT分析每道题目的主要思路: 分析题目要使用的基础模型 分析题目主要思路,可以比较简单 决定一下哪个选题更合适 交流,决定最终的选题 设计提示词,使用GPT开始构建初版的模型,以及相关解决方案 下午: 继续构建初版的模型,做完初版的模型 测试模型 2025-1-25上午: 下午: 2025-1-2... -
tar解压缩工具的命令清单
后缀缩写tar代表未压缩的tar文件。已压缩的tar文件则附加数据压缩格式的扩展名。常使用下列缩写: 缩写后缀 完整后缀 .tgz .tar.gz .tbz/tb2 .tar.bz2 .taz .tar.Z .tlz .tar.lzma .txz .tar.xz 用法可以将代表功能和选项的单个字母合并;当使用单个字母时,可以不用在字母前面加“-”。 ...
1