📔 更新日志
2026-06
- 新增文档:番外:模型蒸馏,把大模型能力倒进小模型的科普
- 新增文档:13:AI Native 产品设计,概率系统如何提供确定体验
- 新增文档:12:大模型工程,KV Cache、推理成本与部署系统
- 新增文档:11:Agent,从聊天机器人到任务执行系统
- 新增文档:10:Tool Use,让大模型从「会说」走向「会做」
- 新增文档:「用第一性原理理解 LLM」系列 06:Scaling Law 与涌现、07:推理与生成、08:幻觉的本质、09:RAG
- 更新文档:对「用第一性原理理解 LLM」系列做了一轮整体打磨——校订机制表述与技术细节、统一并补齐章节配图,并在首页加入系列入口卡片
2026-05
- 新增文档:01:LLM 的第一性原理:token 预测
- 更新文档:01:LLM 的第一性原理:token 预测,新增 5 张章节配图
- 新增文档:02:Token 与 Embedding:语言如何变成模型能处理的数字
- 更新文档:02:Token 与 Embedding:语言如何变成模型能处理的数字,新增 5 张章节配图
- 新增文档:03:Transformer 与 Attention:模型如何「看见」上下文
- 更新文档:03:Transformer 与 Attention:模型如何「看见」上下文,新增 5 张解释性配图
- 新增文档:04:语言是世界的压缩:为什么预测文字会长出智能
- 更新文档:04:语言是世界的压缩:为什么预测文字会长出智能,新增 5 张解释性配图
- 新增文档:05:预训练、微调与对齐:大模型如何从续写机器变成助手,附 6 张解释性配图
- 新增文档:LLM 定价的数学原理 01:大模型推理是怎么回事
- 新增文档:LLM 定价的数学原理 02:把推理过程写成方程,附 T_compute / T_memory 交互模拟器
- 新增文档:LLM 定价的数学原理 03:从推理耗时到推理成本
- 新增文档:LLM 定价的数学原理 04:拆开 KV cache
- 更新文档:LLM 定价的数学原理 03:从推理耗时到推理成本,新增 Cost / Token 交互模拟器
- 新增文档:LLM 定价的数学原理 05:从单卡到集群——并行与互联
- 更新文档:👋 你好,世界!,新增「最近发布」板块列出最新文章
2026-01
- 新增文档:Vibe Coding
2025-12
- 新增文档:意图识别
2025-06
- 恢复更新,站点升级到 Nextra-4
- 更新文档:用户价值,为它添加了个案例:案例:语雀个人线的 What, Why, How
2024-04
- 更新文档:用户价值
- 更新文档:RAG 检索增强生成
2024-03
- 新增文档:RAG 检索增强生成
- 新增文档:标注回复
2024-02
- 支持 i18n
- 新增文档:SaaS 软件即服务
- 新增文档:用户价值
- 新增文档:产品七问
- 目录结构调整
- 站点域名更新:https://insights.kaho.io
- 新增文档:名词解释
- 新增文档:日本旅行画册
2024-01
最后更新于: