📔 更新日志

2026-06

新增文档：番外：模型蒸馏，把大模型能力倒进小模型的科普
新增文档：13：AI Native 产品设计，概率系统如何提供确定体验
新增文档：12：大模型工程，KV Cache、推理成本与部署系统
新增文档：11：Agent，从聊天机器人到任务执行系统
新增文档：10：Tool Use，让大模型从「会说」走向「会做」
新增文档：「用第一性原理理解 LLM」系列 06：Scaling Law 与涌现、07：推理与生成、08：幻觉的本质、09：RAG
更新文档：对「用第一性原理理解 LLM」系列做了一轮整体打磨——校订机制表述与技术细节、统一并补齐章节配图，并在首页加入系列入口卡片

2026-05

新增文档：01：LLM 的第一性原理：token 预测
更新文档：01：LLM 的第一性原理：token 预测，新增 5 张章节配图
新增文档：02：Token 与 Embedding：语言如何变成模型能处理的数字
更新文档：02：Token 与 Embedding：语言如何变成模型能处理的数字，新增 5 张章节配图
新增文档：03：Transformer 与 Attention：模型如何「看见」上下文
更新文档：03：Transformer 与 Attention：模型如何「看见」上下文，新增 5 张解释性配图
新增文档：04：语言是世界的压缩：为什么预测文字会长出智能
更新文档：04：语言是世界的压缩：为什么预测文字会长出智能，新增 5 张解释性配图
新增文档：05：预训练、微调与对齐：大模型如何从续写机器变成助手，附 6 张解释性配图
新增文档：LLM 定价的数学原理 01：大模型推理是怎么回事
新增文档：LLM 定价的数学原理 02：把推理过程写成方程，附 T_compute / T_memory 交互模拟器
新增文档：LLM 定价的数学原理 03：从推理耗时到推理成本
新增文档：LLM 定价的数学原理 04：拆开 KV cache
更新文档：LLM 定价的数学原理 03：从推理耗时到推理成本，新增 Cost / Token 交互模拟器
新增文档：LLM 定价的数学原理 05：从单卡到集群——并行与互联
更新文档：👋 你好，世界！，新增「最近发布」板块列出最新文章

2026-01

新增文档：Vibe Coding

2025-12

新增文档：意图识别

2025-06

恢复更新，站点升级到 Nextra-4
更新文档：用户价值，为它添加了个案例：案例：语雀个人线的 What, Why, How

2024-04

更新文档：用户价值
更新文档：RAG 检索增强生成

2024-03

新增文档：RAG 检索增强生成
新增文档：标注回复

2024-02

支持 i18n
新增文档：SaaS 软件即服务
新增文档：用户价值
新增文档：产品七问
目录结构调整
站点域名更新：https://insights.kaho.io
新增文档：名词解释
新增文档：日本旅行画册

2024-01

站点正式上线，👋 你好，世界
新增文档：端午日本游记

最后更新于： 2026年6月17日

👋 你好，世界！💻 Vibe Coding