扩散模型(一)
本文介绍扩散模型,从最经典的 DDPM 到 一些改进工作,从 实施步骤 到 一些总括性的理论。 DDPM 扩散模型从自然界中的扩散过程获得灵感,正向的扩散过程是一种 熵增过程,会损…read more
自编码器: 自编码器架构分为 编码器(Encoder),解码器(Decoder),编码器将数据压缩为 低秩向量(低维空间中的一个点),而解码器将 压缩后的 低秩向量 重建为 原始数…read more
KL散度 D_{KL}(P||Q)=\sum_{x}P(x)log[\frac{P(x)}{Q(x)}] 上面的便是 KL 散度的公式,我们仔细分析一下这个公式,可以发现 KL 散…read more
近来,DeepSeek 由于其较低的成本以及优秀的效果成了一个极度热门的话题。 我将制作一系列的视频分享 DeepSeek 公开的论文中提到的部分技术。如果你对此感兴趣,欢迎关注我…read more
2025-1-20 解决“强化学习”模块下文章《强化学习(一)》的排版问题 2025-1-20 “强化学习”模块下文章《强化学习(三)——术语总览》补充术语“轨迹”
一个有趣的模拟宇宙(一)
这是一个测试文章