Doraemonblog

发表于2025-05-30|更新于2025-05-30|笔记|course•maths

复习笔记复习题

发表于2025-05-25|更新于2025-05-25|TAI|周记•World Models•PGD

1.《WORLDMEM: Long-term Consistent World Simulation with Memory》1.1 概述世界模拟通过建模虚拟环境并预测动作的后果，在自主导航、游戏引擎替代等领域具有广泛应用。现有方法受限于有限的时序上下文窗口，难以维持长期一致性，导致场景重建时出现视角或时间跨度较大的不一致问题。这篇论文提出了WorldMem框架，旨在解决现有世界模拟方法在3D空间长期一致性上的不足。 1.2 核心框架 WorldMEM包含一个集成了记忆块的条件扩散变换器（Conditional Diffusion Transformer, CDiT），并有一个专用的记忆库（Memory bank），用于存储先前生成内容的记忆单元。通过从记忆库中检索这些记忆单元，并结合记忆块中的信息来指导生成，确保了世界模拟的长期一致性。首先初始化一个Memory...

数字电路与逻辑设计

发表于2025-05-21|更新于2025-05-21|笔记|course

计算方法

发表于2025-05-18|更新于2025-05-18|笔记|course•maths

A Comprehensive Survey of World Models

发表于2025-05-15|更新于2025-05-15|TAI|周记•World Models•ViT•FGSM

1.《Understanding World or Predicting Future? A Comprehensive Survey of World Models》这是一篇关于世界模型的综述，提出一种关于世界模型的系统性分类：理解世界、预测未来。本文首先强调世界模型在1）构建内部表征以理解世界的机制2）预测未来状态以模拟和指导决策两种分类的现态，然后探索世界模型在关键领域的应用，包括自动驾驶、机器人技术、社会模拟等，最后指出关键挑战并提供未来可能的研究方向的分析。 1.1...

World Models

发表于2025-05-11|更新于2025-05-11|TAI|周记•World Models

1.《World Models》传统强化学习中，智能体通常通过试错与环境交互来学习策略。然而，这种方法面临高维输入处理和信用分配(Credit Assignment)两大难题。本文提出构建世界模型，通过无监督学习压缩环境的时空特征，使智能体能在“梦境”（dream，我的理解是模型生成的虚拟场景）中训练，从而降低对真实环境的依赖。通过将世界模型中提取的特征作为Agent的输入，训练出一个策略来解决所需的任务。甚至可以完全在由其世界模型生成的虚拟场景中训练Agent，并将该策略迁移回实际环境。 1.1 模型框架本文提出一个智能体框架，该智能体包括视觉感知组件（Vison Model），记忆组件（Memory Model）和决策组件（Controller Model） VAE Model（V）视觉组件是由变分自动编码器(Variational Autoencoder)构成，可以将输入的图像压缩成潜在向量$z_t$ MDN-RNN Model （M）记忆组件是由具有混合密度网络(Mixture Density...