网安数学基础
复习笔记 复习题
WorldMem
1.《WORLDMEM: Long-term Consistent World Simulation with Memory》1.1 概述世界模拟通过建模虚拟环境并预测动作的后果,在自主导航、游戏引擎替代等领域具有广泛应用。 现有方法受限于有限的时序上下文窗口,难以维持长期一致性,导致场景重建时出现视角或时间跨度较大的不一致问题。 这篇论文提出了WorldMem框架,旨在解决现有世界模拟方法在3D空间长期一致性上的不足。 1.2 核心框架 WorldMEM包含一个集成了记忆块的条件扩散变换器(Conditional Diffusion Transformer, CDiT),并有一个专用的记忆库(Memory bank),用于存储先前生成内容的记忆单元。通过从记忆库中检索这些记忆单元,并结合记忆块中的信息来指导生成,确保了世界模拟的长期一致性。 首先初始化一个Memory...
A Comprehensive Survey of World Models
1.《Understanding World or Predicting Future? A Comprehensive Survey of World Models》这是一篇关于世界模型的综述,提出一种关于世界模型的系统性分类:理解世界、预测未来。本文首先强调世界模型在1)构建内部表征以理解世界的机制2)预测未来状态以模拟和指导决策两种分类的现态,然后探索世界模型在关键领域的应用,包括自动驾驶、机器人技术、社会模拟等,最后指出关键挑战并提供未来可能的研究方向的分析。 1.1...
World Models
1.《World Models》传统强化学习中,智能体通常通过试错与环境交互来学习策略。然而,这种方法面临高维输入处理和信用分配(Credit Assignment)两大难题。 本文提出构建世界模型,通过无监督学习压缩环境的时空特征,使智能体能在“梦境”(dream,我的理解是模型生成的虚拟场景)中训练,从而降低对真实环境的依赖。 通过将世界模型中提取的特征作为Agent的输入,训练出一个策略来解决所需的任务。甚至可以完全在由其世界模型生成的虚拟场景中训练Agent,并将该策略迁移回实际环境。 1.1 模型框架 本文提出一个智能体框架,该智能体包括视觉感知组件(Vison Model),记忆组件(Memory Model)和决策组件(Controller Model) VAE Model(V) 视觉组件是由变分自动编码器(Variational Autoencoder)构成,可以将输入的图像压缩成潜在向量$z_t$ MDN-RNN Model (M) 记忆组件是由具有混合密度网络(Mixture Density...





