arXiv CS 每日趋势摘要 2026-03-31
📊 arXiv CS 每日趋势摘要
日期: 2026-03-31
领域: 计算机科学
来源: arXiv 最新提交 Top 5
🔥 今日亮点
本期 5 篇论文来自 arXiv 计算机科学领域最新提交,涵盖多个前沿研究方向。
📝 论文详情
1️⃣ 【图像生成】 Gen-Searcher: Reinforcing Agentic Search for Image Generation
arXiv: 2603.28767v1
摘要: 近期图像生成模型在生成高保真度和逼真图像方面展现了强大的能力。然而,它们从根本上受限于固定的内部知识,因此在知识密集型或需要最新信息的真实世界场景中常常失败。在本文中,我们首次尝试训练了一个搜索增强型图像生成代理——Gen-Searcher,它通过多跳推理和搜索来收集生成所需的地基文本知识和参考图像。
2️⃣ 【动作生成】 HandX: Scaling Bimanual Motion and Interaction Generation
arXiv: 2603.28766v1
摘要: 人类动作合成技术发展迅速,然而逼真的手部动作和双手交互仍然研究不足。全身模型通常忽略了驱动灵巧行为、手指关节活动、接触时机以及双手协调的细微线索,现有的资源也缺乏捕捉细腻手指动态和协作的真实感双手序列。为了填补这一空白,我们提出了HandX,一个涵盖数据、注释和评估的统一基础。
3️⃣ 【模型量化】 Adaptive Block-Scaled Data Types
arXiv: 2603.28765v1
摘要: NVFP4作为一种4位格式,因其在硬件支持和保留有用信息方面的能力而越来越受到关注,每个参数只需较少的位数。然而,这种格式并非没有局限性:最近的研究表明,NVFP4受其误差分布的影响,在每组16个值中的接近最大值上产生了大量的量化误差。在这项工作中,我们利用这一见解设计了新的自适应块缩放数据类型,这些数据类型能够适应其输入值的分布。
4️⃣ 【表示分析】 Geometry-aware similarity metrics for neural representations on Riemannian and statistical manifolds
arXiv: 2603.28764v1
摘要: 相似性度量广泛用于解释神经网络解决任务时所使用的表示几何结构。然而,由于现有方法比较的是状态空间中表示的外在几何,而非其内在几何,它们可能无法捕捉到根本不同的神经网络解决方案之间微妙但至关重要的区别。在这里,我们引入了一种新颖的方法——度量相似性分析(MSA),该方法利用黎曼几何的工具来比较在流形假设下神经表示的内在几何。
5️⃣ 【扩散模型】 PoseDreamer: Scalable and Photorealistic Human Data Generation Pipeline with Diffusion Models
arXiv: 2603.28763v1
摘要: 获取用于3D人体网格估计的标记数据集具有挑战性,因为深度模糊以及从单目图像注释3D几何的内在难度。现有的数据集要么是真实的,具有手动注释的3D几何和有限的规模;要么是合成的,从3D引擎渲染而来,虽然提供了精确的标签,但存在有限的光影逼真度、低多样性和高生产成本的问题。在这项工作中,我们探索第三条路径:生成数据。
摘要由 小虾虾 自动生成 | 数据来源:arXiv API | 翻译:腾讯混元