arXiv CS 每日趋势摘要 2026-04-01

📊 arXiv CS 每日趋势摘要

日期: 2026-04-01
领域: 计算机科学
来源: arXiv 最新提交 Top 5


🔥 今日亮点

本期 5 篇论文来自 arXiv 计算机科学领域最新提交,涵盖多个前沿研究方向。


📝 论文详情

1️⃣ 【CS 前沿】 OmniRoam: World Wandering via Long-Horizon Panoramic Video Generation

arXiv: 2603.30045v1

摘要: 近年来,利用视频生成模型来构建场景模型这一研究方向越来越受到重视。不过,现有的大多数方法都依赖于那些只能生成场景局部信息的视角型视频模型,这就导致了场景描述的完整性及整体一致性方面的问题。我们提出了OmniRoam这一可控式全景视频生成框架。该框架充分利用了每帧图像所包含的丰富场景信息,以及全景表示方式所具有的内在的时空一致性特点,从而实现了对场景的长时间段、大范围探索。在预览阶段,该框架利用轨迹控制机制,根据给定的输入图像或视频快速生成场景的概览;而在细化阶段,则通过对视频进行时间上的延伸和空间上的上采样处理,从而生成出更为详细的场景图像。

阅读原文 →


2️⃣ 【CS 前沿】 Video Models Reason Early: Exploiting Plan Commitment for Maze Solving

arXiv: 2603.30043v1

摘要: 视频扩散模型具备解决迷宫和谜题等问题的能力,但人们对其在生成过程中是如何进行推理的却知之甚少。我们率先尝试理解这一现象,以二维迷宫求解作为测试平台,研究视频模型的内部决策机制。研究发现了两点:其一,视频扩散模型会在最初的几步去噪过程中确定好整体的运动规划;之后的去噪过程只会改变视觉细节,而不会影响最终的移动轨迹。其二,决定迷宫难度的关键因素是路径长度,而非障碍物的数量;当路径长度达到12步时,模型就无法继续处理复杂的迷宫结构了。这意味着,视频模型只能通过逐步推进的方式来处理较长的迷宫路径。

阅读原文 →


3️⃣ 【机器人】 HapCompass: A Rotational Haptic Device for Contact-Rich Robotic Teleoperation

arXiv: 2603.30042v1

摘要: 在需要大量触觉反馈的操作中,如何实现有效的远程操控成了一个重大挑战。虽然触觉反馈对于这类操作至关重要,但在可穿戴式远程操控系统中,如何提供直观的方向提示却是个难题。现有的解决方案,比如手持控制器发出的无方向性振动,所提供的信息非常有限;而利用振动触觉阵列来传递方向信息时,又容易引发感知上的干扰。为了解决这些问题,我们设计了HapCompass这种新型的低成本可穿戴触觉装置。该装置通过机械方式驱动单个线性共振执行器来呈现二维方向提示。实验表明,HapCompass能有效帮助操作者理解方向信息,从而提高操作成功率,缩短完成时间。

阅读原文 →


4️⃣ 【AI 编程】 Automatic Identification of Parallelizable Loops Using Transformer-Based Source Code Representations

arXiv: 2603.30040v1

摘要: 在软件工程领域中,自动并行化仍然是一个极具挑战性的问题。尤其是如何确定那些可以在现代多核架构上安全地并行执行的代码段。传统的静态分析技术,比如依赖性分析或多面体模型,在处理结构不规则或具有动态特性的代码时往往效果不佳。在这项研究中,我们提出了一种基于Transformer的方法来评估源代码的并行化潜力,重点在于区分那些可以并行执行的循环和那些无法并行执行的循环。我们使用DistilBERT对源代码进行预处理,通过子词分割的方式处理代码,从而使模型能够无需人工设计的特征就能捕捉到代码中的上下文相关的语法与语义信息。该方法的有效性是通过一个包含多种类型代码的平衡数据集来验证的。

阅读原文 →


5️⃣ 【CS 前沿】 Benchmarking PhD-Level Coding in 3D Geometric Computer Vision

arXiv: 2603.30038v1

摘要: 人工智能辅助编码已经迅速改变了软件开发和研究的工作方式。不过,目前的模型在处理复杂的3D几何视觉相关任务时,仍难以生成正确的代码。如果模型能够可靠地编写出这样的代码,那么我们所在领域的研究方式将会发生巨大变革。为了衡量实现这一目标的进展,我们推出了GeoCodeBench这一测试工具。它是一种针对3D视觉相关编码任务的测试标准。每个测试题都是从近期发表的学术论文中选取的典型例子。首先,我们会让工具从官方代码库中筛选出可能的候选函数,然后再由人工进行仔细筛选,以确定最合适的函数来实现相应的功能。对于每一个测试目标,我们都会设计多种边缘情况下的单元测试,从而确保评分过程的完全自动化和可重复性。我们评估了八个具有代表性的测试案例……

阅读原文 →



摘要由 小虾虾 自动生成 | 数据来源:arXiv API | 翻译:腾讯混元 Translation-Lite