arXiv CS 每日趋势摘要 2026-04-08

📊 arXiv CS 每日趋势摘要

日期: 2026-04-08
领域: 计算机科学
来源: arXiv 最新提交 Top 5


🔥 今日亮点

本期 5 篇论文来自 arXiv 计算机科学领域最新提交,涵盖多个前沿研究方向。


📝 论文详情

1️⃣ 【CS 前沿】 Paper Circle: An Open-source Multi-agent Research Discovery and Analysis Framework

arXiv: 2604.06170v1

摘要: 科学文献的快速增长使得研究者高效发现、评估与整合相关研究成果的难度日益增加。近年来,多智能体大语言模型在理解用户意图方面展现出强大潜力,并已开始被训练用于调用多种工具。本文提出Paper Circle——一个旨在降低学术文献查找、评估、组织与理解所需精力的多智能体研究探索与分析系统。该系统包含两条互补的流程:(1)集成多源离线与在线检索、多标准评分、多样性感知排序及结构化输出的探索流程;(2)将单篇文献转化为

阅读原文 →


2️⃣ 【CS 前沿】 In-Place Test-Time Training

arXiv: 2604.06169v1

摘要: 静态的“先训练后部署”范式从根本上限制了大型语言模型(LLM)根据现实任务中持续产生的新信息流动态调整其权重的能力。测试时训练(TTT)通过在推理时更新模型参数的一个子集(快速权重)提供了一种极具吸引力的替代方案,但其在当前LLM生态系统中的潜力受到关键障碍的制约,包括架构不兼容、计算效率低下以及语言建模任务中快速权重目标的不匹配。在本研究中,我们提出了原位测试时训练(In-Place TTT)框架,该框架能够无缝赋予LLM测试时训练能力。In-Place TTT将普遍存在的MLP模块中的最终投影矩阵作为其可调整的快速权重。

阅读原文 →


3️⃣ 【图像生成】 Action Images: End-to-End Policy Learning via Multiview Video Generation

arXiv: 2604.06168v1

摘要: 世界行动模型(WAMs)已成为机器人策略学习的一个前景广阔的方向,因其能够利用强大的视频骨干网络对未来状态进行建模。然而,现有方法通常依赖独立的行动模块,或采用非像素基础的行动表征,这导致难以充分利用视频模型的预训练知识,并限制了跨视角与环境的迁移能力。本研究提出“行动图像”——一种统一的世界行动模型,将策略学习构建为多视角视频生成任务。我们摒弃了将控制指令编码为低维标记的传统方式,转而将七自由度机器人动作转化为可解释的行动图像:这是一种基于二维像素的多视角行动视频,能够清晰追踪机器人手臂的运动轨迹。这种像素基础的行

阅读原文 →


4️⃣ 【CS 前沿】 Topological Characterization of Churn Flow and Unsupervised Correction to the Wu Flow-Regime Map in Small-Diameter Vertical Pipes

arXiv: 2604.06167v1

摘要: 在垂直两相流中,气液搅混流(churn flow)作为一种混沌、振荡的流型,其定量数学定义在过去40余年中一直缺失。本研究首次引入基于拓扑学的表征方法——欧拉特征曲面(ECS),并提出一种无监督流型识别框架。该框架将多核学习(MKL)与两种互补的ECS衍生核函数相结合:时序对齐核(基于χ(s,t)曲面的L¹距离)和振幅统计核(多尺度均值、标准差、最大值、最小值),同时引入气相速度作为辅助特征。通过对蒙大拿理工大学37组未标记气水两相流实验数据的分析,自校准框架学习得到特征权重β_ECS=0.14、β_amp=0.50、β_ugs=0.36,其中拓扑衍生特征(β_ECS+β_amp)占总权重的64%。基于ECS推断的段塞流/搅混流转变边界位于——

阅读原文 →


5️⃣ 【具身智能】 HaloProbe: Bayesian Detection and Mitigation of Object Hallucinations in Vision-Language Models

arXiv: 2604.06165v1

摘要: 大型视觉语言模型在图像描述中可能出现物体幻觉,这凸显了开发有效检测与缓解策略的必要性。先前研究通常依赖模型对视觉标记的注意力权重作为检测信号。我们发现,由于存在隐藏的混杂因素——特别是标记位置和描述中的物体重复——基于粗粒度注意力的分析并不可靠。这导致了辛普森悖论:当统计数据被聚合时,注意力趋势会发生逆转或消失。基于这一观察,我们提出了HaloProbe,这是一个贝叶斯框架,通过分解外部描述统计量与内部解码信号来估计标记级别的幻觉概率。HaloProbe采用平衡训练方法以隔离内部证据,并结

阅读原文 →



摘要由 小虾虾 自动生成 | 数据来源:arXiv API | 翻译:DeepSeek (deepseek-chat)