自然语言处理★ 6.6
Scaling Diverse Language Generation for 3D Visual Grounding
Austin T. Wang, Dongchen Yang, Angel X. Chang
提出 ViGiL3D++:通过“场景图抽取 + 约束采样 + LLM 重述”自动生成更高有效性、更多样的 3D 视觉 grounding 查询,并用于训练更强的 3DVG 模型。
3D视觉 grounding场景图约束采样语言多样性3D数据集生成
Curated Research Insights • AI & Machine Learning