自然语言处理★ 评分 4.6

Leveraging LaBSE with Progressive Curriculum Learning for Multicultural Polarization

Sachin Sundar, Sandeep Kumar, Mothish M
2026年6月25日
关键词
多语言极化检测LaBSE混合池化课程学习Few-shot检索提示

核心发现

  1. LaBSE 经过最后四层加权融合后,再叠加 mean pooling 与注意力 pooling 的混合表示,在22种语言的极化检测中整体优于作者设定的 POLAR 基线,说明跨语言语义对齐比单纯换更大编码器更有效。
  2. 代理引导课程学习把样本按难度分阶段训练,作者报告其能缓解多语言数据不均衡,并在开发集上带来更稳的宏平均 F1,尤其对低资源语言更有帮助。
  3. Qwen-2.5-14B 的 few-shot 检索式提示和 IPA 音素提示没有稳定超过编码器方案,说明在该任务上,跨语言表征学习与任务特化微调仍优于纯提示式推理。

实验规模

使用 SemEval-2026 Task 9 的官方 POLAR 数据集,覆盖两个子任务、22种语言;主模型为 LaBSE 和 RemBERT,另比较 EuroBERT-210M 与 Qwen-2.5-14B。编码器模型在单张 NVIDIA L4 上训练4个 epoch,采用 AdamW、cosine decay、batch size 32,并在开发集与官方测试集上报告按语言的 Macro-F1;Qwen 采用0-shot/7-shot 检索式 prompting,并测试 text 与 text+ipa 两种输入方式,另做语言与类别阈值校准。

局限性

论文的主要增量是把 LaBSE、层加权、混合池化、课程学习和检索式提示进行组合,方法上更像工程拼装而非新范式,缺少足够强的排他性消融来证明每个模块的独立贡献。实验虽然覆盖22种语言,但核心比较集中在作者自选基线与部分模型上,且不少结论依赖开发集表现,外部可复现性和统计稳健性不足。 另外,文中存在若干表述与结构不一致之处,例如对“Subtask 3”的引用、结论段与结果段的重复,以及部分表格/公式排版混乱,这削弱了论证的可信度。对 Qwen 和 IPA 的分析也偏经验性,缺少误差分析来说明为何音素提示在某些语言上失效。

Paper ID: 2606.21718