OpenLVLM-MIA: A Controlled Benchmark Revealing the Limits of Membership Inference Attacks on Larg...

一、文章主要内容总结

该研究聚焦大型视觉语言模型(LVLMs)的成员推理攻击(MIA)评估问题,核心发现现有MIA研究的高攻击成功率多源于数据集构建中的分布偏差,而非真实成员身份检测。为此,研究者提出了OpenLVLM-MIA基准,包含6000张图像,通过严格平衡成员/非成员样本分布、提供明确的真实成员标签、支持多训练阶段独立评估,解决了现有基准的分布偏差和真实标签不确定问题。

实验表明,在该无偏基准下,当前最先进的MIA方法性能接近随机水平(AUROC≈0.5),实际应用中几乎无效(TPR@0.05FPR最高仅7.8%)。研究还揭示了LVLMs不同训练阶段(视觉编码器预训练、投影器训练、指令微调)对MIA性能的影响,并提出了MIA评估的标准化协议,为后续隐私保护技术研发提供了基础。

二、文章创新点

  1. 提出无偏可控基准OpenLVLM-MIA:首次实现成员/非成员样本分布对齐,提供明确的真实成员标签,支持三个训练阶段的独立评估,解决了现有基准的核心缺陷。
  2. 揭示现有MIA方法的局限性:通过实验证明,现有MIA的高成功率源于数据集分布偏差而非真实成员检测,在无偏设置下性能接近随机水平。
  3. 提供完整的可复现资源:公开数据集、评估工具、训练模型和实验代码,保障研究可复现性,为社区提供统一的评估基础。
  4. 建立MIA评估的标准化协议:提出“同源同期数据收集+视觉特征C2ST预测试+高偏差数据集重设计”的三步协议,规范
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值