国际最新研究构建超万张人类图像数据库评估人工智能视觉偏见
中新网北京11月6日电 (记者 孙自法)国际知名学术期刊《自然》最新发表一篇人工智能(AI)研究论文,提出并构建了一个超过1万张人类图像的数据库,旨在评估AI模型在以人为本的计算机视觉领域中的偏见。
这一“公平的以人类为中心的图像基准”(FHIBE)由索尼AI团队开发,其采用符合伦理手段获取、基于用户同意的数据集,可用于评估以人为中心的计算机视觉任务,从而识别、纠正偏见和刻板印象。
该论文介绍,计算机视觉广泛应用于自动驾驶车辆到面部识别技术等领域。许多计算机视觉使用的AI模型,其训练数据存在缺陷,可能未经同意收集,经常来自网络大规模图像抓取。人们也已发现,AI模型可能会反映出延续性别歧视、种族歧视或其他刻板印象的偏见。
在本项研究中,索尼AI团队构建了一个图像数据集,在同意机制、多样性和隐私等多方面努力采取最佳实践:FHIBE包含81个国家或地区中1981个个体的10318张图像,该数据库涵盖人口统计和生理特征的全面标注,包括年龄、代词类别、祖先血统、发色与肤色等;参与者获得关于项目和潜在风险的详细信息,帮助他们做出知情同意,过程符合全面数据保护法规。这些特征使该数据库成为评估AI偏见的可靠资源。
研究团队将FHIBE和27个现有以人类为中心的计算机视觉应用数据集进行比较,发现FHIBE数据集在多样性与AI评估的可靠同意方面标准更高,同时还有效减少了偏见,它包含的参与者自我申报标注信息超过其他数据集,还包括了相当比例通常代表性不足的人群。
论文作者总结表示,FHIBE数据集可用于评估现有的AI模型在计算机视觉任务中的表现,能揭示更多此前无法了解的偏见。他们也提醒指出,创建数据集的过程充满挑战且成本高昂,但FHIBE可能代表了迈向更可信AI的一步。(完)
本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。
[网上传播视听节目许可证(0106168)] [京ICP证040655号] [
京公网安备 201号] [京ICP备2021034286号-7] [互联网宗教信息服务许可证:京;京]
违法和不良信息举报电话: 举报邮箱:报受理和处置管理办法总机:86-10-87826688开云网站
同类文章排行
- kaiyun的自然语言处理技术有哪些核心功能?
- CV计算机视觉每日开源代码Paper with
- 自然语言处理领域的变革之路:从BERT到Qwen 25
- 人类秒懂AI却懵圈:VLM²-Bench揭示视觉语言模型「视
- AI小程序开发人工智能时代下的商业机遇
- kaiyun公司主要提供哪些计算机视觉和自然语言处理技术服务
- kaiyun的计算机视觉技术可应用于哪些行业场景?
- 如何联系kaiyun中国股份有限公司获取更多技术支持和服务咨
- kaiyun官方如何确保客户数据的安全性?
- 2025-2031年中国机器视觉市场全景调查与未来前景预测

