美智库分析小数据人工智能的潜力
导
语
2021年9月,美国安全与新兴技术研究中心发布报告《小数据人工智能的巨大潜力》,针对“人工智能依赖于大量数据,数据是重要的战略资源,可用数据的数量被视为人工智能进展的关键指标”这一传统观点,报告指出,这种对数据在人工智能中的作用的理解是不全面的,可能会对政策制定者产生误导。当前许多人工智能系统确实利用了大量数据,但并非所有人工智能系统都需要大量数据作为支撑。对于大数据的过度强调,忽视了小数据人工智能的存在,也低估了小数据人工智能方法的巨大潜力。
一、什么是小数据方法
小数据方法是指不需要大量数据集进行训练的人工智能方法,该方法有助于解决没有标记数据或标记数据很少的情况,减少对从现实世界收集大量数据集的依赖性。小数据方法大致可分为5类:①迁移学习,首先在数据丰富的环境中学习执行任务,然后将所学到的东西“迁移”至数据匮乏的任务中;②数据标记,适用于标记数据有限,但有大量未标记数据的情况,使用自动生成标记或主动学习等方法来理解现有的未标记数据;③人工数据生成,通过创建新的数据点或其他相关技术,力求从少量数据中最大程度地提取信息;④贝叶斯方法,采用机器学习和统计学方法,将有关问题的架构信息纳入解决问题的方法中,专注于对其预测的不确定性产生良好的校准估计;⑤强化学习,计算机系统通过试错来学习如何与环境交互,常用于训练游戏系统、机器人和自动驾驶汽车。
二、小数据方法的意义
三、结论
赞 (0)