冰柜里的冰芯,展出的恐龙,坛子里的鱼,盒子里的鸟,人类遗骸和很少有人见过的远古文明的古代文物——博物馆的藏品中充满了这一切,甚至更多。
这些藏品是讲述地球自然和人类历史的宝库,它们帮助了地质学、古生物学、人类学等不同领域的科学家。你在博物馆之旅中看到的只是他们收藏的奇迹中的一小部分。
博物馆通常希望将其藏品的内容以实物或数字形式提供给教师和研究人员。然而,每个集合的工作人员都有自己组织数据的方式,因此导航这些集合可能具有挑战性。
创建、组织和分发博物馆样本的数字副本或藏品中实物物品的信息需要大量的数据。这些数据可以输入机器学习模型或其他人工智能来回答重大问题。
目前,即使在一个研究领域内,找到正确的数据也需要浏览不同的存储库。人工智能可以帮助组织来自不同集合的大量数据,并提取信息来回答特定问题。
但使用人工智能并不是一个完美的解决方案。博物馆之间一套共享的数据管理实践和系统可以改善人工智能完成其工作所需的数据管理和共享。这些做法可以帮助人类和机器从这些有价值的收藏品中获得新的发现。
作为一名研究科学家对研究数据管理的方法和观点的信息科学家,我已经看到世界上的物理收集基础设施是如何由对象及其相关元数据拼凑而成的。
人工智能工具可以做一些惊人的事情,比如为博物馆藏品的数字化版本制作3D模型,但前提是有足够的关于该物品的组织良好的数据。为了了解人工智能如何帮助博物馆藏品,我的研究团队首先与管理博物馆藏品的人进行了焦点小组讨论。我们问他们正在做什么,让他们的藏品被人类和人工智能使用。

当一件物品进入博物馆收藏时,收藏经理是描述该物品特征并生成有关该物品数据的人。这些数据被称为元数据,允许其他人使用它,可能包括收集者的名字、地理位置、收集时间,在地质样本的情况下,还包括它来自的时代。对于来自动物或植物的样本,它可能包括其分类学,这是对其进行分类的一组拉丁名称。
所有这些信息加在一起构成了令人难以置信的数据量。
但是用不同的标准组合跨领域的数据确实很棘手。幸运的是,收集管理人员一直致力于跨学科和多种类型样本的标准化过程。拨款帮助科学界建立了标准化工具。
在生物收集中,指定工具允许管理人员通过下拉菜单快速分类标本,下拉菜单预先填充了分类标准和其他参数,以一致地描述传入的标本。
生物学中常见的元数据标准是达尔文核心。所有科学领域都存在类似的完善的元数据和工具,以使获取真实物品并将其放入机器的工作流程尽可能简单。
像这些工具和元数据这样的特殊工具可以帮助集合管理器使其对象中的数据可用于研究和教育目的。
我和我的团队进行了10个焦点小组,共有32名参与者来自几个实体样本社区。其中包括跨学科的收集管理人员,包括人类学、考古学、植物学、地质学、鱼类学、昆虫学、爬虫学和古生物学。
每个参与者都回答了关于他们如何访问、组织、存储和使用他们收集的数据的问题,以使他们的材料准备好供人工智能使用。虽然人类受试者需要提供同意才能进行研究,但大多数物种都不需要。因此,人工智能可以从非人类的物理集合中收集和分析数据,而无需隐私或同意问题。
我们发现,来自不同领域和机构的藏品管理人员在为人工智能做好物理藏品准备方面有很多不同的做法。我们的研究结果表明,标准化元数据管理器记录的类型以及他们跨集合存储元数据的方式可以使这些样本中的项目更易于访问和使用。
像我们的研究这样的其他研究项目可以帮助收集经理建立他们需要的基础设施,使他们的数据机器准备就绪。人类的专业知识可以帮助人工智能工具根据博物馆收藏的旧宝藏做出新的发现。




