机器学习和 GLAM(画廊、图书馆、档案馆、博物馆)收藏入门
Posted: Sat Jul 05, 2025 6:09 am
客座作者:Hugging Face 机器学习图书管理员Daniel Van Strien
机器学习在处理 GLAM(画廊、图书馆、档案馆、博物馆)馆藏方面拥有众多潜在应用,但入门指南并非总是清晰。本文概述了 Hugging Face 生态系统中的开源机器学习工具可用于探索通过互联网档案馆的ARCH(档案研究计算中心)提供的网络档案馆藏的一些可能方法。ARCH 旨在通过简化网络档案数据访问、可视化、分析和共享,使网络档案的计算工作更容易实现。Hugging Face 致力于使优秀的机器学习更加普及。其中的关键要素不仅在于提供模型,还在于围绕机器学习的道德使用开展大量工作。
下面,我将使用专注于艺术家网站的协作艺术档案 (CARTA)馆藏 海外数据 进行研究。本文附带一个ARCH 图像数据集浏览器演示。本文旨在展示如何使用一组特定的开源机器学习模型,通过图像搜索、图像分类和模型训练来帮助您探索大型数据集。
今年晚些时候,互联网档案馆 (Internet Archive) 和 Hugging Face 将组织一场实践黑客马拉松,重点关注如何将开源机器学习工具与网络档案结合使用。如果您有兴趣参加,请填写此表格告知我们。
选择机器学习模型
Hugging Face Hub 是一个中央存储库,提供对开源机器学习模型、数据集和演示的访问。目前,Hugging Face Hub 拥有超过 150,000 个公开可用的机器学习模型,涵盖了广泛的机器学习任务。
我们不会依赖可能不够全面的单一模型,而是会选择一系列适合我们特定需求的模型。
机器学习在处理 GLAM(画廊、图书馆、档案馆、博物馆)馆藏方面拥有众多潜在应用,但入门指南并非总是清晰。本文概述了 Hugging Face 生态系统中的开源机器学习工具可用于探索通过互联网档案馆的ARCH(档案研究计算中心)提供的网络档案馆藏的一些可能方法。ARCH 旨在通过简化网络档案数据访问、可视化、分析和共享,使网络档案的计算工作更容易实现。Hugging Face 致力于使优秀的机器学习更加普及。其中的关键要素不仅在于提供模型,还在于围绕机器学习的道德使用开展大量工作。
下面,我将使用专注于艺术家网站的协作艺术档案 (CARTA)馆藏 海外数据 进行研究。本文附带一个ARCH 图像数据集浏览器演示。本文旨在展示如何使用一组特定的开源机器学习模型,通过图像搜索、图像分类和模型训练来帮助您探索大型数据集。
今年晚些时候,互联网档案馆 (Internet Archive) 和 Hugging Face 将组织一场实践黑客马拉松,重点关注如何将开源机器学习工具与网络档案结合使用。如果您有兴趣参加,请填写此表格告知我们。
选择机器学习模型
Hugging Face Hub 是一个中央存储库,提供对开源机器学习模型、数据集和演示的访问。目前,Hugging Face Hub 拥有超过 150,000 个公开可用的机器学习模型,涵盖了广泛的机器学习任务。
我们不会依赖可能不够全面的单一模型,而是会选择一系列适合我们特定需求的模型。