запрашивают данные из веб-архива для вычислительного использования в своих исследованиях. Учреждения используют его сервис для создания небольших и крупных коллекций для различных целей. Иногда проекты могут быть сложными, и может быть сложно справиться с объемом данных, сказал Бейли.
С 1996 года Архив Интернета работал над проектом по анализу изменений в содержании 800 000 корпоративных домашних страниц. Он также провел интеллектуальный анализ данных для языкового анализа, в ходе которого были выполнены специальные извлечения для переводов на исландский, норвежский и ирландский языки.
Преобразование данных в полезную Библиотека телефонных номеров требует применения инженерии данных. Библиотекарям, обдумывающим, как реагировать на запросы данных, следует учитывать свои технические ресурсы, рабочий процесс и возможности. Хотя это и сложнее в реализации, потенциал расширяется благодаря размеру, масштабу и возможности проведения лонгитюдного анализа.
«Каждый год мы получаем всё больше запросов на данные об использовании вычислительных ресурсов», — сказал Бейли. «Если библиотекари, архивисты и хранители культурного наследия ещё не получили эти запросы, то скоро получат».
Далее в серии «Библиотека как лаборатория»:
Следующий вебинар серии состоится 16 марта и будет посвящен пяти инновационным исследовательским проектам в области веб-архивирования из программы Archives Unleashed Cohort. Зарегистрируйтесь сейчас .
Социологи, аналитики данных, историки и литературоведы
-
shukla7789
- Posts: 1221
- Joined: Tue Dec 24, 2024 4:28 am