У Journal of Information Science вийшла велика стаття польських дослідників, присвячена доступності документів у відкритих наукових репозитаріях. Автори проаналізували сто тисяч PDF-файлів із тисячі репозитаріїв по всьому світу (за даними OpenDOAR), щоб з’ясувати, наскільки ці документи справді доступні для людей і машин. Ключовий висновок – катастрофічно низький рівень реальної доступності: лише близько 0,3% документів проходять усі автоматичні тести. Але не менш важливим є другий рівень проблеми – ненадійність самої інфраструктури відкритих репозитаріїв.
Перш ніж аналізувати самі PDF, дослідники перевірили, чи можуть вони технічно отримати метадані з репозитаріїв через стандартний протокол OAI-PMH. Саме через нього Google Scholar, OpenAIRE та інші системи дізнаються, які документи зберігаються у репозитарії і як до них можна отримати доступ.
Під час первинної перевірки репозитаріїв з OpenDOAR з’ясувалося, що значна частина OAI-PMH адрес узагалі не відповідає. Частина повертала помилки авторизації – тобто репозитарій формально відкритий, але доступ до API закритий. Частина стабільно тайм-аутиться або веде на застарілі адреси. У підсумку стало зрозуміло, що приблизно половина глобальної інфраструктури open repositories не є технічно відкритою у сенсі машинної доступності.
У принципах FAIR літера A означає доступність через стандартні, стабільні протоколи. Якщо OAI-PMH не працює, а endpoint застарілий або неправильно задекларований, машинна доступність фактично відсутня. У такому разі репозитарій де-факто не є FAIR, навіть якщо всі PDF-файли ідеально оформлені.
Документ може лежати у репозитарії й відкриватися в браузері, але якщо endpoint не працює, його не знайде Google Scholar, він не потрапить до OpenAIRE і залишиться невидимим для наукової спільноти.
Дослідження також показало, що проблема часто полягає не у відсутності технологій, а у відсутності регулярного догляду. Частину OAI-PMH адрес авторам довелося вручну виправляти, змінювати URL або додавати відсутні сегменти, щоб вони взагалі почали працювати. Це свідчить про те, що багато репозитаріїв були одного разу налаштовані, внесені до реєстрів, а потім роками не перевірялися.
Для України це особливо актуально: чимало репозитаріїв створювалися “для звіту”, OAI-PMH у них часто існує номінально, а принципи FAIR використовуються радше як балаканина, ніж як операційний стандарт.
Автори статті фактично демонструють, що значна частина інфраструктури відкритої науки працює швидше формально, ніж реально. Половина репозитаріїв існує “на папері”, але не як повноцінні учасники глобального обміну науковими знаннями. І це підриває довіру до ідеї відкритої науки не менше, ніж платні статті чи закриті журнали.













Немає коментарів:
Дописати коментар