Науковці з Нанкінського сільськогосподарського університету вирішили з’ясувати, чи впливає повторне використання наукових даних (dataset reuse) на цитованість публікацій. Хоча різні агітатори люблять запевняти, що відкритість даних є однією з ключових цінностей сучасної науки, у скептиків досі залишаються сумніви: чи не зменшує повторне використання даних новизну дослідження і, відповідно, його науковий вплив? Дослідники проаналізували публікації з PubMed Central Open Access Subset у галузі біомедичних та наук про життя й ідентифікували три типи поведінки: self-reuse – автори повторно використовують власні дані; reuse-of-others – використання чужих відкритих даних; non-reused – дані, які згадуються лише один раз.
Виявилося, що з 1998 по 2019 рік кількість відкритих датасетів стрімко зросла, але лише 0,14% з них коли-небудь було використано і лише 0,03% – повторно! Тобто обсяг відкритих даних збільшується, але реальне їх використання майже не зростає.
Self-reuse отримує найвищу середню кількість цитувань (≈66 на статтю), що суттєво більше, ніж reuse-of-others (≈38) чи non-reused (≈38). Тут автори вводять поняття “ефекту овечого стада” (sheep flock effect) – коли публікації, що повторно використовують дані, підвищують видимість інших робіт тих самих авторів через самоцитування. Ось таким нехитрим чином повторне використання даних опосередковано збільшує загальну цитованість науковця.
Водночас reuse-of-others не показує статистично значущої різниці порівняно з non-reused, тобто використання чужих даних не знижує впливу статті. Однак варто пам’ятати, що йдеться про соті відсотка від загальної кількості датасетів у біомедицині.
Словом, ця стаття надає емпіричні докази, що повторне використання відкритих наукових даних не шкодить, а може навіть покращувати цитованість і видимість дослідників. Водночас рівень повторного використання дослідницьких даних поки залишається мізерним.
В Україні чиновники з падаванами створюють багато порожнього галасу навколо даних та відтворюваності – і національні репозитарії даних нібито треба для когось запускати, і змушують звітувати непотрібними циферками, і навіть в історичних журналах кількість датасетів рекомендовано вказувати... А варто було б хоча б спробувати зібрати або поглянути на доказову базу, перш ніж ухвалювати якісь рішення щодо національної наукової політики.
Як слушно сказано у звіті Science Europe – ставтеся до відкритої науки не як до самоочевидного блага, а як до наукової гіпотези, яку потрібно критично та ретельно перевіряти.
Немає коментарів:
Дописати коментар