Закон Меткалфа та отруєні наукові бази

Закон Меткалфа походить із телекомунікацій і стверджує: цінність мережі зростає пропорційно до квадрата кількості її учасників. Якщо в мережі є 10 користувачів – можливих зв’язків між ними приблизно 100, а якщо 1000 – уже мільйон. Іншими словами, що більше учасників, то швидше зростає цінність мережі. У нещодавніх наукових публікаціях цей принцип цікаво застосували до бібліографічних баз даних, які можна уявити як мережі наукових статей і цитувань між ними. 

Сьогодні наука зіткнулася з новою загрозою – фейковими посиланнями, згенерованими штучним інтелектом та недобросовісними авторами. Вони виглядають переконливо (назви журналів, імена авторів, номери та сторінки), але насправді ведуть у нікуди, бо таких праць ніколи не існувало. Як тільки такі посилання потрапляють у статті, а згодом у пошуковики типу Google Scholar, вони починають множитися у науковій мережі та “заражати” її. 

Натан Т. Кемп із колегами першими запропонували застосувати закон Меткалфа для пояснення цінності наукових баз даних. Вони представили їх як мережі, де чим більше справжніх посилань, тим вищою є цінність. Щоб врахувати підробки, дослідники модифікували формулу й ввели показник ne – частку коректних цитат. Однак, у цій моделі навіть повністю “засмічена” база не падає нижче нуля, хоч шкода для великих баз виглядає особливо драматично. 

Лео Ван Гове з Вільного університету Брюсселя стверджує, що це серйозний недолік: по-перше, відсоток шкоди не повинен автоматично зростати лише тому, що база більша, а по-друге, повністю сфальсифікована база не може мати жодної позитивної вартості. Він запропонував альтернативну модель, де до користі від справжніх цитувань додається негатив від фейкових та їхніх зв’язків із реальними статтями. За цією логікою після певного порогу (приблизно 29% фейкових покликів) база стає шкідливою і втрачає сенс як науковий інструмент. 

І, звісно, мені важко втриматися від нагадування: саме кваліфіковані академічні бібліотекарі стоять на варті чистоти баз даних. Тому, навіть у добу генеративного штучного інтелекту, чутки про “смерть” бібліотечної професії щоразу виявляються значно перебільшеними. 

На жаль, нині українські бібліотекарі знову змушені нескінченно подавати й перевіряти списки публікацій співробітників для чергових міністерських звітів. І все це при тому, що ті самі дані вже давно доступні у Web of Science чи Scopus. У згаданих дослідженнях прямо сказано: якщо база заражена хоча б на третину, вона втрачає будь-який науковий сенс. Тож уявіть, які перли може містити база, складена з цих поспіхом зібраних і “на вчора” списків. Чи хтось колись серйозно перевіряв правдивість міністерських реєстрів за логікою закону Меткалфа? Дуже сумніваюся.

Немає коментарів:

Дописати коментар