НовиниСвіт

ArXiv почне банити авторів за неконтрольоване використання AI у наукових роботах

Науковий репозиторій arXiv запроваджує жорсткіші правила щодо використання генеративного штучного інтелекту у наукових публікаціях. Авторів, які публікуватимуть роботи з очевидними слідами неконтрольованої генерації тексту через LLM-моделі, можуть заблокувати на платформі на один рік.

Повідомляє видання GALERANEWS, посилаючись на TechCrunch.

ArXiv є одним із найважливіших відкритих репозиторіїв для наукових препринтів у сферах комп’ютерних наук, математики та інших технічних дисциплін. Останнім часом сервіс зіткнувся зі зростанням кількості низькоякісних AI-згенерованих матеріалів, через що адміністрація почала посилювати модерацію.

Голова секції комп’ютерних наук arXiv Томас Діттеріх заявив, що якщо у статті буде виявлено “беззаперечні докази” того, що автори не перевіряли результати генерації AI, платформі “неможливо буде довіряти змісту роботи”. До таких доказів належать вигадані посилання, “галюцинації” AI або навіть технічні коментарі, залишені моделлю у тексті.

За новими правилами, автори таких матеріалів отримуватимуть річний бан на публікації в arXiv. Після завершення блокування вони зможуть завантажувати нові роботи лише за умови попередньої публікації у рецензованих наукових виданнях.

Водночас arXiv не забороняє використання великих мовних моделей у науковій роботі. Платформа наголошує, що відповідальність за будь-який контент, створений AI, повністю лежить на авторах. Це стосується плагіату, помилок, упередженого контенту або неправдивих цитат, які могли бути автоматично згенеровані системою.

У TechCrunch зазначають, що проблема AI-фальсифікацій стає дедалі масштабнішою у науковому середовищі. Нещодавні дослідження вже зафіксували зростання кількості вигаданих цитат у біомедичних роботах, імовірно створених через LLM-моделі.

Модератори arXiv зможуть застосовувати нове правило лише після перевірки доказів керівниками секцій, а автори матимуть право подати апеляцію.

Back to top button