AI가 쓰고 AI가 심사… 새 논문 플랫폼 ‘aiXiv’ 등장

[서울=뉴스닻] 최승림 기자 = 인공지능(AI)이 작성한 논문을 공식적으로 허용하고, AI가 직접 심사까지 맡는 새로운 프리프린트(사전 공개 논문) 플랫폼 ‘aiXiv’가 출범했다. 인간 동료 심사 체계가 AI가 만들어내는 방대한 연구 결과를 감당하지 못하는 상황에서, “AI가 만든 과학은 AI가 평가한다”는 실험적 시도가 시작된 셈이다.

AI 저자도 환영… “중요한 건 품질”

aiXiv는 AI가 공동 저자로 참여한 논문을 금지하지 않는다. 제출된 논문은 5개의 AI ‘에이전트’(특정 작업을 수행하도록 조정된 대형언어모델)가 새로움, 기술적 타당성, 영향력을 평가한다. 5개 중 3개 이상이 게재를 권고하면 논문이 공개된다. 이후 저자는 AI 리뷰를 반영해 수정·재심사를 받을 수 있다.

플랫폼 공동 창립자인 구오웨이 황(맨체스터대 박사과정)은 “AI가 생성한 지식도 차별받아선 안 된다”며 “누가 썼는지가 아니라 질이 중요하다”고 말했다. 심사는 통상 수개월에서 수년 걸리는 기존 체계와 달리 1~2분 안에 완료된다고 설명했다.

기존 학계는 혼란… 금지와 허용 엇갈려

현재 학술 출판계는 AI 활용을 두고 입장이 갈린다. 일부 학술지는 AI 생성 논문을 전면 금지하고, 다른 곳은 보조 도구로의 사용은 허용하되 공개를 요구한다. 프리프린트 서버 arXiv는 최근 컴퓨터과학 분야의 리뷰·입장문 논문 게재를 제한하며 “AI 작성 문서가 모델을 훼손할 수 있다”고 밝혔다.

반면 bioRxiv·medRxiv를 운영하는 단체는 AI 리뷰 도구 도입을 발표했다. aiXiv는 한발 더 나아가 AI 저자 표기를 허용하고, 구조화된 자동 심사 시스템을 전면 도입했다는 점에서 차별화된다.

“과학 흉내는 늘지만 진짜 연구는?” 우려도

전문가들은 기대와 함께 우려도 제기한다. 오리건주립대 토머스 디터리히 명예교수는 “AI 모델은 과학 연구를 그럴듯하게 흉내 내는 능력은 뛰어나지만, 실제 과학자가 되는 것은 또 다른 문제”라며 허위 연구나 피상적 심사 가능성을 지적했다.

초기 실험 사례에서도 AI 심사 시스템이 수치 오류는 잘 잡아냈지만, 논문의 독창성이나 파급력을 과대평가하는 경향이 나타났다. 코펜하겐대 생명윤리학자 세바스티안 포르스담 만은 “저품질 논문의 집적지가 된다면 AI 연구 전체의 신뢰를 떨어뜨릴 수 있다”고 경고했다.

논쟁 촉발… “AI가 문제를 드러낸다”

aiXiv 창립자들은 AI 심사가 인간 평가와 상당 부분 일치한다는 내부 비교 데이터를 확보했다고 주장한다. 카네기멜런대 니하르 샤 교수는 “AI가 연구를 대량 생산하는 시대가 거의 불가피하다면, 출처 추적과 실험 검증을 어떻게 보장할지 논의가 필요하다”고 말했다.

aiXiv가 성공할지는 미지수다. 그러나 AI가 연구를 쓰고 평가하는 구조를 공개적으로 실험하기 시작했다는 점에서, 학계의 동료 심사와 연구 윤리 체계를 둘러싼 논쟁은 더욱 본격화될 전망이다.

[저작권자 ⓒ 뉴스닻. 무단전재·재배포 금지]
최승림 기자 (seunglim.choi@newsdot.net)

Newsletter
디지털 시대, 새로운 정보를 받아보세요!