Распространение генеративного искусственного интеллекта резко повысило производительность ученых в мире. В то же время редакторам и рецензентам становится все труднее отличить реальные научные прорывы от хорошо отредактированного, но малосодержательного текста, сообщает ScienceDaily.
После появления ChatGPT в конце 2022 года исследователи начали сообщать о росте собственной производительности. Параллельно редакторы научных журналов зафиксировали наплыв хорошо написанных статей с сомнительной научной ценностью.
Авторы исследования, опубликованного в журнале Science, пришли к выводу, что именно большие языковые модели, в частности ChatGPT, меняют подходы к подготовке рукописей. Они увеличивают количество публикаций, но в то же время затрудняют оценку их качества.
[see_also ids="658400"]
"Это очень распространенная закономерность в различных областях науки — от физических и компьютерных наук до биологических и социальных наук. В нашей современной экосистеме произошел большой сдвиг, который требует очень серьезного рассмотрения, особенно для тех, кто принимает решения о том, какую науку нам следует поддерживать и финансировать", — заявил доцент Корнелльского колледжа вычислительной техники Ян Инь.
Команда Иня проанализировала более 2 миллионов препринтов, опубликованных в 2018-2024 годах на платформах arXiv, bioRxiv и SSRN. Эти ресурсы охватывают физические, биологические и социальные науки и содержат работы без рецензирования.
Исследователи сравнили тексты, написанные до 2023 года, с предположительно сгенерированными ИИ, и создали модель для выявления использования больших языковых моделей (LLM). Они отследили динамику публикаций авторов и проверили, принимались ли эти работы журналами.
[see_also ids="658601"]
На arXiv ученые, которые, вероятно, использовали LLM, опубликовали примерно на треть больше статей. На bioRxiv и SSRN рост превысил 50%.
Наибольший эффект зафиксировали среди авторов, для которых английский не является родным языком. Исследователи из азиатских учреждений опубликовали на 43-89% больше работ после начала использования LLM.
Авторы также обнаружили влияние ИИ на поиск литературы. Инструменты вроде Bing Chat чаще предлагали более новые и тематически релевантные источники, чем традиционные поисковые системы.
[see_also ids="664681"]
"Люди, которые используют LLM, получают доступ к более разнообразным знаниям, что может побудить к появлению более креативных идей", — отметил ведущий автор исследования Кейго Кусумеги. Он планирует проверить, связано ли это с более инновационной и междисциплинарной наукой.
Хотя языковые модели позволяют писать больше, они разрушают привычные критерии оценки качества. Ранее сложный язык был признаком сильного исследования и повышал шансы на публикацию.
Теперь этот маркер не работает: рецензенты из-за сложных выражений замечают сгенерированные ИИ статьи и часто отклоняют их, даже если они написаны безупречно. Хорошо отшлифованный текст больше не является гарантией научной ценности.
[see_also ids="657748"]
Ян Инь предостерегает, что это может иметь серьезные последствия для науки. Количество публикаций все меньше будет отражать реальный вклад исследователей.
В дальнейшем команда планирует проверять причинно-следственные связи с помощью контролируемых экспериментов.
Также Инь организует симпозиум в марте 2026 года, посвященный влиянию генеративного ИИ на науку.
"Уже сейчас вопрос не в том, использовали ли вы ИИ. Вопрос в том, как именно вы использовали ИИ и был ли он полезным или нет", — подытожил исследователь.
По данным отчета компании Graphite, доля сгенерированных искусственным интеллектом текстов в сети уже превысила 52%. Аналитики отмечают, что в начале 2025 года ИИ впервые опередил людей по объемам создания контента.