Эксперты обнаружили серьезные недостатки в тестах, оценивающих безопасность искусственного интеллекта

04 ноября 2025, 09:25 | Технологии

фото с Зеркало недели

Размер текста:

Международная группа ученых обнаружила слабые места в сотнях тестов, которые применяют для проверки безопасности и эффективности новых моделей искусственного интеллекта, сообщает The Guardian. По заключению экспертов, большинство из более 440 проанализированных бенчмарков имеют существенные недостатки, которые могут "подорвать обоснованность полученных утверждений" относительно достижений в сфере ИИ.

Исследование провели компьютерные ученые из Института безопасности искусственного интеллекта правительства Великобритании совместно со специалистами университетов Стэнфорда, Беркли и Оксфорда. Они выяснили, что почти все тесты имеют слабые стороны хотя бы в одной области, а полученные результаты иногда являются "нерелевантными или даже обманчивыми".

Бенчмарки, которые используются для измерения производительности и безопасности ИИ, играют ключевую роль при отсутствии четких государственных регуляций в Великобритании и США. Они должны свидетельствовать, соответствуют ли системы искусственного интеллекта интересам человека, и проверять их способности к логическому рассуждению, математическим расчетам и кодированию.

[see_also ids="659623"]

Ведущий автор исследования, исследователь Оксфордского интернет-института Эндрю Бин, отметил, что именно бенчмарки лежат в основе большинства заявлений о прорывах в сфере искусственного интеллекта: "Почти все утверждения о достижениях в области искусственного интеллекта подкреплены контрольными показателями. Но без общих определений и обоснованных измерений трудно понять, действительно ли модели улучшаются, или это только кажется так".

Исследование обнародовали на фоне растущих опасений относительно безопасности новых ИИ-моделей, которые крупные технологические компании выпускают со все большими темпами. Недавно некоторые корпорации были вынуждены изъять или ограничить доступ к своим разработкам после ряда инцидентов, когда системы искусственного интеллекта наносили вред — от клеветы до случаев самоубийства.

На этой неделе Google отозвал одну из своих моделей — Gemma. Такое решение приняли после того, как она придумала ложные обвинения о якобы сексуальных отношениях без согласия между американским сенатором и полицейским, создав фальшивые ссылки на вымышленные публикации.

[see_also ids="658601"]

"Никогда не было такого обвинения, нет такого лица, и нет таких новостных историй", — заявила сенатор от штата Теннесси Марша Блэкберн в письме к генеральному директору Google Сундару Пичаи. Она назвала этот случай "катастрофическим провалом надзора и этической ответственности".

В ответ Google объяснила, что Gemma предназначалась для разработчиков и исследователей, а не для потребителей. Компания удалила модель с платформы AI Studio после сообщений о ее использовании сторонними пользователями.

"Галлюцинации — когда модели придумывают факты — и подхалимство являются проблемами всей индустрии искусственного интеллекта, особенно для меньших открытых моделей, таких как Gemma", — отметили в компании.

[see_also ids="657627"]

Хотя в исследовании рассматривали только открытые бенчмарки, авторы отметили, что крупные технологические компании имеют собственные закрытые тесты, которые остаются вне независимой проверки. Они сделали вывод о "насущной потребности в общих стандартах и передовом опыте" для оценки систем искусственного интеллекта.

По словам Эндрю Бина, особенно тревожным является факт, что только 16% проанализированных тестов применяли статистические проверки или оценку неопределенности, которые могли бы засвидетельствовать точность их результатов.

В других случаях, когда бенчмарки оценивали такие характеристики, как "безвредность" ИИ, само определение этих понятий было нечетким, что делает такие оценки бесполезными для реального анализа.

Во время тестов безопасности ChatGPT и Claude выдавали рецепты взрывчатки и советы для киберпреступников. Компании OpenAI и Anthropic провели эксперимент, заставляя модели конкурентов выполнять опасные задачи, в результате чего чат-боты предоставляли подробные инструкции по изготовлению взрывчатых веществ, использованию биологического оружия и осуществлению кибератак.

Источник: Зеркало недели

Добавить комментарий

Ваше имя:
!
Комментарий:

!
	Введите верный ответ	! !

Архив новостей "Технологии "

Октябрь

Ноябрь 2025 г.

Декабрь

Пн

Вт

Ср

Чт

Пт

Сб

Вс

TOP Автомобили | Здоровье

Kia отказалась от своего недорогого кроссовера по одной причине.
12 марта 2026, 23:34 (Обозреватель)

Сколько стоит самая дешевая Ferrari без крыши.
13 марта 2026, 16:03 (Обозреватель)

Из-за экономии бензина в Украине вырос спрос на конкретные автомобили
11 марта 2026, 18:06 (Обозреватель)

Самую дешевую модель Ferrari показали в новом виде.
12 марта 2026, 18:57 (Обозреватель)

Этот Opel удивит всех: недорогое авто сделали намного круче
13 марта 2026, 05:45 (Обозреватель)

Самый дешевый спорткар Porsche держат в секрете: что о нем известно
13 марта 2026, 21:13 (Обозреватель)

Hyundai создаст новый автомобиль, которого еще никогда не было
13 марта 2026, 07:39 (Обозреватель)

больше TOP

Тайна имени

Памела

Это имя можно перевести как «странница». Обладает аристократической внешностью и манерами. Навязывание кому-либо своей точки зрения считает предосудительны... Читать дальше