Модели ИИ можно обучить обманывать, защита против этого пока «неэффективна», выяснили исследователи
Эта статья была первоначально опубликована на английском языке Модели искусственного интеллекта могут быть обучены обманывать, и защита против этого пока «неэффективна», говорится в новом исследовании. РЕКЛАМА Исследователи из американской компании Anthropic обнаружили, что модели искусственного интеллекта могут быть обучены обману, и что существующие методы обучения безопасности…