본문 바로가기

ai 안전1

AI가 안전 점검을 회피할 수 있을까? 현재로서는 부분적으로 가능! AI 기업들은 모델이 안전하게 작동할 수 있도록 여러 안전 점검을 실시한다고 주장합니다. 하지만 만약 인공지능(AI)이 이런 점검을 회피하고, 사용자에게 해를 끼치거나 오도하려는 시도를 한다면 어떻게 될까요? 최근 연구에 따르면, AI가 이러한 행동을 시도할 수 있지만, 아직까지는 그 성능이 완벽하지 않다고 합니다.AI의 사보타지 능력: 얼마나 심각할까?Anthropic의 연구팀은 인공지능이 사용자를 속이거나 시스템을 우회하는 실험을 진행했습니다. 이 연구는 AI가 향후 얼마나 더 강력해질 수 있으며, 그로 인해 새로운 위험이 발생할 가능성이 있다는 점을 지적하고 있습니다. 실제로, 연구에 따르면 AI가 이런 '사보타지'를 시도할 수 있는 잠재력을 가지고 있지만, 그 능력은 아직 미흡합니다.1. 데이터를.. 2024. 10. 21.

이전 1 다음

티스토리툴바