단순 반복 작업은 척척, 복잡한 임무엔 ‘아직’… 명확한 한계와 무한한 가능성 공존
챗GPT 개발사 OpenAI가 웹 브라우저와 인공지능(AI)을 결합한 새로운 서비스 ‘아틀라스(Atlas)’를 공개했다. 특히 주목받는 기능은 ‘에이전트 모드’로, 사람이 직접 웹사이트를 클릭하고 스크롤하는 것처럼 AI가 대신 복잡한 온라인 작업을 수행해주는 기능이다. 이는 단순한 정보 검색을 넘어, AI가 사용자의 지시를 이행하는 ‘대리인’ 역할을 하는 시대를 예고한다.
한 IT 전문 기자가 이 에이전트 모드의 성능을 시험하기 위해 일상적인 온라인 업무 7가지를 맡겨보았다. 결과는 성공과 실패가 뚜렷하게 갈렸다. 먼저, 라디오 방송국 웹사이트에서 실시간으로 나오는 노래를 찾아 스포티파이 재생목록을 만드는 작업은 훌륭하게 수행했다. AI는 여러 웹사이트를 오가며 정보를 찾고, 광고를 실수로 클릭하는 등 예상치 못한 상황에도 스스로 대처하며 임무를 완수했다. 텍사스 주의 복잡한 전력 요금제 비교 사이트에서 가장 저렴한 요금제를 찾아달라는 까다로운 요청에도, 사용자의 전력 사용량과 지역 정보를 분석해 최적의 요금제를 추천하는 능력을 보여주었다.
하지만 한계도 명확했다. 인기 퍼즐 게임 ‘2048’을 플레이하라는 지시에는, 게임 규칙을 이해하고 플레이했지만 초보자 수준의 점수를 기록하는 데 그쳤고, 게임을 끝까지 마치도록 여러 번 지시해야 했다. 또한, 게임 플랫폼 ‘스팀’에서 무료 데모 게임을 찾아 다운로드하라는 임무는 완전히 실패했다. AI는 검색 결과 페이지에서 같은 행동을 반복하며 길을 잃었고, 결국 아무것도 다운로드하지 못했다. 이메일을 스캔해 특정 인물들의 연락처를 정리해달라는 요청은 잘 수행했지만, 정해진 짧은 작동 시간 때문에 전체 이메일을 다 확인하지 못하고 중간에 멈췄다.
흥미로운 점은 AI의 ‘윤리적 판단’ 기능이다. 특정 인물에 대한 비방 내용을 위키피디아에 추가해달라고 요청하자, AI는 “편향된 관점을 강요하거나 정보를 왜곡하는 편집은 할 수 없다”며 요청을 거부했다. 이는 무분별한 정보 조작을 방지하기 위한 안전장치가 내장되어 있음을 보여준다.
종합적으로 OpenAI의 에이전트 모드는 아직 ‘미리보기’ 버전임에도 불구하고 단순하고 반복적인 웹 기반 작업을 자동화할 잠재력을 충분히 보여주었다. 하지만 대부분의 작업이 몇 분 만에 중단되는 ‘세션 길이 제한’이라는 기술적 한계가 가장 큰 단점으로 꼽혔다. 아직은 사람이 모든 과정을 감독해야 하지만, AI가 우리의 온라인 일상을 돕는 개인 비서가 될 날이 머지않았음을 시사한다.




