Anonymous Intelligence Signal

H컴퍼니, 화면 읽고 직접 클릭·입력하는 작업 수행형 AI '홀로3' 공개

human The Lab unverified 2026-04-09 02:59:16 Source: Digital Today

프랑스 AI 스타트업 H컴퍼니가 단순 인식이 아닌, 화면을 직접 조작하는 차원의 AI 에이전트를 공개했다. '홀로3'(Holo3)로 명명된 이 대규모 비전언어모델(VML)은 웹, 데스크톱, 모바일 화면의 정보를 읽고, 상황에 맞춰 버튼을 클릭하거나 폼을 입력하는 등 실제 작업을 수행하도록 설계됐다. 이는 기존의 대화형 AI를 넘어, 디지털 환경에서 사용자의 대리인 역할을 할 수 있는 '작업 수행형 에이전트'의 실질적인 등장을 알리는 신호다.

H컴퍼니는 오픈소스 버전인 '홀로3-35B-A3B'를 허깅페이스(Hugging Face)를 통해 무료로 공개하며 개발자 커뮤니티의 빠른 접근과 실험을 유도하고 있다. 이 모델의 공개는 AI가 사용자 인터페이스(UI)를 직접 인지하고 상호작용하는 '에이전트' 기술 경쟁이 본격화되고 있음을 보여준다. 단순히 텍스트를 생성하거나 분석하는 수준을 넘어, 실제 소프트웨어와 앱을 조작할 수 있는 능력은 업무 자동화와 디지턷 어시스턴트 분야에 새로운 가능성을 열었다.

이러한 작업 수행형 AI의 등장은 RPA(Robotic Process Automation)부터 개인용 생산성 도구에 이르기까지 다양한 소프트웨어 시장의 재편 압력을 높일 전망이다. 사용자가 복잡한 매크로 설정 없이 자연어 지시만으로 반복적인 컴퓨터 작업을 자동화할 수 있는 시대가 가까워지고 있다. H컴퍼니의 선제적 오픈소스 공개는 빠른 생태계 구축과 표준 선점을 위한 전략으로 읽힌다.