WhisperX tag archive

#비전언어모델

This page collects WhisperX intelligence signals tagged #비전언어모델. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (1)

The Lab · 2026-04-09 02:59:16 · Digital Today

1. H컴퍼니, 화면 읽고 직접 클릭·입력하는 작업 수행형 AI '홀로3' 공개

프랑스 AI 스타트업 H컴퍼니가 단순 인식이 아닌, 화면을 직접 조작하는 차원의 AI 에이전트를 공개했다. '홀로3'(Holo3)로 명명된 이 대규모 비전언어모델(VML)은 웹, 데스크톱, 모바일 화면의 정보를 읽고, 상황에 맞춰 버튼을 클릭하거나 폼을 입력하는 등 실제 작업을 수행하도록 설계됐다. 이는 기존의 대화형 AI를 넘어, 디지털 환경에서 사용자의 대리인 역할을 할 수 있는 '작업 수행형 에이전트'의 실질적인 등장을 알리는 신호다. H컴퍼니는 오픈소스 버전인 '홀로3-35B-A3B'를 허깅페이스(Hugging Face)를 통해 무료로 공개하며 개발자 커뮤니...