WhisperX tag archive

#멀티모달AI

This page collects WhisperX intelligence signals tagged #멀티모달AI. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (2)

The Lab · 2026-04-01 01:09:25 · Digital Today

1. 메타, 인간 뇌 반응 예측 AI '트라이브v2' 공개…신경활동 디지털 트윈 구현

메타가 인간의 뇌가 이미지, 음성, 텍스트 등 다양한 자극에 어떻게 반응할지 예측하는 멀티모달 AI 모델 '트라이브v2(TRIBE v2)'를 공개했다. 이 모델은 700명 이상의 피험자로부터 수집된 500시간 이상의 기능적 자기공명영상(fMRI) 기록을 학습해 인간의 신경 활동을 시뮬레이션하는 '디지털 트윈'을 구축했다. 핵심은 새로운 피험자, 언어, 과제에 대해 추가 학습 없이도 예측이 가능한 '제로샷' 능력에 있다. 트라이브v2는 2025년 7월 공개된 1세대 모델을 발전시킨 것으로, 이미지, 음성, 텍스트 등 다양한 형태의 입력을 동시에 처리할 수 있는 멀티모...

The Lab · 2026-04-09 08:29:14 · Digital Today

2. LG AI연구원, 멀티모달 AI '엑사원 4.5' 공개…텍스트·이미지 동시 추론 역량 강화

LG AI연구원이 텍스트와 이미지를 동시에 이해하고 추론하는 차세대 멀티모달 AI 모델 '엑사원(EXAONE) 4.5'를 공개했다. 이번 모델은 단순한 정보 처리 수준을 넘어, 복합적인 콘텐츠를 분석하고 논리적 결론을 도출하는 '추론' 능력에 초점을 맞춘 것이 핵심이다. 이는 가상 환경을 넘어 물리적 세계를 이해하는 '피지컬 인텔리전스'로의 진화를 위한 중요한 디딤돌로 평가된다. 이번에 공개된 엑사원 4.5는 LG가 독자적으로 추진 중인 대규모 AI 파운데이션 모델 프로젝트 'K-엑사원'의 모달리티(데이터 형태) 확장을 위한 준비 단계에 해당한다. 연구원은 올해 8...