콘텐츠 (99)
한빛미디어
토큰 임베딩을 넘어선 새로운 의미: 고정된 시각적 유니코드 표현을 가진 트랜스포머 언어 모델
16 0한빛미디어
기하학 강제: 비디오 확산과 3D 표현의 결합을 통한 일관된 세계 모델링
20 0한빛미디어
38 0한빛미디어
GPT-4o는 비전을 얼마나 잘 이해할까? 멀티모달 기초 모델의 표준 컴퓨터 비전 작업 평가
66 0한빛미디어
Bourbaki: 자가 생성 및 목표 조건화된 MDP를 통한 정리 증명
53 0한빛미디어
80 0한빛미디어
CultureMERT: 지속적 사전 학습을 통한 교차 문화 음악 표현 학습
91 0한빛미디어
73 0한빛미디어
비전을 방언으로: 텍스트 정렬 표현을 통한 시각적 이해와 생성의 통합
91 0한빛미디어
노멀의 빛: 범용 광측정 스테레오를 위한 통합 특징 표현
82 0한빛미디어
더 나은 언어 모델 반전을 위한 다음 토큰 분포의 압축 표현
102 0한빛미디어
언어 모델의 계층적 잠재 능력 발견을 위한 인과적 표현 학습
120 0한빛미디어
비디오 확산 모델 미세 조정을 위한 프레임 간 표현 정렬
100 0한빛미디어
숨겨진 명백함: VLM은 그들의 시각적 표현을 간과한다
148 0한빛미디어
카트리지: 자가 학습을 통한 경량의 범용 장문 컨텍스트 표현
85 0한빛미디어
BEVCALIB: LiDAR-카메라 보정 - 기하학 기반의 조감도 표현
151 0한빛미디어
92 0한빛미디어
MIKU-PAL: 음성 패럴링구스틱 및 감정 레이블링을 위한 자동화되고 표준화된 멀티모달 방법
129 0한빛미디어
DyePack: LLM의 테스트 세트 오염을 백도어를 사용하여 검증 가능하게 표시하기
104 0한빛미디어
101 0한빛미디어
MetaFaith: 신뢰성 있는 자연어 불확실성 표현을 위한 대형 언어 모델
143 0한빛미디어
EmergentTTS-Eval: 복잡한 운율, 표현력, 언어적 도전에 대한 TTS 모델 평가
185 0한빛미디어
ReflAct: 목표 상태 반영을 통한 LLM 에이전트의 세계 기반 의사 결정
238 0한빛미디어
ScanBot: 지능형 표면 스캐닝을 향한 구현된 로봇 시스템
100 0