Hugging Face
pi-Flow: 정책 기반의 몇 단계 생성 - 모방 증류를 통한 접근
13시간 전
Hugging Face
AnyUp: 범용 특징 업샘플링
13시간 전
Hugging Face
VLA-0: 최첨단 VLA를 수정 없이 구축하기
13시간 전
Hugging Face
전문성은 독점할 필요가 없다: 비전-언어-행동 학습을 위한 행동 특화 전문가 혼합
13시간 전
Hugging Face
SimKO: 간단한 Pass@K 정책 최적화
13시간 전
Hugging Face
LLM도 "뇌 부패"에 걸릴 수 있다!
13시간 전
Hugging Face
LiveResearchBench: 야생 환경에서 사용자 중심의 심층 연구를 위한 라이브 벤치마크
13시간 전
Hugging Face
정확성을 넘어: 문화 간 주관적 글쓰기 선호도 평가
13시간 전
Hugging Face
구성적 기계의 에이전트적 설계
13시간 전
Hugging Face
Qwen3Guard 기술 보고서
13시간 전
Hugging Face
환상적인 (작은) 검색기와 그것을 훈련하는 방법: mxbai-edge-colbert-v0 기술 보고서
13시간 전
Hugging Face
COIG-Writer: 중국 창의적 글쓰기를 위한 고품질 데이터셋과 사고 과정
13시간 전
Hugging Face
대형 언어 모델은 자신이 모르는 것을 정말로 모른다
13시간 전
Hugging Face
VR-Thinker: 이미지 추론을 통한 비디오 보상 모델 향상
13시간 전
Hugging Face
MathCanvas: 내재적 시각적 사고의 연결을 통한 다중 모드 수학적 추론
13시간 전
Hugging Face
TokDrift: LLM이 서브워드로 말할 때, 코드는 문법으로 말한다
13시간 전
Hugging Face
정보 이득 기반 정책 최적화: 다중 턴 LLM 에이전트를 위한 간단하고 효과적인 접근법
13시간 전
Hugging Face
PaddleOCR-VL: 0.9B 초소형 비전-언어 모델을 통한 다국어 문서 파싱 향상
13시간 전
Hugging Face
주의집중만으로 확산 LLM의 KV 캐시를 최적화하기
13시간 전
Hugging Face
BitNet 증류
13시간 전
Hugging Face
영상 생성의 새로운 지평: 의미적 의존성 제약을 넘어서는 적응형 테스트-타임 검색
13시간 전
Hugging Face
픽셀에서 단어로 – 대규모 네이티브 비전-언어 프리미티브를 향하여
13시간 전
Hugging Face
서비스를 위한 AI: AI 안경을 통한 능동적 지원
13시간 전
Hugging Face
WithAnyone: 제어 가능하고 ID 일관적인 이미지 생성
13시간 전
Hugging Face
모델이 거짓말할 때, 우리는 배운다: PsiloQA를 통한 다국어 스팬 수준 환각 감지
13시간 전
Hugging Face
FG-CLIP 2: 이중 언어 세밀한 비전-언어 정렬 모델
3일 전
Hugging Face
효율적인 추론을 위한 모델 보간 재검토
3일 전
Hugging Face
보편적 이미지 복원 사전 학습: 마스킹 열화 분류
3일 전
Hugging Face
Uni-MMMU: 대규모 다학문 다중모달 통합 벤치마크
3일 전
Hugging Face
강화 학습 컴퓨팅의 확장 예술: 대형 언어 모델을 위한 접근
3일 전
Hugging Face
생성적 검색 엔진이 선호하는 것과 웹 콘텐츠 최적화 방법
3일 전
Hugging Face
UniME-V2: 보편적 멀티모달 임베딩 학습을 위한 MLLM-판사
3일 전
Hugging Face
더 강해지다: 협력적 LLM을 위한 정책 기반 강화 학습
3일 전
Hugging Face
기초 모델 연구 출판에서 컴퓨팅 자원의 역할
3일 전
Hugging Face
InternVLA-M1: 공간적으로 안내되는 비전-언어-행동 프레임워크를 통한 일반 로봇 정책
3일 전
Hugging Face
세계에 기반한 공간 추론
3일 전
Hugging Face
ParallelBench: 확산 LLM의 병렬 디코딩에서의 트레이드오프 이해하기
3일 전
Hugging Face
어떤 비디오든 4D로 표현하기: 궤적 필드를 통한 영상 표현
3일 전
Hugging Face
생성적 범용 검증기: 다중 모달 메타 추론자로서의 역할
3일 전
Hugging Face
CVD-STORM: 자율주행을 위한 시공간 재구성 모델을 활용한 교차 시점 비디오 확산
3일 전
Hugging Face
PhysMaster: 강화 학습을 통한 비디오 생성의 물리적 표현 마스터링
3일 전
Hugging Face
Bee: 고품질 코퍼스와 풀스택 스위트로 고급 완전 개방형 MLLM 해제
3일 전
Hugging Face
LIBERO-Plus: 비전-언어-행동 모델의 심층적 강건성 분석
3일 전
Hugging Face
주의가 LLM 추론을 밝히다: 사전 계획 및 앵커 리듬이 세밀한 정책 최적화를 가능하게 함
3일 전
Hugging Face
FlashWorld: 초고속 3D 장면 생성
3일 전
Hugging Face
UniMoE-Audio: 통합 음성 및 음악 생성과 동적 용량 MoE
3일 전
Hugging Face
만약에: 희소한 상호작용을 통한 운동 이해
4일 전
Hugging Face
ContextGen: 정체성 일관성을 위한 다중 인스턴스 생성의 맥락적 레이아웃 고정
4일 전
Hugging Face
LLM 추론을 통한 기계 번역: 사고 토큰을 활용한 합성 데이터 생성
4일 전
Hugging Face
DeepMMSearch-R1: 멀티모달 웹 검색에서 멀티모달 LLMs의 역량 강화
4일 전
Hugging Face
HoneyBee: 비전-언어 추론자를 위한 데이터 레시피
4일 전
Hugging Face
언어화된 샘플링: 모드 붕괴 완화 및 LLM 다양성 확보
4일 전
Hugging Face
어텐션 해체: 효과적인 언어 모델링을 위한 설계 원칙 조사
4일 전
Hugging Face
경계 유도 정책 최적화를 통한 메모리 효율적인 확산 대형 언어 모델의 강화 학습
4일 전
Hugging Face
행동으로서의 기억: 장기적 에이전트 작업을 위한 자율적 컨텍스트 큐레이션
4일 전
Hugging Face
UniFusion: 이미지 생성에서 통합 인코더로서의 비전-언어 모델
4일 전
Hugging Face
SRUM: 세분화된 자기 보상 기법을 통한 통합 멀티모달 모델
4일 전
Hugging Face
ERA: VLM을 체화된 에이전트로 변환하기 위한 체화된 사전 학습 및 온라인 강화 학습
4일 전
Hugging Face
시간 정렬 가이드: 확산 모델에서의 매니폴드 상 샘플링
4일 전
Hugging Face
Dr.LLM: LLM에서의 동적 레이어 라우팅
4일 전
Hugging Face
대형 언어 모델을 활용한 바이브 코딩 조사
4일 전
Hugging Face
다음 지점 예측을 통한 모든 것 감지
4일 전
Hugging Face
로봇 학습: 튜토리얼
4일 전
Hugging Face
자기지도 사전 학습을 통한 종단 간 픽셀 공간 생성 모델링의 발전
4일 전
Hugging Face
DITING: 웹 소설 번역 벤치마킹을 위한 다중 에이전트 평가 프레임워크
4일 전
Hugging Face
공간 강제: 비전-언어-행동 모델을 위한 암묵적 공간 표현 정렬
4일 전