Hugging Face
CodePlot-CoT: 코드 기반 이미지로 수학적 시각 추론하기
5일 전
Hugging Face
SPG: 마스크 확산 언어 모델을 위한 샌드위치 정책 경사
5일 전
Hugging Face
Vlaser: 비전-언어-행동 모델과 시너지적 구현 추론
5일 전
Hugging Face
AdaViewPlanner: 4D 장면에서의 관점 계획을 위한 비디오 확산 모델 적응
5일 전
Hugging Face
GIR-Bench: 추론을 통한 이미지 생성의 다목적 벤치마크
5일 전
Hugging Face
에이전트만 미세 조정하지 말고, 환경도 조정하라
5일 전
Hugging Face
DocReward: 문서 구조화 및 스타일링을 위한 보상 모델
5일 전
Hugging Face
ACADREASON: 학술 연구 문제를 통한 추론 모델의 한계 탐구
5일 전
Hugging Face
브라우저 에이전트: 인간 영감을 받은 웹 브라우징 행동을 통한 웹 에이전트 구축
5일 전
Hugging Face
InternSVG: 멀티모달 대형 언어 모델을 활용한 통합 SVG 작업
5일 전
Hugging Face
일반 에이전트 시스템을 위한 기초 가드레일 구축: 합성 데이터를 통한 접근
5일 전
Hugging Face
수학적 추론을 적응적으로 만들기
5일 전
Hugging Face
에이전트 추론에서 강화 학습의 신비를 풀다
5일 전
Hugging Face
DiT360: 하이브리드 훈련을 통한 고품질 파노라마 이미지 생성
5일 전
Hugging Face
AVoCaDO: 시간적 조율에 의해 구동되는 오디오비주얼 비디오 캡셔너
5일 전
Hugging Face
멀티모달 강화 학습을 위한 토큰 인식에 대한 조명
5일 전
Hugging Face
RLFR: 대형 언어 모델을 위한 강화 학습 확장 - 플로우 환경과 함께
5일 전
Hugging Face
잠재 정교화 디코딩: 신념 상태 정교화를 통한 확산 기반 언어 모델 향상
5일 전
Hugging Face
OmniVideoBench: 옴니 MLLMs를 위한 오디오-비주얼 이해 평가
5일 전
Hugging Face
확산 변환기와 표현 오토인코더
5일 전
Hugging Face
Dyna-Mind: 경험을 통한 시뮬레이션 학습으로 더 나은 AI 에이전트 만들기
6일 전
Hugging Face
MRMR: 현실적이고 전문가 수준의 다학제적 벤치마크 - 추론 집중형 다중 모달 검색을 위한
6일 전
Hugging Face
StatEval: 통계 분야 대형 언어 모델을 위한 종합 벤치마크
6일 전
Hugging Face
점진적 가우시안 변환기와 비등방성 인식 샘플링을 통한 개방형 어휘 점유 예측
6일 전
Hugging Face
어떤 헤드가 추론에 중요한가? RL-기반 KV 캐시 압축
6일 전
Hugging Face
추론에서 학습으로의 다리: 복잡성 외 분포 일반화를 사용한 환상의 해체
6일 전
Hugging Face
샘플 응축 다양화를 통한 효율적인 모델 평가: DISCO
6일 전
Hugging Face
ARES: 멀티모달 적응형 추론을 위한 난이도 인식 토큰 수준 엔트로피 조정
6일 전
Hugging Face
실수를 낭비하지 마세요: 신뢰도 재가중치를 통한 부정적 RL 그룹 활용
6일 전
Hugging Face
KORMo: 모든 이를 위한 한국어 개방형 추론 모델
6일 전
Hugging Face
BEAR: 원자적 구현 능력을 위한 멀티모달 언어 모델의 벤치마킹 및 향상
6일 전
Hugging Face
StreamingVLM: 무한 비디오 스트림의 실시간 이해
6일 전
Hugging Face
BigCodeArena: 코드 생성에서 더 신뢰할 수 있는 인간 선호도 발굴
6일 전
Hugging Face
웹스케일-RL: 사전 학습 수준으로 강화 학습 데이터를 확장하기 위한 자동화 데이터 파이프라인
6일 전
Hugging Face
R-Horizon: 당신의 대규모 추론 모델은 얼마나 멀리 갈 수 있을까요?
6일 전
Hugging Face
멀티모달 프롬프트 최적화: MLLMs에 여러 모달리티를 활용하지 않을 이유가 있을까요?
6일 전
Hugging Face
TAG: 환각 저항 확산 샘플링을 위한 접선 증폭 가이드
6일 전
Hugging Face
AutoPR: 학술 승진을 자동화해보자!
6일 전
Hugging Face
카메라와 함께 생각하기: 카메라 중심 이해 및 생성 통합 멀티모달 모델
6일 전
Hugging Face
D2E: 데스크톱 데이터 기반의 비전-액션 사전 학습을 통한 구현 AI로의 전이
6일 전
Hugging Face
테스트 시점 강화 학습을 통한 비전 언어 모델 개선
10일 전
Hugging Face
패치-디코더블-토큰: MLLMs에서 통합된 멀티모달 비전 태스크를 향하여
10일 전
Hugging Face
StaMo: 컴팩트 상태 표현으로부터 일반화 가능한 로봇 동작의 비지도 학습
10일 전
Hugging Face
우리는 올바른 벤치마크를 사용하고 있는가: 시각적 토큰 압축 방법을 위한 평가 프레임워크
10일 전
Hugging Face
벤치마크가 나이를 먹을 때: 대형 언어 모델의 사실성 평가를 통한 시간적 불일치
10일 전
Hugging Face
맥락 잡음 제거 관점에서의 장기 맥락 모델링 재검토
10일 전
Hugging Face
마르코프 사상가
10일 전
Hugging Face
OBS-Diff: 디퓨전 모델의 정확한 가지치기, 원샷으로 가능하다!
10일 전
Hugging Face
다국어 추론 모델을 언어 혼합 사고의 사슬로 밀어붙이기
10일 전
Hugging Face
효율적인 시퀀스 모델링을 위한 네이티브 하이브리드 어텐션
10일 전
Hugging Face
아프리카 언어 연구소: 저자원 아프리카 NLP 발전을 위한 협력적 접근
10일 전
Hugging Face
효율적인 장기 문맥 모델링을 위한 인공 해마 네트워크
10일 전
Hugging Face
폭풍 전의 고요: 최적화 모델링을 위한 본질적 추론의 해방
10일 전
Hugging Face
왜 저정밀도 트랜스포머 훈련이 실패하는가: 플래시 어텐션 분석
10일 전
Hugging Face
분위기 검사기: 코드 평가를 인간의 선호와 맞추기
10일 전
Hugging Face
매트릭스: 상호작용 인식 비디오 생성을 위한 마스크 트랙 정렬
10일 전
Hugging Face
RLinf-VLA: VLA+RL 훈련을 위한 통합적이고 효율적인 프레임워크
10일 전
Hugging Face
SHANKS: 음성 언어 모델을 위한 동시 청취 및 사고
10일 전
Hugging Face
Lumina-DiMOO: 다중 모달 생성 및 이해를 위한 옴니 디퓨전 대형 언어 모델
10일 전
Hugging Face
Ming-UniVision: 통합 연속 토크나이저를 통한 이미지 이해 및 생성
10일 전
Hugging Face
캐시-투-캐시: 대형 언어 모델 간의 직접적 의미 통신
10일 전