Hugging Face
AssetOpsBench: 산업 자산 운영 및 유지보수에서 작업 자동화를 위한 AI 에이전트 벤치마킹
5일 전
Hugging Face
시맨틱이 비전을 오도할 때: 장면 텍스트 탐지 및 이해에서 대형 멀티모달 모델의 환각 완화
5일 전
Hugging Face
GuideX: 제로샷 정보 추출을 위한 가이드된 합성 데이터 생성
5일 전
Hugging Face
물리적 장면의 스플래팅: 불완전한 로봇 데이터로부터의 엔드-투-엔드 실-가상 변환
5일 전
Hugging Face
소수의 진실: 효율적인 다중 모달 추론을 위한 고가치 데이터 선택
5일 전
Hugging Face
모델이 설명할 수 있는 것보다 더 많이 아는 경우: 인간-AI 협업에서 지식 전이 정량화
5일 전
Hugging Face
동료 순위 정밀도: DataSeeds의 주석 이미지로부터 비전 모델 미세 조정을 위한 기초 데이터셋 생성
5일 전
Hugging Face
MIRIAD: 수백만 개의 의료 질의-응답 쌍으로 LLM을 증강하기
5일 전
Hugging Face
CodeContests+: 경쟁 프로그래밍을 위한 고품질 테스트 케이스 생성
5일 전
Hugging Face
HASHIRU: 하이브리드 지능형 자원 활용을 위한 계층적 에이전트 시스템
5일 전
Hugging Face
접두사 그룹화: 공유 접두사를 통한 효율적인 GRPO 학습
5일 전
Hugging Face
3DFlowAction: 3D 흐름 세계 모델을 통한 교차 구현 조작 학습
5일 전
Hugging Face
관점 연결: 자아중심-외부중심 시각을 통한 크로스뷰 협업 지능에 대한 조사
5일 전
Hugging Face
오디오 인식 대형 언어 모델을 통한 말하기 스타일 평가
5일 전
Hugging Face
STARFlow: 고해상도 이미지 합성을 위한 잠재 정규화 흐름 확장
5일 전
Hugging Face
PartCrafter: 구성적 잠재 확산 변환기를 통한 구조화된 3D 메쉬 생성
5일 전
Hugging Face
모달리티 확장이 옴니 모달리티로 가는 올바른 길인가?
5일 전
Hugging Face
Sentinel: 프롬프트 인젝션을 방어하는 최첨단 모델
5일 전
Hugging Face
자기 주의를 활용한 입력 의존적 소프트 프롬프트 생성
5일 전
Hugging Face
MORSE-500: 프로그래밍적으로 제어 가능한 비디오 벤치마크를 통한 멀티모달 추론 스트레스 테스트
5일 전
Hugging Face
FusionAudio-1.2M: 멀티모달 컨텍스트 융합을 통한 세밀한 오디오 캡셔닝을 향하여
5일 전
Hugging Face
내일도 여전히 사실일까? 신뢰할 수 있는 QA를 위한 다국어 상시 질문 분류
5일 전
Hugging Face
자기 지도 학습 음성 모델은 네덜란드어에 대해 무엇을 알고 있을까? 언어 특정 사전 학습의 이점 분석
6일 전
Hugging Face
SViMo: 비디오 및 모션 생성을 위한 동기화 확산 모델
6일 전
Hugging Face
전신 CT 이미지 해석의 재고: 이상 중심 접근법
6일 전
Hugging Face
자율주행에서 3D 점유 예측을 위한 확산 기반 생성 모델
6일 전
Hugging Face
BEVCALIB: LiDAR-카메라 보정 - 기하학 기반의 조감도 표현
6일 전
Hugging Face
워터마킹이 언어 모델의 정렬을 저하시킵니다: 분석 및 완화
6일 전
Hugging Face
지각적 분리로 확장 가능한 다중 모달 추론을 위한 보상 최적화 캡션 생성
6일 전
Hugging Face
RobustSplat: 밀집화와 역학의 분리를 통한 일시적 현상 없는 3DGS
6일 전
Hugging Face
이미지는 가변 길이의 표현을 가질 가치가 있다
6일 전
Hugging Face
FEAT: 의료 비디오 생성을 위한 전차원 효율적 주의 변환기
6일 전
Hugging Face
Micro-Act: 질문 응답에서 지식 충돌 완화를 위한 실행 가능한 자기 추론
6일 전
Hugging Face
정렬된 포인트 흐름: 일반적인 포인트 클라우드 자세 추정
6일 전
Hugging Face
MedAgentGym: 코드 기반 의료 추론을 위한 LLM 에이전트 훈련 시스템
6일 전
Hugging Face
기하학 편집 가능 및 외관 보존 객체 합성
6일 전
Hugging Face
SkyReels-Audio: 오디오 조건 기반의 영상 확산 변환기에서의 대화 초상화
6일 전
Hugging Face
FreeTimeGS: 언제 어디서나 자유로운 가우시안으로 동적 장면 재구성
6일 전
Hugging Face
MINT-CoT: 수학적 사고 체인에서 시각적 토큰의 교차 활용
6일 전
Hugging Face
EOC-Bench: MLLMs가 자아 중심 세계에서 객체를 식별, 회상 및 예측할 수 있을까?
6일 전
Hugging Face
StreamBP: 메모리 효율적인 정확한 역전파를 통한 LLM의 긴 시퀀스 학습
6일 전
Hugging Face
SparseMM: 시각적 개념 반응에서 헤드 희소성이 나타나는 MLLMs
6일 전
Hugging Face
평가는 전부입니다: 평가 설계를 통한 LLM 추론 능력의 전략적 과장
6일 전
Hugging Face
공간 인지의 전개: 시각 시뮬레이션에서 다중 모달 모델 평가
6일 전
Hugging Face
비디오를 통한 다중 모달 이해로 수학적 추론 벤치마킹: VideoMathQA
6일 전
Hugging Face
VideoREPA: 기초 모델과의 관계적 정렬을 통한 비디오 생성 물리학 학습
6일 전
Hugging Face
Surfer-H가 Holo1을 만나다: 오픈 웨이트 기반 비용 효율적인 웹 에이전트
6일 전
Hugging Face
The Common Pile v0.1: 8TB의 공공 도메인 및 공개 라이선스 텍스트 데이터셋
6일 전
Hugging Face
비디오 세계 모델과 장기 공간 메모리
6일 전
Hugging Face
SeedVR2: 확산 적대적 후속 훈련을 통한 일단계 비디오 복원
6일 전
Hugging Face
ComfyUI-Copilot: 자동화된 워크플로우 개발을 위한 지능형 어시스턴트
6일 전
Hugging Face
지속 학습에서 안정성-가소성 트레이드오프를 건축적 관점에서 재고찰하기
9일 전
Hugging Face
Rex-Thinker: 체인 오브 사고 추론을 통한 객체 지시
9일 전
Hugging Face
흐름을 따르다: 신경기호적 에이전트를 통한 세밀한 플로우차트 귀속
9일 전
Hugging Face
CapSpeech: 스타일 캡션 기반 텍스트-음성 변환에서의 다운스트림 응용 가능성
9일 전
Hugging Face
위치 전문가가 추측 디코딩을 위한 더 나은 초안을 생성합니다
9일 전
Hugging Face
HTSC-2025: AI 기반 임계 온도 예측을 위한 상온 고온 초전도체 벤치마크 데이터셋
9일 전
Hugging Face
에이전틱 AI를 위한 TRiSM: LLM 기반 에이전틱 다중 에이전트 시스템에서의 신뢰, 위험 및 보안 관리에 대한 리뷰
9일 전
Hugging Face
대규모 언어 모델에서의 동적 계층별 가지치기
9일 전
Hugging Face
BenchHub: 통합 벤치마크 스위트로 LLM 평가를 혁신하다
9일 전
Hugging Face
알 수 없는 공변량 변화 하에서 신뢰도 기반 데이터 증강을 통한 지식 증류 개선
9일 전
Hugging Face
정량적 LLM 판사
9일 전
Hugging Face
RefEdit: 지시 기반 이미지 편집 모델 개선을 위한 벤치마크 및 방법
9일 전
Hugging Face
적응 후 지속 학습
9일 전
Hugging Face
DiffDecompose: 알파 합성 이미지의 계층적 분해를 위한 확산 변환기
9일 전
Hugging Face
Critique-GRPO: 자연어 및 수치 피드백을 통한 LLM 추론 향상
9일 전
Hugging Face
두 영역에서의 강건성: CLIP에는 강력한 텍스트 인코더가 필요하다
9일 전
Hugging Face
말하는 기계: 오디오 기반 실시간 FaceTime 스타일 비디오 생성
9일 전
Hugging Face
Orak: 다양한 비디오 게임에서 LLM 에이전트를 훈련하고 평가하기 위한 기초 벤치마크
9일 전
Hugging Face
정정된 희소 주의 메커니즘
9일 전
Hugging Face
TimeHC-RL: 시간 인지형 계층적 인지 강화 학습을 통한 LLM의 사회적 지능 향상
9일 전
Hugging Face
DenseDPO: 비디오 확산 모델을 위한 세밀한 시간적 선호 최적화
9일 전
Hugging Face
SVGenius: SVG 이해, 편집 및 생성에서의 LLM 벤치마킹
9일 전
Hugging Face
VisCoder: 실행 가능한 Python 시각화 코드 생성을 위한 LLM 미세 조정
9일 전
Hugging Face
Ψ-Sampler: SMC 기반 추론 시간 보상 정렬을 위한 초기 입자 샘플링
9일 전
Hugging Face
사전 학습된 대형 언어 모델의 추론 잠재력 해방: 하나의 문제에 대한 비판적 미세 조정
9일 전
Hugging Face
이미지 편집을 프로그램으로: 확산 모델을 활용하여
9일 전
Hugging Face
Voyager: 탐험 가능한 3D 장면 생성을 위한 장거리 및 세계 일관성 비디오 확산
9일 전
Hugging Face
IllumiCraft: 통합된 기하학 및 조명 확산을 통한 제어 가능한 비디오 생성
9일 전
Hugging Face
OpenThoughts: 추론 모델을 위한 데이터 레시피
9일 전
Hugging Face
신뢰할 수 있는 LLM 평가 확립을 위한 지름길 뉴런 분석
9일 전
Hugging Face
SuperWriter: 반영 기반의 장문 생성 대형 언어 모델
9일 전
Hugging Face
MMR-V: 말하지 않은 것? 비디오에서의 멀티모달 심층 추론을 위한 벤치마크
9일 전
Hugging Face
긴 문맥 언어 모델을 위한 제어 가능한 평가
9일 전
Hugging Face
CASS: Nvidia에서 AMD로의 트랜스파일링 - 데이터, 모델 및 벤치마크
9일 전
Hugging Face
AmbiK: 주방 환경에서의 모호한 작업 데이터셋
9일 전
Hugging Face
멀티모달 추론의 발전: 최적화된 콜드 스타트에서 단계적 강화 학습으로
9일 전