본문내용 바로가기 메인메뉴 바로가기 서브메뉴 바로가기

서울과학기술대학교 바로가기

seoultech

create your dream

메인 바로가기

홍보관

서울과기대 소개 열린총장실 대학현황 대학조직 대학상징 홍보관 캠퍼스 안내 학칙 및 규정

홍보관 대학뉴스 연구성과 발전기금/동문 Global 언론에서 본 SEOULTECH 보도자료 브로슈어 학내행사 동영상자료 사진자료 음악자료

대학소개

서울과기대 소개

대학이념·교훈·교육목표

인재상

SEOULTECH 발전계획

발전계획 체계도 단계별 추진 계획 특성화 전략 체계도 SDGs-ESG Activities

산학협력 중장기 발전계획

Vision 체계 SEOULTECH 발전계획과의 연계성 전략과제 및 실행과제

연혁

주요연혁 2020년대 이후 2010년대 이후 2000년대 이후 1990년대 1980년대 1980년대 이전

역사기록관

열린총장실

인사말

학력 및 약력

총장동정

총장동정 동문과의 만남

역대총장

총장 발표자료

업무추진비

대학현황

일반현황

재정현황

대학회계 재정위원회 교육연구 및 학생지도 비용

학칙 및 규정

시행세칙

지침

대학자체평가

정보공시

대학요람

통계연보

정부혁신 실행계획

대학평의원회

대학평의원회 소개 대학평의원회 회의록

대학조직

조직도

전화번호검색

대학상징

교가

찬가

로고 및 UI

심볼마크 엠블렘 로고타입(지정서체) 시그니춰 SEAL 110주년 엠블럼 111주년 엠블럼

마스코트

마스코트 소개 매뉴얼(관리지침) 응용 동작 국문/영문 로고 이모티콘

홍보관

홍보관

대학뉴스

연구성과

발전기금/동문

Global

언론에서 본 SEOULTECH

보도자료

브로슈어

학내행사

동영상자료

사진자료

음악자료

캠퍼스 안내

교내전화번호

교내홈페이지

캠퍼스지도

캠퍼스투어

캠퍼스투어 안내 캠퍼스투어 신청 캠퍼스투어 신청조회

주차

오시는길

학칙 및 규정

연구성과

연구성과

홈 대학소개 홍보관 연구성과

연구성과 게시글 확인
제목	인공지능응용학과 김한울 교수 연구팀, CV/AI 분야 Top Conference “CVPR 2026” 논문 발표
작성자	홍보실	조회수	139	날짜	2026-06-11
첨부파일
▲ (좌측부터) 송채영 학석사연계과정생, 지도교수 김한울 창의융합대학 인공지능응용학과 김한울 교수 연구팀이 CV/AI 분야 최고 권위 국제학술대회인 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR) 2026에서 연구 논문을 발표했다. 먼저 「MultiModalPFN: Extending Prior-Data Fitted Networks for Multimodal Tabular Learning」 논문은 정형 데이터 기반 파운데이션 모델인 TabPFN을 이미지와 텍스트가 함께 존재하는 실제 데이터 환경으로 확장하는 새로운 멀티모달 학습 방법론을 제안한다. 김한울 교수 연구팀은 기존 정형 데이터 파운데이션 모델을 멀티모달 환경으로 확장하는 과정에서 발생하는 핵심 한계로, 이미지·텍스트 표현이 하나의 임베딩으로 과도하게 압축되는 문제와 비정형 데이터 토큰 수 증가에 따라 정형 데이터 신호가 약화되는 attention imbalance 문제를 규명했다. 이를 해결하기 위해 Multi-Modal Prior-data Fitted Network(MMPFN)를 제안하고, 정형 데이터와 이미지·텍스트 정보를 TabPFN이 함께 처리할 수 있는 정형 데이터 호환 토큰으로 변환하는 구조를 설계했다. 특히 Multi-head Gated MLP(MGM)를 통해 압축된 이미지·텍스트 표현으로부터 다양한 비정형 정보 토큰을 생성하고, Cross-Attention Pooler(CAP)를 통해 생성된 토큰을 균형 있게 압축함으로써 attention imbalance 문제를 완화했다. 실험 결과, MMPFN은 의료 및 일반 목적 멀티모달 데이터셋에서 기존 주요 방법론 대비 우수한 성능을 보였으며, 제한된 학습 데이터 환경에서도 안정적인 성능을 유지해 데이터 확보가 어려운 산업 및 의료 응용 분야에서도 효과적인 멀티모달 학습 대안이 될 수 있음을 보였다. 또한 김한울 교수 연구팀은 충남대학교 연구팀과의 협업을 통해 「EG-3DVG: E xpression and Geometry Aware Grounding Decoder for 3D Visual Grounding」 논문을 발표했다. 본 연구는 자연어 표현을 기반으로 3D 장면 속 대상 객체를 정확히 찾는 3D Visual Grounding 문제를 다루며, 텍스트와 3D 시각 정보의 정렬 및 공간·기하 정보 활용을 개선하는 grounding decoder를 제안했다. 제안 방법은 주요 3D Visual Grounding 벤치마크에서 우수한 성능을 보여, 로보틱스·자율주행 등 3D 공간 이해가 필요한 분야에서의 활용 가능성을 확인했다.

이전 내용이 없습니다.
인공지능응용학과 컴퓨터비전연구실 송채영 학생, 「2026년 AI서울테크연구지원사업」 석사과정 장학생 선정

담당부서 : 홍보실

전화번호: 02-970-6994