Caramel LabCaramel Lab

컴퓨터 과학 최신 연구 트렌드

AI·시스템·이론·HCI. 거대언어모델·강화학습 등.

의료 SAM 어댑터: 의료 영상 분할 적용

Medical SAM adapter: Adapting segment anything model for medical image segmentation

Segment Anything Model(SAM)은 다양한 영상 분할 작업과 프롬프트 기반 인터페이스로 인해 최근 큰 주목을 받고 있습니다. 그러나 SAM은 의료 특화 지식의 부족으로 인해 의료 영상 분할에서는 성능이 저하되는 한계가 있습니다. 본 연구는 SAM의 의료 영상 분할 능력을 향상시키는 방법을 모색합니다. 본 연구에서는 SAM을 의료 영상 분할에 통합하는 최초의 방법 중 하나인 Medical SAM Adapter(Med-SA)를 제안합니다. Med-SA는 SAM 모델을 미세 조정하는 대신 가볍고 효과적인 적응 기술을 사…

최근 1년 324회 인용
Junde Wu, Ziyue Wang·발표 2025.03· 332

어포던스 컴파일 지능: LLM 시스템의 인지 임피던스 매칭

Affordance-Compiled Intelligence: Observable-Only Cognitive Impedance Matching for No-Meta LLM-Integrated Systems

본 연구는 LLM(대규모 언어 모델) 통합 시스템의 신뢰성을 높이기 위한 새로운 이론인 인지 임피던스 매칭 이론(CIMT)을 제안한다. CIMT는 관측 가능하고 메타 정보가 없는 보호 컴파일러 이론으로, 고정된 모델 정책이 주변 환경 재설계를 통해 어떻게 다른 운영 능력을 발휘할 수 있는지 탐구한다. CIMT는 시스템 수준의 역량 증폭을 모델 가중치 개선 문제가 아닌, 세계 측면의 컴파일 문제로 접근한다. 관측, 유형화된 액션 핸들, 유효성 검사기, 복구 경로, 롤백 모드 등을 통해 시스템의 운영 능력을 향상시킨다. 또한, 명시적…

최근 1년 1,371회 인용
Patrick Lewis, Ethan Perez·발표 2026.03· 2,990

오픈소스 API 취약점 탐지 및 PoC 마이그레이션

Detecting Functionality-Specific Vulnerabilities via Retrieving Individual Functionality-Equivalent APIs in Open-Source Repositories

특정 기능에 국한된 취약점은 소프트웨어 개발자가 반드시 탐지하고 회피해야 할 중요한 문제입니다. 기존 접근 방식들은 API 본문만 고려하고 기능적으로 동등한 API들의 다양한 구현을 처리하지 못하여, 개별 기능별 취약점을 효과적으로 탐지하는 데 한계가 있었습니다. 본 연구는 이러한 문제를 해결하기 위해 API 본문 대신 API 문서 문자열과 시그니처를 활용하는 최초의 접근 방식인 APISS를 제안합니다. APISS는 기존 취약점이 있는 API에 대해 기능적으로 동등한 API들을 검색하고, 이들 API에 기존 취약점의 PoC(개념 …

최근 1년 1,669회 인용
Chen, Tianyu, Wang, Zeyu·발표 2025.01· 16,167

쿨백-라이블러 발산 위한 Kd-트리

Fast Kd-Trees for the Kullback-Leibler Divergence and Other Decomposable Bregman Divergences

본 논문은 이론적 및 구현적 측면에서 중요한 기여를 한다. 첫째, Kd-트리가 임의의 브레그만 발산으로 측정된 거리를 사용하여 ℝ^d 공간으로 확장될 수 있음을 증명한다. 놀랍게도 이는 Kd-트리에서 정확한 가지치기를 위해 삼각 부등식이 필수가 아님을 보여준다. 둘째, 분해 가능한 브레그만 발산에 대한 최근접 이웃 탐색을 위한 효율적인 알고리즘과 C++ 구현을 제공한다. 이 구현은 확률 벡터 간의 인기 있는 거리 측정법이자 통계 및 기계 학습에서 흔히 사용되는 쿨백-라이블러 발산(상대 엔트로피)을 지원한다. 이는 계산 기하학 알…

최근 1년 812회 인용
Pham, Tuyen, Wagner, Hubert·발표 2025.01· 2,154

대규모 언어 모델 연구 동향

A Survey of Large Language Models

대규모 언어 모델(LLM)의 급속한 발전은 인공지능 분야의 연구 패러다임과 실제 응용 분야에 혁신적인 변화를 가져왔습니다. 전례 없는 규모와 향상된 역량을 특징으로 하는 LLM은 그 개발, 동작 방식, 그리고 사회적 영향을 이해하기 위한 새로운 프레임워크를 요구합니다. 본 조사는 LLM 기술의 최신 발전을 네 가지 핵심 차원에서 체계적으로 검토합니다. 첫째, 대규모 자기 지도 학습, 아키텍처 혁신, 데이터 큐레이션 전략을 통해 모델의 핵심 역량을 확립하는 사전 학습 방법론을 다룹니다. 둘째, 지도 미세 조정 및 강화 학습을 포함하…

최근 1년 504회 인용
Wayne Xin Zhao, Kun Zhou·발표 2026.05· 1,404

거대 언어 모델 기반 의료 AI의 전문가 수준 도달

Toward expert-level medical question answering with large language models

거대 언어 모델(LLM)은 의료 질문 답변 분야에서 가능성을 보여왔으며, 특히 Med-PaLM은 미국 의사 면허 시험 스타일 질문에서 '합격' 점수를 넘어선 최초의 모델입니다. 그러나 장문 의료 질문 답변 및 실제 워크플로우 처리에는 여전히 어려움이 있었습니다. 본 연구에서는 이러한 격차를 해소하기 위해 Med-PaLM 2를 소개합니다. 이 모델은 기본 LLM 개선, 의료 도메인 미세 조정, 그리고 앙상블 정제 및 검색 체인(chain of retrieval)을 통한 추론 및 근거 개선 전략을 결합하여 개발되었습니다. Med-P…

최근 1년 699회 인용
K. K. Singhal, Tao Tu·발표 2025.01· 717

ML 모델 강건성 평가 방법론

On Assessing ML Model Robustness: A Methodological Framework (Academic Track)

자율주행 시스템과 같은 안전 필수 시스템에 머신러닝(ML) 모델이 적용될 경우, 불확실성과 적대적 공격에 대한 취약성으로 인해 인명 손실과 같은 심각한 결과를 초래할 수 있습니다. 따라서 이러한 시스템에 ML 모델을 통합하기 전에 모델의 경험적 강건성을 평가하는 것이 매우 중요합니다. ML 모델 강건성은 입력 섭동에 둔감하고 성능을 유지하는 모델의 능력을 의미합니다. 이러한 배경에서 Confiance.ai 연구 프로그램은 ML 모델의 경험적 강건성을 평가하기 위한 방법론적 프레임워크를 제안합니다. 이 프레임워크는 Capella 모…

최근 1년 677회 인용
Awadid, Afef, Robert, Boris·발표 2025.01· 4,603

테이블형 파운데이션 모델 기반 소규모 데이터 예측

Accurate predictions on small data with a tabular foundation model

생물 의학부터 경제학에 이르는 다양한 과학 분야에서 스프레드시트 형태의 테이블형 데이터는 광범위하게 활용됩니다. 이러한 데이터에서 누락된 값을 예측하는 것은 의학적 위험 모델, 신약 개발 등 여러 응용 분야에서 필수적인 과제입니다. 지난 20년간 테이블형 데이터 분석에서는 경사 부스팅 결정 트리가 주로 사용되었으나, 딥러닝의 발전은 새로운 가능성을 제시하고 있습니다. 본 연구에서는 테이블형 사전 학습 네트워크(TabPFN)를 제안합니다. 이는 최대 10,000개 샘플을 가진 데이터셋에서 기존 모든 방법론을 훨씬 능가하는 성능을 보…

최근 1년 616회 인용
Noah Hollmann, Samuel Müller·발표 2025.01· 617

AI 도구와 비판적 사고: 인지적 부담의 영향

AI Tools in Society: Impacts on Cognitive Offloading and the Future of Critical Thinking

인공지능(AI) 도구의 확산은 일상생활의 여러 측면을 변화시켰지만, 비판적 사고에 미치는 영향은 아직 충분히 탐구되지 않았습니다. 본 연구는 AI 도구 사용과 비판적 사고 능력 간의 관계를 인지적 부담(cognitive offloading)을 매개 요인으로 하여 조사합니다. 다양한 연령대와 교육 배경을 가진 666명의 참가자를 대상으로 설문조사와 심층 인터뷰를 결합한 혼합 연구 방법을 사용했습니다. 양적 데이터는 ANOVA 및 상관 분석으로, 질적 데이터는 인터뷰 전사본의 주제 분석을 통해 분석했습니다. 연구 결과, 빈번한 A…

최근 1년 609회 인용
Michael Gerlich·발표 2025.01· 609

강화 학습 기반 LLM 추론 능력 강화

DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning

인공지능 분야에서 일반적인 추론 능력은 오랜 난제였습니다. 최근 대규모 언어 모델(LLM)과 CoT(사고의 사슬) 프롬프팅 기법의 발전으로 기본적인 추론 작업에서 상당한 성과를 보였으나, 이는 방대한 양의 인간 주석 데이터에 크게 의존하며 복잡한 문제 해결에는 여전히 한계가 있습니다. 본 연구는 인간이 직접 주석을 단 추론 궤적 없이 순수한 강화 학습(RL)만으로 LLM의 추론 능력을 효과적으로 향상시킬 수 있음을 입증합니다. 제안된 RL 프레임워크는 자기 성찰, 검증, 동적 전략 적응과 같은 고급 추론 패턴의 자발적인 발달을 촉…

최근 1년 541회 인용
Daya Guo, Dejian Yang·발표 2025.09· 542

LLM의 소프트웨어 취약점 탐지 능력

Can Open Large Language Models Catch Vulnerabilities?

보안 소프트웨어 개발에 대규모 언어 모델(LLM)이 통합되면서, 이 모델들이 단순히 취약한 코드를 탐지하는 것을 넘어 표준화된 분류 체계에 따라 취약점을 안정적으로 분류할 수 있는지에 대한 의문이 제기됩니다. 본 연구는 Llama3, Codestral, Deepseek R1 세 가지 최신 LLM을 대상으로, Big-Vul 데이터셋의 선별된 하위 집합과 8가지 대표적인 CWE(Common Weakness Enumeration) 범주를 활용하여 체계적인 평가를 수행했습니다. 폐쇄형 분류 설정을 통해 각 모델의 취약점 존재 식별 및 정…

최근 1년 485회 인용
DeepSeek-AI, Daya Guo·발표 2025.01· 488

Boltz-2: 정확하고 효율적인 결합 친화도 예측

Boltz-2: Towards Accurate and Efficient Binding Affinity Prediction

생체 분자 상호작용의 정확한 모델링은 현대 생물학의 핵심 과제입니다. AlphaFold3 및 Boltz-1과 같은 최근 발전은 생체 분자 복합체 구조 예측 능력을 크게 향상시켰지만, 분자 기능 및 치료 효능의 핵심 속성인 결합 친화도 예측에는 여전히 한계가 있었습니다. 본 연구는 구조 및 친화도 예측 모두에서 강력한 성능을 보이는 새로운 구조 생물학 기반 모델인 Boltz-2를 소개합니다. Boltz-2는 실험 방법 조건화, 거리 제약, 다중 사슬 템플릿 통합과 같은 제어 가능성 기능을 도입했으며, 소분자-단백질 결합 친화도 추정…

최근 1년 429회 인용
Saro Passaro, Gabriele Corso·발표 2025.06· 429

예측 모델 평가 도구 PROBAST+AI

PROBAST+AI: an updated quality, risk of bias, and applicability assessment tool for prediction models using regression or artificial intelligence methods

예측 모델의 품질, 비뚤림 위험 및 적용 가능성을 평가하는 PROBAST 도구는 2019년 도입 이후 예측 모델링 방법론 및 인공지능 기술의 발전에 따라 업데이트의 필요성이 제기되었습니다. 본 연구는 이러한 변화를 반영하여 PROBAST-2019를 개선한 PROBAST+AI의 개발 과정을 설명합니다. PROBAST+AI는 모델 개발과 모델 평가라는 두 가지 주요 부분으로 구성됩니다. 모델 개발 단계에서는 16개의 질문을 통해 품질과 적용 가능성을 평가하며, 모델 평가 단계에서는 18개의 질문으로 비뚤림 위험과 적용 가능성을 평가합…

최근 1년 361회 인용
Karel G.M. Moons, Johanna AAG Damen·발표 2025.03· 361

운용 게임 KAN 표현의 형식 의미론

Formal Semantics for Kolmogorov-Arnold Network Representations of Operational Games

이 논문은 운용 게임(operational games)의 콜모고로프-아놀드 네트워크(KAN) 표현을 위한 형식 의미론 프레임워크를 개발한다. 운용 게임은 전략 및 동적 게임의 일반화로서 복잡한 다중 에이전트 상호작용 모델링에 강력하지만, 높은 차원성으로 인해 기존 분석 방법에는 한계가 있었다. 본 연구는 구성적 논리 시스템 접근 방식과 콜모고로프-아놀드 표현 정리를 활용하여, 운용 게임 역학을 KAN 아키텍처에 내장하기 위한 엄격한 수학적 기반을 확립한다. 이 프레임워크는 구조적, 운용적, 지시적 의미론을 포함하며, 수렴 속성, …

최근 1년 301회 인용
Zhukov, Georgy Alexandrovich·발표 2025.04· 3,522

생성형 AI가 비판적 사고에 미치는 영향

The Impact of Generative AI on Critical Thinking: Self-Reported Reductions in Cognitive Effort and Confidence Effects From a Survey of Knowledge Workers

지식 작업 흐름에서 생성형 AI(GenAI)의 확산은 비판적 사고 능력과 실제 적용에 미치는 영향에 대한 의문을 제기합니다. 본 연구는 지식 노동자 319명을 대상으로 GenAI 사용 시 비판적 사고가 언제, 어떻게 발휘되는지, 그리고 GenAI가 비판적 사고 노력에 언제, 왜 영향을 미치는지 설문조사했습니다. 참가자들은 업무에서 GenAI를 활용한 936가지의 직접적인 사례를 공유했습니다. 정량적 분석 결과, 과업 및 사용자별 요인을 모두 고려했을 때, 사용자의 과업별 자기 확신과 GenAI에 대한 확신이 비판적 사고 발휘 여부…

최근 1년 297회 인용
Hao-Ping Lee, Advait Sarkar·발표 2025.04· 297

자기참조 시스템의 수학적 기초

The Mathematical Foundations of Self-Referential Systems:From Computability to Transfinite Dynamics

본 연구는 계산 가능성 및 논리에서 초한(transfinite) 및 장론(field-theoretic) 구조에 이르기까지 자기참조 시스템에 대한 통합된 수학적 접근 방식을 개발하는 모노그래프 초안입니다. 자기참조 시스템은 컴퓨터 과학, 물리학, 생물학, 인공지능 등 다양한 분야에서 근본적인 역할을 하지만, 이를 포괄하는 통일된 수학적 틀은 아직 미비합니다. 이 연구는 재귀적 표현 이론(Recursive Representation Theory, RRT)을 형식화하고, 자기참조 재규격화군(Self-Referential Renormal…

최근 1년 291회 인용
Nova Spivack·발표 2025.09· 291

AI가 학생 학업 발달에 미치는 영향

The Impact of Artificial Intelligence (AI) on Students’ Academic Development

인공지능(AI)의 교육 통합은 학생들의 학업 발달에 기회와 도전을 동시에 제공하며 학습 환경을 변화시키고 있습니다. 본 연구는 AI 기술이 학생들의 학습 과정과 학업 성과에 미치는 영향을 탐구하고, AI 도입에 대한 학생들의 인식과 관련 과제를 중점적으로 다룹니다. 루마니아 국립 과학기술대학교(POLITEHNICA Bucharest) 2학년 학생 85명을 대상으로 AI 강화 학습 환경 경험을 바탕으로 연구를 진행했습니다. 참여자들은 의도적 표집을 통해 선정되었으며, AI 도구의 인식, 사용, 효과를 평가하는 7개 폐쇄형 질문과 경…

최근 1년 279회 인용
Aniella Mihaela Vieriu, Gabriel Petrea·발표 2025.03· 280

인공 레밍 알고리즘: 최적화 문제 해결을 위한 새 메타휴리스틱

Artificial lemming algorithm: a novel bionic meta-heuristic technique for solving real-world engineering optimization problems

지능형 정보 시대의 도래와 함께 다양한 분야에서 복잡한 최적화 문제가 증가하고 있습니다. 기존 메타휴리스틱 알고리즘은 많은 시나리오에서 효과적이었지만, 고차원 및 비볼록 탐색 공간에서 조기 수렴, 불충분한 탐색, 그리고 견고성 부족과 같은 문제에 직면합니다. 이는 탐색과 활용의 균형을 더 잘 맞추면서 계산 효율성을 유지할 수 있는 새로운 최적화 기술의 필요성을 강조합니다. 이러한 필요성에 대응하여, 본 연구는 레밍의 네 가지 자연적 행동(장거리 이동, 굴 파기, 먹이 찾기, 포식자 회피)을 수학적으로 모델링한 생체 모방 메타휴리스…

최근 1년 244회 인용
Yaning Xiao, Hao Cui·발표 2025.01· 244

거대 언어 모델의 잠재력 극대화를 위한 프롬프트 엔지니어링

Unleashing the potential of prompt engineering for large language models

이 연구는 거대 언어 모델(LLM)의 역량을 최대로 발휘하기 위한 프롬프트 엔지니어링의 역할을 탐구한다. 프롬프트 엔지니어링은 입력 구조화 과정으로, LLM의 유용성과 정확성을 극대화하는 핵심 기술로 부상했다. 논문은 자기 일관성, CoT(사고의 사슬), 생성 지식 등 모델 성능을 크게 향상시키는 기초 및 고급 프롬프트 엔지니어링 방법론을 심층적으로 다룬다. 또한, 시각 언어 모델(VLM)을 위한 프롬프트 기법들을 상세히 검토하며, 이들의 효능을 주관적 및 객관적 지표로 평가하여 분석의 견고성을 확보한다. 특히, 인공지능 보안 …

최근 1년 234회 인용
B.‐C. CHEN, Zhaofeng Zhang·발표 2025.05· 235
전체 분야 보기