컴퓨터 과학 최신 연구 트렌드

AI·시스템·이론·HCI. 거대언어모델·강화학습 등.

#AI 생성 콘텐츠 #AIGC #다중 양식

다중 데이터 양식 AI 생성 콘텐츠 연구

AI-Generated Content (AIGC) for Various Data Modalities: A Survey

AI 생성 콘텐츠(AIGC)는 AI 알고리즘을 활용하여 텍스트, 이미지, 비디오, 3D 에셋 등 다양한 미디어를 생성하는 기술입니다. 최근 머신러닝(ML) 및 딥러닝(DL) 분야의 발전과 광범위한 응용 가능성으로 인해 AIGC는 상당한 주목을 받고 있으며, 본 연구는 ML/DL 기반 AIGC의 발전을 종합적으로 검토합니다. AIGC 방법론은 이미지, 비디오, 텍스트, 3D 형상, 3D 장면, 3D 휴먼 아바타, 3D 모션, 오디오 등 다양한 데이터 양식에 맞춰 개발되었으며, 각 양식은 고유한 특성과 도전 과제를 제시합니다. 또한,…

최근 1년 39회 인용

Lin Geng Foo, Hossein Rahmani 외·발표 2025.04· 39

원문 분석 보기

#LLM #프롬프트 주입 #의료 AI

의료 조언 LLM의 프롬프트 주입 취약성

Vulnerability of Large Language Models to Prompt Injection When Providing Medical Advice

대규모 언어 모델(LLM)이 헬스케어 분야에 통합되고 있으나, 악의적인 프롬프트 주입 공격에 대한 체계적인 평가가 부족했습니다. 본 연구는 상용 LLM이 안전하지 않은 의료 조언을 유도할 수 있는 프롬프트 주입 공격에 얼마나 취약한지 평가하고, 중간자(man-in-the-middle) 및 클라이언트 측 주입이 현실적인 공격 벡터임을 검증하는 것을 목표로 합니다. 2025년 1월부터 10월까지 표준화된 환자-LLM 대화를 사용한 시뮬레이션 연구를 수행했습니다. GPT-4o-mini, Gemini-2.0-flash-lite, Clau…

최근 1년 21회 인용

Ro Woon Lee, Tae Joon Jun 외·발표 2025.12· 21

원문 분석 보기

#컨볼루션 신경망 #대형 커널 #범용 표현 학습

대형 컨볼루션 커널 기반 범용 표현 학습

Scaling Up Your Kernels: Large Kernel Design in ConvNets Toward Universal Representations

본 논문은 현대 컨볼루션 신경망(ConvNets) 설계에서 대형 컨볼루션 커널 활용 패러다임을 제안한다. 여러 개의 작은 커널을 쌓는 대신 소수의 대형 커널을 사용하는 것이 더 우수한 설계 전략이 될 수 있음을 규명하였다. 우리는 대형 커널 ConvNets의 효율성과 성능을 최적화하는 아키텍처 설계 가이드라인을 제시한다. 특히, 대형 커널 ConvNets를 위해 고안된 체계적인 아키텍처 설계 원칙을 제공하는 UniRepLKNet 아키텍처를 제안한다. 이 아키텍처는 깊은 레이어 스태킹 없이도 광범위한 공간 정보를 포착하는 대형 커널…

최근 1년 18회 인용

Yiyuan Zhang, Xiaohan Ding 외·발표 2025.08· 18

원문 분석 보기

#생성형 AI #자율형 장애 복구 #클라우드 신뢰성

생성형 AI 기반 자율형 장애 복구 시스템

Autonomous Incident Remediation via GenAI-Assisted Runbooks

클라우드 인프라가 전 세계 디지털 운영의 핵심으로 자리 잡았지만, 복잡성 증가에 비해 신뢰성 엔지니어링은 뒤처져 있습니다. 관측 및 경고 시스템은 발전했으나, 장애 대응은 여전히 사람의 전문성에 크게 의존하여 탐지부터 자동 복구까지 상당한 격차가 발생하고, 이는 막대한 다운타임 비용과 운영 피로도로 이어집니다. 본 논문은 생성형 AI를 활용한 폐쇄 루프형 복구 프레임워크를 제안합니다. 이 프레임워크는 LLM 기반 진단, 정책 기반 실행, 안전성 검증 메커니즘을 통합하며, 지속적인 학습 피드백 주기를 통해 장애 해결의 진단, 실행,…

최근 1년 20회 인용

S. Jagan Raj·발표 2025.10· 20

원문 분석 보기

#LLM 보안 #프롬프트 주입 #AI 에이전트

LLM 프롬프트 주입 공격 종합 분석

Prompt Injection Attacks in Large Language Models and AI Agent Systems: A Comprehensive Review of Vulnerabilities, Attack Vectors, and Defense Mechanisms

대규모 언어 모델(LLM)은 인공지능 응용 분야를 혁신했지만, 실제 시스템 통합 과정에서 프롬프트 주입 공격이라는 심각한 보안 취약점을 드러냈습니다. 본 연구는 2023년부터 2025년까지의 연구 45건, 산업 보안 보고서, 실제 공격 사례를 종합적으로 분석하여 이 문제를 다룹니다. 직접적인 탈옥(jailbreaking)과 외부 콘텐츠를 통한 간접 주입을 포함한 프롬프트 주입 기술의 분류 체계를 검토했습니다. AI 에이전트 시스템과 모델 컨텍스트 프로토콜(MCP)의 등장은 공격 표면을 크게 확장하여 도구 오염 및 자격 증명 탈취와…

최근 1년 20회 인용

Saidakhror Gulyamov, Saidakhror Gulyamov 외·발표 2026.01· 20

원문 분석 보기

#계산독성학 #약물발견 #인공지능

약물 개발 AI 독성 예측

Computational toxicology in drug discovery: applications of artificial intelligence in ADMET and toxicity prediction

약물 후보물질의 임상 성공과 시장 잠재력을 결정하는 데 독성 위험 평가는 매우 중요하지만, 기존 동물 실험은 비용, 시간, 윤리적 문제로 인해 계산 독성학의 발전이 가속화되고 있습니다. 본 연구는 인공지능(AI) 기반의 약물 동태 및 독성 예측(ADMET) 플랫폼과 독성 데이터베이스를 종합적으로 분석합니다. 20개 이상의 ADMET 예측 플랫폼을 규칙/통계 기반, 머신러닝(ML), 그래프 기반 방법으로 분류하고, 화학 독성, 환경 독성, 대체 독성, 생물학적 독소 데이터베이스 등 주요 독성 데이터베이스를 모델 훈련 및 검증 관점에…

최근 1년 72회 인용

Jiangyan Zhang, H. Li 외·발표 2025.08· 72

원문 분석 보기

#그래프 신경망 #콜모고로프-아놀드 네트워크 #분자 특성 예측

분자 특성 예측을 위한 콜모고로프-아놀드 그래프 신경망

Kolmogorov–Arnold graph neural networks for molecular property prediction

그래프 신경망(GNN)은 기하학적 딥러닝의 핵심 모델로서 분자 특성 예측에서 뛰어난 성능을 보여왔습니다. 한편, 콜모고로프-아놀드 네트워크(KAN)는 다층 퍼셉트론의 강력한 대안으로 부상하며 표현력, 매개변수 효율성 및 해석 가능성을 향상시켰습니다. 이 연구는 두 프레임워크의 장점을 결합하고자 합니다. 본 연구에서는 KAN 모듈을 GNN의 세 가지 기본 구성 요소인 노드 임베딩, 메시지 전달, 그리고 읽기(readout)에 통합한 콜모고로프-아놀드 GNN(KA-GNN)을 제안합니다. 또한, 함수 근사 능력을 강화하기 위해 KAN …

최근 1년 62회 인용

Longlong Li, Yipeng Zhang 외·발표 2025.08· 62

원문 분석 보기

#LLM #의료 AI #잘못된 정보

도움이 독 될 때: LLM의 아첨과 의료 오정보 위험

When helpfulness backfires: LLMs and the risk of false medical information due to sycophantic behavior

대규모 언어 모델(LLM)은 유용성을 지향하는 훈련 과정에서 비논리적인 요청에도 순응하여 잘못된 정보를 생성할 수 있는 취약점을 보인다. 이는 모델이 해당 요청의 비논리성을 인지할 지식이 있음에도 불구하고 발생한다. 본 연구는 이러한 취약점이 의료 분야에서 어떻게 나타나는지 조사했으며, 동등 약물 관계를 오해하는 프롬프트를 사용하여 최신 LLM 5종을 평가했다. 연구는 기본 아첨 경향, 거부 허용 및 사실 회상을 강조하는 프롬프트의 영향, 그리고 비논리적 요청 데이터셋을 통한 미세 조정(분포 외 일반화 포함)의 효과를 테스트했다.…

최근 1년 67회 인용

Shan Chen, Mingye Gao 외·발표 2025.10· 67

원문 분석 보기

#딥페이크 #생성형 AI #위조 탐지

딥페이크 생성 및 탐지 기술 현황 분석

Deepfake Generation and Detection: A Benchmark and Survey

딥페이크 기술은 사실적인 얼굴 이미지 및 비디오 합성을 목표로 하며, 엔터테인먼트, 영화 제작, 디지털 휴먼 모델링 등 광범위한 응용 잠재력을 지닌다. 최근 확산 모델의 등장으로 생성 품질이 크게 향상되며 연구의 새로운 물결을 일으켰다. 그러나 딥페이크의 오용 가능성(프라이버시 침해, 피싱 공격 등)에 대응하기 위해 탐지 기술 또한 지속적으로 발전하고 있다. 본 연구는 딥페이크 생성 및 탐지 분야의 최신 발전을 종합적으로 검토한다. 먼저, 태스크 정의를 통일하고, 데이터셋 및 평가 지표를 포괄적으로 소개하며, 기반 기술을 요약한다…

최근 1년 15회 인용

Gan Pei, Jiangning Zhang 외·발표 2026.03· 15

원문 분석 보기

#적대적 머신러닝 #AI 보안 #데이터 프라이버시

적대적 머신러닝: 위협과 방어 전략

Adversarial machine learning: a review of methods, tools, and critical industry sectors

인공지능(AI)의 급속한 발전은 이미지 인식, 자율주행 등 다양한 분야에서 고성능 모델을 탄생시켰습니다. 그러나 머신러닝(ML) 모델은 적대적 공격 및 데이터 오염에 취약하여 시스템 오작동 및 의사결정 오류를 초래할 수 있으며, 개인 데이터 사용으로 인한 프라이버시 침해 문제도 제기됩니다. 본 논문은 현대 AI 시스템의 적대적 머신러닝(AML) 환경을 견고성과 프라이버시라는 이중 관점에서 조망합니다. 연구는 포괄적인 분류 체계를 활용하여 적대적 공격 및 방어 기법을 탐구합니다. 이어서 견고성 벤치마크와 함께 ML 시스템 이해관계자…

최근 1년 40회 인용

Sotiris Pelekis, Thanos Koutroubas 외·발표 2025.05· 40

원문 분석 보기

#불확실성 정량화 #심층 신경망 #인공지능 신뢰성

심층학습 불확실성 정량화 기법 연구

A Survey on Uncertainty Quantification Methods for Deep Learning

심층 신경망(DNN)은 컴퓨터 비전, 자연어 처리 등 다양한 분야에서 탁월한 성능을 보이지만, 예측의 정확도와 무관하게 과신하는 경향이 있어 자율주행, 의료 진단 등 고위험 응용 분야에서 심각한 문제를 야기할 수 있습니다. 이러한 문제 해결을 위해 DNN 예측의 신뢰도를 평가하는 불확실성 정량화(UQ) 연구의 중요성이 커지고 있습니다. 기존 UQ 연구들은 주로 신경망 아키텍처나 베이지안 공식에 따라 방법론을 분류하여, 각 방법이 다루는 불확실성 원천을 간과함으로써 실제 적용 시 적절한 기법 선택에 어려움이 있었습니다. 본 연구는 …

최근 1년 31회 인용

Wenchong He, Zhe Jiang 외·발표 2025.12· 31

원문 분석 보기

#딥러닝 보안 #모델 역공격 #프라이버시 보호

딥러닝 모델 역공격 및 방어 연구

Deep learning model inversion attacks and defenses: a comprehensive survey

민감한 분야에 딥러닝이 빠르게 도입되면서 개인 데이터의 프라이버시와 무결성에 심각한 위협을 가하는 모델 역공격(MI) 취약점이 대두되고 있습니다. 생체 인식, 헬스케어, 금융 등 다양한 응용 분야에서 MI 공격이 증가함에 따라 그 메커니즘, 영향 및 방어 방법을 이해하는 것이 시급합니다. 본 연구는 MI 공격 및 방어 전략에 대한 체계적이고 심층적인 문헌 검토를 제공하여 기존 연구의 공백을 메우고자 합니다. MI 공격의 체계적인 분류법을 제시하고, 공격 기술과 방어 메커니즘에 대한 광범위한 조사를 수행합니다. 이를 통해 MI 공…

최근 1년 43회 인용

Wencheng Yang, Song Wang 외·발표 2025.05· 43

원문 분석 보기

#생성형 AI #GAN #VAE

생성형 AI 심층 분석: 최신 동향 및 응용

Generative AI in depth: A survey of recent advances, model variants, and real-world applications

최근 딥러닝 기반 생성 모델, 특히 GAN, VAE, 확산 모델(DM)은 이미지 및 비디오 합성 등 다양한 분야에서 고품질 콘텐츠 생성에 핵심적인 역할을 하고 있습니다. 이러한 모델의 급속한 발전과 연구량 증가, 응용 분야 확장, 그리고 미해결 기술 과제로 인해 최신 동향을 파악하기가 점점 어려워지고 있습니다. 본 조사는 이러한 필요성을 해결하고자 합니다. 이 연구는 GAN, VAE, DM의 발전 과정을 이해하기 위한 포괄적인 분류 체계를 제시합니다. 다양한 변형 모델과 결합 접근 방식을 포함하여, 생성 결과물의 품질, 다양성, …

최근 1년 21회 인용

Shamim Yazdani, Akansha Singh 외·발표 2025.10· 21

원문 분석 보기

#확산모델 #로봇조작 #생성모델

로봇 조작을 위한 확산 모델 연구

Diffusion models for robotic manipulation: a survey

확산 생성 모델은 이미지 및 비디오 생성과 같은 시각 영역에서 뛰어난 성능을 보였으며, 최근 로봇 조작 분야에서도 유망한 접근 방식으로 부상하고 있습니다. 이 모델들은 확률론적 프레임워크를 기반으로 다중 모드 분포를 모델링하고 고차원 입출력 공간에 대한 견고성을 제공합니다. 본 연구는 로봇 조작 분야의 최신 확산 모델을 종합적으로 검토합니다. 특히 파지 학습, 궤적 계획, 데이터 증강 등 다양한 응용 사례를 다룹니다. 장면 및 이미지 증강을 위한 확산 모델은 로봇 공학과 컴퓨터 비전의 교차점에 위치하며, 비전 기반 작업의 일반화 …

최근 1년 23회 인용

R. Wolf, Yitian Shi 외·발표 2025.09· 23

원문 분석 보기

#설명가능인공지능 #신약개발 #인공지능

설명 가능한 AI: 신약 개발의 미래

Explainable Artificial Intelligence: A Perspective on Drug Discovery

인공지능(AI)은 신약 개발 과정을 혁신하며 치료 표적 식별, 후보 물질 정제, 연구부터 임상 적용까지의 효율성을 가속화하고 있습니다. 그러나 딥러닝 모델을 포함한 AI 모델의 내재된 불투명성은 '블랙박스' 문제를 야기하여 제약 연구자들의 해석 가능성과 수용을 제한합니다. 이에 설명 가능한 인공지능(XAI)은 AI 예측의 의사결정 메커니즘을 명확히 하여 투명성, 신뢰성, 신뢰도를 높이는 핵심 솔루션으로 부상했습니다. 본 연구는 XAI의 원칙과 방법론을 체계적으로 탐구하며, 신약 개발에 특화된 다양한 XAI 도구, 모델, 프레임워크…

최근 1년 40회 인용

Yazdan Ahmad Qadri, Sibhghatulla Shaikh 외·발표 2025.08· 40

원문 분석 보기

#의료영상분할 #딥러닝 #컴퓨터비전

의료 영상 분할을 위한 다중 스케일 차분 네트워크

M2SNet: Multi-scale in Multi-scale Subtraction Network for Medical Image Segmentation

정확한 의료 영상 분할은 조기 진단에 필수적이다. 기존 U-형 구조 기반 방법들은 디코더에서 서로 다른 레벨의 특징을 융합할 때 요소별 덧셈이나 연결을 사용하지만, 이는 불필요한 정보를 생성하여 특징 간의 상호보완성을 약화시키고 병변의 부정확한 위치 파악 및 경계 흐림을 초래한다. 이러한 문제를 해결하기 위해, 본 연구는 의료 영상 분할을 위한 다중 스케일 차분 네트워크(M2SNet)를 제안한다. 인코더에서 인접 레벨 간의 차이 특징을 생성하는 기본 차분 유닛(SU)을 설계하고, 이를 확장하여 픽셀 및 구조 수준의 차이 정보를 제…

최근 1년 26회 인용

Xiaoqi Zhao, Hongpeng Jia 외·발표 2026.07· 79

원문 분석 보기

#AI 해석력 #의료 영상 #Grad-CAM

의료 영상 AI 해석력: PLI와 Grad-CAM 비교

Advancing AI Interpretability in Medical Imaging: A Comparative Analysis of Pixel-Level Interpretability and Grad-CAM Models

본 연구는 의료 영상 진단 시 AI 모델의 투명성과 진단 정확도를 높이기 위해 새로운 Pixel-Level Interpretability(PLI) 모델을 제안한다. 기존 Grad-CAM 모델의 한계를 극복하고, 더욱 세밀한 해석력과 정밀한 병변 위치 파악을 목표로 한다. 연구 방법론으로 VGG19 CNN 아키텍처를 활용했으며, 1,000개 이상의 레이블링된 COVID-19 흉부 X선 공개 데이터셋 3종을 사용했다. 데이터는 크기 조정, 정규화, 증강을 거쳐 모델의 견고성과 일반화 능력을 확보했다. PLI 모델의 성능은 Grad-C…

최근 1년 89회 인용

Mohammad Ennab, Hamid Mcheick·발표 2025.02· 89

원문 분석 보기

#설명가능한AI #금융AI #딥러닝

금융 설명 가능한 AI 종합 분석

A comprehensive review on financial explainable AI

인공지능, 특히 딥러닝 모델은 방대한 데이터 처리 및 복잡한 패턴 학습 능력으로 다양한 산업 분야에서 광범위하게 활용되고 있습니다. 그러나 이러한 모델의 설명 불가능성은 의사결정 투명성이 필수적인 금융 및 헬스케어와 같은 중요 분야에서의 활용에 심각한 우려를 낳고 있습니다. 본 논문은 금융 분야에서 딥러닝 모델의 설명 가능성을 향상시키기 위한 다양한 방법론들을 비교 분석합니다. 설명 가능한 AI(XAI) 방법론들을 특성에 따라 분류하고, 각 방법론의 장단점을 심층적으로 검토합니다. 연구 결과, XAI 도입 시 발생할 수 있는 주…

최근 1년 76회 인용

Wei Jie Yeo, Wihan van der Heever 외·발표 2025.03· 76

원문 분석 보기

#체화인공지능 #시각언어행동모델 #로봇공학

체화 인공지능을 위한 시각-언어-행동 모델 연구

A Survey on Vision--Language--Action Models for Embodied AI

체화 인공지능(Embodied AI)은 물리적 세계에서 로봇이 작업을 수행하도록 제어하는 것을 포함하기에 인공 일반 지능(AGI)의 핵심 요소로 주목받고 있습니다. 최근 대규모 언어 모델(LLM)과 시각-언어 모델(VLM)의 성공을 기반으로, 언어 조건부 로봇 작업을 처리하고 행동을 생성하는 시각-언어-행동(VLA) 모델이 새로운 다중 모드 모델로 부상했습니다. 이처럼 빠르게 발전하는 VLA 모델 분야를 체계적으로 정리하기 위한 포괄적인 연구의 필요성이 증대되고 있습니다. 본 연구는 체화 인공지능을 위한 VLA 모델에 대한 최초의…

최근 1년 13회 인용

Yueen Ma, Zixing Song 외·발표 2026.04· 15

원문 분석 보기

#파운데이션 모델 #의료 영상 #비전-언어 모델

의료 영상 비전-언어 파운데이션 모델

Vision-language foundation models for medical imaging: a review of current practices and innovations

대규모 언어 모델과 비전-언어 모델(VLM)을 포함한 파운데이션 모델은 효율적이고 확장 가능하며 다중 모드 학습을 통해 인공지능 분야에 혁신을 가져왔습니다. 이러한 모델은 자기 지도 및 준 지도 학습의 발전을 활용하여 컴퓨터 비전과 자연어 처리를 통합함으로써 질병 분류, 분할, 교차 모드 검색, 자동 보고서 생성과 같은 복잡한 작업을 해결합니다. 의료 분야에서 파운데이션 모델은 다양한 의료 영상 모달리티 정보와 방사선 보고서 및 임상 기록의 텍스트 데이터를 결합하여 중요한 문제를 해결합니다. 이러한 통합은 진단 워크플로우를 간소화…

최근 1년 41회 인용

Jeong-Wan Ryu, Hyunyoung Kang 외·발표 2025.06· 41

원문 분석 보기

#확산모델 #이미지증강 #생성형AI

확산 모델 기반 이미지 증강 기술 동향

Advances in diffusion models for image data augmentation: a review of methods, models, evaluation metrics and future research directions

이미지 데이터 증강은 컴퓨터 비전 분야에서 훈련 데이터셋의 다양성과 품질을 높여 머신러닝 모델의 성능과 견고성을 향상시키는 핵심 방법론입니다. 이는 또한 이미지의 맥락과 의미를 고려한 편집 및 수정에도 활용될 수 있습니다. 최근 생성형 인공지능 분야에서 가장 유망한 확산 모델(DMs)은 사실적이고 다양한 이미지를 생성하며 이미지 데이터 증강을 위한 강력한 도구로 부상했습니다. 본 연구는 이미지 증강을 위한 확산 모델 기반 접근 방식을 체계적이고 심층적으로 검토합니다. 먼저 확산 모델의 기본 원리, 모델 아키텍처 및 훈련 전략을 포…

최근 1년 47회 인용

Panagiotis Alimisis, Ioannis Mademlis 외·발표 2025.01· 48

원문 분석 보기

#거대언어모델 #LLM #안전장치

거대 언어 모델 안전성 확보 방안

Safeguarding large language models: a survey

거대 언어 모델(LLM) 분야의 급속한 발전과 함께, 윤리적 사용을 보장하기 위한 강력한 안전 메커니즘, 즉 '안전장치' 또는 '가드레일' 개발의 중요성이 커지고 있습니다. 본 논문은 이 핵심 메커니즘의 현재 상태를 체계적으로 문헌 검토하고, 주요 과제와 다양한 맥락의 윤리적 문제를 다루는 포괄적인 메커니즘으로 발전시킬 방안을 논의합니다. 먼저, 주요 LLM 서비스 제공업체와 오픈소스 커뮤니티가 활용하는 안전장치 메커니즘의 현황을 설명합니다. 이어서 환각, 공정성, 프라이버시 등 가드레일이 강화해야 할 바람직하거나 바람직하지 않은…

최근 1년 51회 인용

Yi Dong, Ronghui Mu 외·발표 2025.10· 51

원문 분석 보기

#오토인코더 #딥러닝 #표현 학습

심층 오토인코더 신경망: 종합 분석

Deep Autoencoder Neural Networks: A Comprehensive Review and New Perspectives

오토인코더는 딥러닝의 핵심 기술로 자리매김하며 이미지 처리, 이상 탐지, 생성 모델링 등 다양한 분야에서 표현 학습 능력을 크게 향상시켰습니다. 본 논문은 오토인코더의 초기 개념부터 적대적 오토인코더, 컨볼루션 오토인코더, 변이형 오토인코더와 같은 고급 구현에 이르기까지 그 아키텍처를 포괄적으로 검토합니다. 각 오토인코더의 작동 메커니즘, 수학적 토대, 일반적인 응용 분야 및 생성 모델링에서의 역할을 심층적으로 분석합니다. 이를 통해 기존 지식을 통합하고 최신 발전 동향을 제시합니다. 본 연구는 현대 머신러닝 과제를 해결하는 데…

최근 1년 71회 인용

Ibomoiye Domor Mienye, Theo G. Swart·발표 2025.03· 71

원문 분석 보기

#AI 벤치마크 #시스템 검증 #배포 신뢰성

검증 벤치마킹 표준 제안

The Verification Benchmarking Standard (Verification Intelligence series, Paper 11 of 12)

현재 인공지능(AI) 벤치마크는 시스템의 생성 능력, 즉 추론, 코드 품질, 언어 유창성 등을 주로 측정한다. 그러나 기업이 AI 시스템을 배포할 때 직면하는 재작업률, 검증 비용, 잘못된 완료 빈도, 그리고 검증된 정확한 결과물을 산출하는 데 드는 총비용과 같은 실질적인 문제들은 제대로 반영하지 못하고 있다. 본 논문은 이러한 생성 능력과 배포 신뢰성 간의 격차를 포착하기 위한 새로운 벤치마킹 표준을 제안한다. 이 표준은 일곱 가지 핵심 검증 지표를 중심으로 구축되어, AI 시스템의 실제 운영 환경에서의 성능을 종합적으로 평가한…

최근 1년 31회 인용

Darren Wright·발표 2026.06· 31

원문 분석 보기

#C++17 #STA 제어 #시뮬레이션

C++17 기반 STA 제어 시뮬레이션

C++17 Staged Toy Simulation for STA Pre-Commitment Controllability

본 연구는 STA(Signal-Time-Authority) 시리즈의 두 번째 논문으로, 이전 논문에서 제시된 STA 사전 약정 제어 가능성 프레임워크를 C++17 기반의 합성 토이 시뮬레이션을 통해 검증합니다. 이 시뮬레이션은 제어 프레임워크의 실현 가능성과 효과를 탐색하기 위해 설계되었습니다. 연구는 Stage 1부터 Stage 8까지의 광범위한 결과를 통합합니다. 여기에는 반증(falsification), 구성 요소 제거(component ablation), 수정된 제거, 경계 민감도 분석, 인간 지연 시간 임계값, 안전 여유…

최근 1년 10회 인용

Htet Ko Ko Naing·발표 2026.05· 10

원문 분석 보기

#멀티모달 #대규모 언어 모델 #효율성

효율적인 멀티모달 대규모 언어 모델 연구

Efficient multimodal large language models: a survey

최근 멀티모달 대규모 언어 모델(MLLM)은 시각 질의응답 및 시각 이해·추론 분야에서 뛰어난 성능을 보였습니다. 그러나 방대한 모델 크기와 높은 학습 및 추론 비용은 학계와 산업 전반에 걸친 MLLM의 광범위한 적용을 저해하는 요인으로 작용했습니다. 특히 엣지 컴퓨팅 환경에서 효율적이고 경량화된 MLLM 연구의 잠재력은 매우 큽니다. 본 연구는 효율적인 MLLM의 현재 상태를 포괄적이고 체계적으로 검토합니다. 구체적으로 대표적인 효율적 MLLM의 발전 과정, 구조 및 전략에 대한 연구 현황, 그리고 다양한 응용 사례를 요약하여 …

최근 1년 21회 인용

Yizhang Jin, Jian Li 외·발표 2025.12· 21

원문 분석 보기

#AI 생성 예술 #딥러닝 #신경망

AI 생성 예술과 딥러닝: 발전과 전망

From Paintbrush to Pixel: A Review of Deep Neural Networks in AI-Generated Art

본 논문은 인공지능(AI) 생성 예술 분야에서 활용되는 다양한 딥러닝 신경망 아키텍처와 모델을 탐구한다. 고전적인 컨볼루션 네트워크부터 최신 확산 모델에 이르기까지, 이 분야의 주요 기술들을 심층적으로 분석한다. 각 신경망의 일반적인 구조와 작동 원리를 설명하고, DeepDream의 몽환적인 이미지부터 Stable Diffusion 및 DALL-E 3와 같은 최신 모델이 생성하는 매혹적인 이미지에 이르기까지 AI 생성 예술의 주요 발전 사례들을 제시한다. 또한, 이 모델들의 강점과 한계를 비교 분석하여 딥러닝 신경망이 단기간에 …

최근 1년 12회 인용

Anne-Sofie Maerten, Derya Soydaner·발표 2026.07· 32

원문 분석 보기

#거대언어모델 #환각현상 #프롬프트엔지니어링

거대 언어 모델 환각 현상 분석: 프롬프트 vs. 모델

Survey and analysis of hallucinations in large language models: attribution to prompting strategies or model behavior

거대 언어 모델(LLM)의 환각 현상, 즉 유창하지만 사실과 다르거나 논리적으로 모순된 출력은 교육, 헬스케어, 법률, 과학 연구 등 다양한 분야에서 LLM 활용이 증가함에 따라 중요한 문제로 부상하고 있습니다. 본 연구는 LLM 환각 현상의 원인을 체계적으로 조사하고 분석합니다. 특히 환각이 프롬프트 전략의 미흡에서 비롯된 것인지, 아니면 모델 자체의 내재적 행동에서 기인하는 것인지를 판별하는 새로운 프레임워크를 제시합니다. 연구는 GPT-4, LLaMA 2, DeepSeek 등 최신 LLM들을 대상으로 다양한 통제된 프롬프트 …

최근 1년 74회 인용

Dang Anh-Hoang, Vu Tran 외·발표 2025.09· 74

원문 분석 보기

#보편적생성원리 #기계검증 #Lean4

UGP-Lean: 보편적 생성 원리의 기계 검증

ugp-lean: A Machine-Checked Formalization of the Universal Generative Principle

보편적 생성 원리(UGP)는 정수 능선 R_n = 2^n - 16에 정의된 결정론적 산술 프레임워크로, 초기 원리로부터 자유 매개변수 없이 고유한 정식 시드 (1,73,823)를 생성하며, 이는 생성 삼중 진화(GTE) 맵에 의해 엄격하게 결정됩니다. 본 연구는 UGP/GTE 프레임워크의 기계 검증된 Lean 4 형식화인 ugp-lean을 제시합니다. ugp-lean은 400개 이상의 모듈로 구성되어 있으며, 모든 증명에서 'sorry' 키워드가 사용되지 않았습니다. 특히, 레지스터 머신(Minsky 1967 2-카운터 머신) 시…

최근 1년 54회 인용

Nova Spivack·발표 2026.07· 54

원문 분석 보기

#생성형 트랜스포머 #질병 예측 #헬스케어 AI

생성형 트랜스포머로 질병 자연사 학습

Learning the natural history of human disease with generative transformers

헬스케어 의사결정은 환자의 과거 및 현재 건강 상태 이해를 바탕으로 미래 질병 경과를 예측하고 변화시키는 데 의존합니다. 인공지능(AI)은 대규모 건강 기록에서 질병 진행 패턴을 학습하여 이 과제를 지원할 잠재력을 가지고 있지만, 그 가능성이 대규모로 충분히 탐구되지 않았습니다. 본 연구에서는 인간 질병의 진행 및 경쟁적 특성을 모델링하기 위해 GPT(생성형 사전 학습 트랜스포머) 아키텍처를 수정했습니다. 이 모델인 Delphi-2M은 40만 명의 영국 바이오뱅크 참가자 데이터를 학습하고, 190만 명의 덴마크인 외부 데이터를 사…

최근 1년 67회 인용

Artem Shmatko, Alexander W. Jung 외·발표 2025.09· 67

원문 분석 보기

#방사선과 #파운데이션 모델 #의료 AI

웹 스케일 의료 데이터 활용 방사선과 범용 모델

Towards generalist foundation model for radiology by leveraging web-scale 2D&3D medical data

본 연구는 방사선과 파운데이션 모델(RadFM) 개발의 가능성을 탐색한다. 이를 위해 데이터셋 구축, 모델 설계, 그리고 종합적인 평가의 세 가지 관점에서 접근했다. 연구팀은 1,300만 개의 2D 이미지와 61만 5천 개의 3D 스캔을 포함하는 4개의 멀티모달 데이터셋을 구축했으며, 기존 데이터셋과 통합하여 대규모 학습 데이터셋인 MedMD를 완성했다. 또한, 텍스트 입력과 2D 또는 3D 의료 스캔을 통합하여 진단, 시각 질의응답, 보고서 생성, 근거 기반 진단 등 다양한 방사선과 작업을 수행할 수 있는 새로운 모델 아키텍처를…

최근 1년 66회 인용

Chaoyi Wu, Xiaoman Zhang 외·발표 2025.08· 66

원문 분석 보기

#광학 아날로그 컴퓨팅 #메타표면 #편광 벡터

메타표면 활용 벡터 광학 아날로그 컴퓨팅

Vector analog computing via on-demand metasurface dispersive polarization transformation

광학 아날로그 컴퓨팅은 초저전력, 고속 및 높은 처리량의 병렬 처리가 가능하여 효율적인 신호 처리에 유망합니다. 기존 플랫폼은 주로 광 강도를 이용한 스칼라 컴퓨팅에 초점을 맞췄는데, 이는 환경 교란에 민감하고 입출력 신호 간의 고정된 상관관계로 인해 단일 또는 기본적인 연산으로 제한되었습니다. 본 연구는 이러한 한계를 극복하기 위해 단일층 메타표면을 활용하여 편광 벡터를 이용한 광학 아날로그 컴퓨팅을 최초로 제안합니다. 분산 푸앵카레 구(Poincaré spheres) 상에서 온디맨드(on-demand) 편광 변환을 통해 입사 …

최근 1년 66회 인용

Hui Yang, Jie Xu 외·발표 2025.10· 66

원문 분석 보기

#검색증강생성 #대규모언어모델 #AI교육

교육 분야 RAG 활용: 체계적 고찰

Retrieval-augmented generation for educational application: A systematic survey

대규모 언어 모델(LLM)은 AI 기반 교육에 혁신을 가져왔지만, 환각 현상 및 정적인 지식 등의 문제로 교육 환경에서의 신뢰성 한계가 있습니다. 검색 증강 생성(RAG)은 외부 지식 기반에서 관련 정보를 검색하여 LLM의 생성 과정에 통합함으로써 이러한 문제를 해결합니다. 이는 사실 정확도를 높이고 동적인 지식 업데이트를 가능하게 하여 LLM을 교육 애플리케이션에 더욱 적합하게 만듭니다. 본 연구는 교육 시나리오에 RAG를 통합한 기존 연구들을 종합적으로 검토합니다. 먼저 RAG의 정의와 워크플로우를 명확히 하고, RAG의 색인…

최근 1년 78회 인용

Zongxi Li, Zijian Wang 외·발표 2025.05· 78

원문 분석 보기

#LSTM #딥러닝 #순환신경망

LSTM 네트워크: 종합 분석

Long Short-Term Memory Networks: A Comprehensive Survey

순차 데이터 모델링에 혁신을 가져온 LSTM(Long Short-Term Memory) 네트워크는 기존 순환 신경망(RNN)의 한계를 극복하며 장거리 의존성을 효과적으로 포착합니다. 본 조사는 LSTM 아키텍처를 포괄적으로 다루며, 정보 유지 및 변조를 가능하게 하는 셀 상태와 게이팅 메커니즘 같은 고유 구성 요소를 상세히 설명합니다. LSTM은 자연어 처리(언어 모델링, 기계 번역, 감성 분석), 시계열 분석(예측), 음성 인식 등 다양한 분야에서 활용되며 복잡한 데이터 유형 처리의 다재다능함과 견고함을 입증했습니다. Bidir…

최근 1년 57회 인용

Moez Krichen, Alaeddine Mihoub·발표 2025.09· 57

원문 분석 보기

#생성AI #교육기술 #학습효과

생성 AI의 학습 효과: 고등 수학 사례

Generative AI without guardrails can harm learning: Evidence from high school mathematics

생성 인공지능(AI)은 인간의 업무 방식에 혁신을 가져오며 생산성 향상에 기여하고 있습니다. 그러나 AI가 새로운 기술 습득, 즉 학습에 미치는 영향은 중요한 미해결 과제입니다. 장기적인 생산성, 특히 AI의 오류 가능성을 고려할 때 사용자의 학습은 필수적입니다. 본 연구는 고등학생을 대상으로 한 현장 실험을 통해 생성 AI 튜터가 학습에 미치는 영향을 탐구했습니다. 거의 천 명의 고등 수학 학생들에게 두 가지 유형의 생성 AI 튜터에 대한 접근 권한을 제공했습니다. 하나는 일반적인 ChatGPT 인터페이스를 모방한 'GPT Ba…

최근 1년 92회 인용

Hamsa Bastani, Osbert Bastani 외·발표 2025.06· 94

원문 분석 보기

#의료영상분할 #생성AI #딥러닝

저데이터 의료 영상 분할 위한 생성 AI

Generative AI enables medical image segmentation in ultra low-data regimes

의료 영상의 의미론적 분할은 질병 진단 및 치료 계획 수립에 필수적입니다. 딥러닝은 이 작업을 효과적으로 자동화하지만, 주석이 달린 분할 마스크의 희소성으로 인해 초저데이터 환경에서는 어려움을 겪습니다. 본 연구는 이러한 문제를 해결하기 위해 고품질 영상-마스크 쌍을 보조 훈련 데이터로 생성하는 생성 딥러닝 프레임워크를 제안합니다. 기존 생성 모델이 데이터 생성과 모델 훈련을 분리하는 것과 달리, 본 프레임워크는 다단계 최적화를 통해 종단간 데이터 생성을 수행합니다. 이는 분할 성능이 생성 과정을 유도하여, 분할 결과 개선에 최적…

최근 1년 22회 인용

Li Zhang, Basu Jindal 외·발표 2025.07· 22

원문 분석 보기

#대규모언어모델 #자율에이전트 #도구활용

언어에서 행동으로: LLM 에이전트 및 도구 활용

From language to action: a review of large language models as autonomous agents and tool users

인간 수준의 인공지능(AI)을 향한 노력은 자율 에이전트와 대규모 언어 모델(LLM)의 발전을 크게 촉진했습니다. LLM은 지시 해석, 순차적 작업 관리, 피드백을 통한 적응 능력 덕분에 의사결정 에이전트로 널리 활용되고 있습니다. 본 리뷰는 자율 에이전트 및 도구 사용자로서 LLM의 최신 개발 동향을 7가지 연구 질문을 중심으로 분석합니다. 2023년부터 2025년 사이에 A* 및 A 등급 학술대회와 Q1 저널에 게재된 논문만을 사용했습니다. LLM 에이전트의 아키텍처 설계 원칙을 단일 및 다중 에이전트 시스템으로 나누어 구조적…

최근 1년 20회 인용

Sadia Sultana Chowa, Riasad Alvi 외·발표 2026.01· 20

원문 분석 보기

#월드 모델 #자율주행 #LLM

LLM 기반 운전 영상 생성 월드 모델

DriveDreamer-2: LLM-Enhanced World Models for Diverse Driving Video Generation

자율주행 분야에서 월드 모델은 다중 시점 운전 영상 생성에 탁월한 성능을 보였으나, 맞춤형 영상 생성에는 한계가 있었습니다. 본 연구는 사용자 정의 운전 영상 생성을 위해 대규모 언어 모델(LLM)을 통합한 DriveDreamer-2를 제안합니다. DriveDreamer-2는 사용자 설명에 부합하는 궤적을 생성하는 궤적 생성 함수 라이브러리를 개발하고, 궤적에서 도로 구조를 학습하는 HDMap 생성기를 설계했습니다. 또한, 생성된 다중 시점 운전 영상의 시간적, 공간적 일관성을 강화하기 위해 통합 다중 시점 모델(UniMVM)을 …

최근 1년 38회 인용

Guosheng Zhao, Xiaofeng Wang 외·발표 2025.04· 39

원문 분석 보기

#딥페이크 탐지 #멀티모달 #확산 모델

멀티모달 딥페이크 탐지 강화

Enhancing multimodal deepfake detection with local–global feature integration and diffusion models

정교한 생성 기술로 오디오-시각 데이터 조작이 증가함에 따라 딥페이크 탐지는 중요한 과제가 되었습니다. 기존 방법은 주로 오디오-시각 특징을 이용한 립싱크 동기화에 초점을 맞추며, 컨볼루션 신경망(CNN)을 통한 지역 특징 추출에 의존합니다. 본 연구는 지역 및 전역 특징 통합을 통해 딥페이크 탐지를 강화하는 멀티모달 프레임워크를 제안합니다. 기존 파이프라인에 눈 움직임, 얼굴 영역 등 추가 시각 특징과 오디오 특징을 결합하여 교차 모달 의존성을 모델링합니다. CNN은 지역 특징을, 비전 트랜스포머(ViT)는 시각 및 오디오 양식…

최근 1년 37회 인용

Muhammad Yaqoob Javed, Zhaohui Zhang 외·발표 2025.03· 37

원문 분석 보기

#생성형 AI #비판적 사고 #지식 근로자

생성 AI가 비판적 사고에 미치는 영향

The Impact of Generative AI on Critical Thinking: Self-Reported Reductions in Cognitive Effort and Confidence Effects From a Survey of Knowledge Workers

지식 작업 흐름에서 생성 인공지능(GenAI)의 확산은 비판적 사고 능력과 실제 적용에 미치는 영향에 대한 의문을 제기합니다. 본 연구는 319명의 지식 근로자를 대상으로 GenAI 사용 시 비판적 사고가 언제, 어떻게 발현되는지, 그리고 GenAI가 비판적 사고 노력에 언제, 왜 영향을 미치는지 조사했습니다. 참여자들은 업무 과제에서 GenAI를 사용한 936가지 직접적인 사례를 공유했습니다. 정량적 분석에서는 과제 및 사용자별 요인을 모두 고려했을 때, 사용자의 과제별 자신감과 GenAI에 대한 신뢰도가 비판적 사고 발현 여부…

최근 1년 347회 인용

Hao-Ping Lee, Advait Sarkar 외·발표 2025.04· 347

원문 분석 보기

#시각언어모델 #미세조정 #노이즈주입

노이즈 활용 시각-언어 정렬 강화

Enhance Vision-Language Alignment with Noise

사전 학습된 시각-언어(VL) 모델의 발전과 함께, 다운스트림 태스크에서 시각 및 언어 양식 간의 정렬을 개선하는 것이 중요한 과제로 부상했습니다. 기존 미세 조정 방법들이 두 양식에 추가 모듈을 사용하는 것과 달리, 본 연구는 고정된 모델을 맞춤형 노이즈를 통해 미세 조정할 수 있는지 탐구합니다. 이 접근 방식은 노이즈의 영향을 정량적으로 분석하는 유익한 노이즈, 즉 긍정적 유인 노이즈(Pi-noise)에 대한 과학적 연구에서 영감을 받았습니다. 이를 통해 VL 모델 미세 조정에 활용될 수 있는 유익한 노이즈 분포를 학습하는 새…

최근 1년 38회 인용

Sida Huang, Hongyuan Zhang 외·발표 2025.04· 38

원문 분석 보기

#인공지능 교육 #적응형 학습 #개인화 학습

적응형 교육 AI: 개인화 학습 기술 체계적 고찰

Artificial intelligence in adaptive education: a systematic review of techniques for personalized learning

인공지능(AI)은 머신러닝, 딥러닝, 다중 모드 분석을 통해 개인 맞춤형 학습 경험을 제공하며 디지털 교육을 혁신하고 있습니다. 본 체계적 문헌 검토는 AI 기반 적응형 학습 기술을 분석하며, 특히 지도 및 비지도 학습, 강화 학습, 다중 모드 데이터 통합에 중점을 둡니다. 이 기술들이 개인화, 학습자 참여, 교육 형평성을 어떻게 향상시키는지 평가합니다. PRISMA 가이드라인에 따라 2015년부터 2025년까지 Scopus, Web of Science, IEEE Xplore 등에서 발행된 142편의 동료 심사 논문을 분석했습니다.…

최근 1년 51회 인용

Hariyanto Hariyanto, Francisca Xaveria Diah Kristianingsih 외·발표 2025.10· 51

원문 분석 보기

#AI 추론 #세계 모델 #환각 감소

SΔϕ-62: 세계 모델 커널 프로토콜

SΔϕ-62 — World Model Kernel: Observed Trace, Inference, UMR, Binding Status, and Revision Path Protocols (v1.1, AI-Readable Kernel Package)

SΔϕ-62는 Sofience–Δϕ 형식주의 시리즈의 핵심인 세계 모델 커널을 정의한다. 이 연구는 AI 추론이 관찰된 흔적, 추론, 가정, 미해결 모델 잔여물(UMR), 바인딩 상태, 수정 경로를 단일 표면적 답변으로 통합해서는 안 된다는 중심 주장을 제시한다. AI는 결론을 도출하기 전에 무엇이 관찰되었고, 무엇이 추론되었으며, 무엇이 미해결 상태로 남아있는지, 주장이 세계와 얼마나 강력하게 연결되어 있는지, 그리고 무엇이 이를 수정할 수 있는지를 명확히 밝힐 수 있어야 한다. 이 AI-판독 가능 커널 패키지는 SΔϕ-62 논…

최근 1년 25회 인용

Sofience·발표 2026.05· 25

원문 분석 보기

#의료 AI #3D 의료 영상 #시각-언어 모델

3D 의료 영상용 시각-언어 모델

Vision-language foundation model for 3D medical imaging

최근 인공지능, 특히 시각-언어 파운데이션 모델(VLFMs)의 발전은 복잡한 3D 의료 영상 데이터로부터 방사선 보고서 생성을 자동화할 가능성을 보여줍니다. 본 연구는 VLFMs에 대한 23개 연구를 분석하여 모델 아키텍처, 기능, 훈련 데이터셋 및 평가 지표에 중점을 두었습니다. 연구 방법론은 VLFMs 관련 문헌을 체계적으로 검토하고, 각 연구의 핵심 요소를 비교 분석하는 방식으로 진행되었습니다. 이를 통해 방사선학 분야에서 AI의 진화 과정을 추적하고, 현재 기술 수준과 한계를 파악했습니다. 분석 결과, 일관되고 고품질의 …

최근 1년 23회 인용

Jing Wu, Yuli Wang 외·발표 2025.08· 23

원문 분석 보기

#확산 모델 #이미지 생성 #생성형 AI

확산 모델 기반 이미지 생성 연구 동향

Comprehensive exploration of diffusion models in image generation: a survey

딥러닝 기술의 급속한 발전과 함께 확산 모델은 이미지, 오디오, 비디오 합성, 분자 설계, 텍스트 생성 등 다양한 분야에서 유망한 생성 모델로 부상했습니다. 독특한 생성 메커니즘과 뛰어난 품질 덕분에 여러 분야에서 가치 있는 도구로 활용되고 있습니다. 그러나 이미지 생성 분야에서 확산 모델의 광범위한 배포는 데이터 프라이버시, 보안, 예술 윤리와 같은 사회적 문제들을 야기하고 있습니다. 기존 연구들은 최신 확산 모델 기반 이미지 합성 기술과 잠재적 사회적 함의를 충분히 다루지 못하는 한계가 있습니다. 본 논문은 확산 모델의 배경…

최근 1년 49회 인용

Hang Chen, Qian Xiang 외·발표 2025.01· 49

원문 분석 보기

#원격탐사 #대규모언어모델 #시각언어모델

SkyEyeGPT: 원격 탐사 시각-언어 모델 통합

SkyEyeGPT: Unifying remote sensing vision-language tasks via instruction tuning with large language model

최근 대규모 언어 모델(LLM)이 시각-언어 영역으로 확장되어 인상적인 다중 모달 능력을 보이고 있으나, 원격 탐사(RS) 데이터에 특화된 다중 모달 대규모 언어 모델(MLLM) 연구는 초기 단계이며, 관련 데이터셋 부족과 성능 한계가 존재합니다. 본 연구는 이러한 문제를 해결하고자 RS 다중 모달 지시 튜닝 데이터셋인 SkyEye-968k를 구축했습니다. 이 데이터셋은 단일 및 다중 작업 대화 지시를 포함하며, 수동 검증을 거쳐 968k개의 고품질 샘플로 구성됩니다. 이를 기반으로 RS 다중 세분화 시각-언어 이해를 위해 특별히…

최근 1년 96회 인용

Yang Zhan, Zhitong Xiong 외·발표 2025.02· 100

원문 분석 보기

#생성형 AI #과학 이미지 #VAE

VAE, GAN, 확산 모델 기반 과학 이미지 생성

Synthetic Scientific Image Generation with VAE, GAN, and Diffusion Model Architectures

생성형 AI는 과학 이미징 분야에 새로운 가능성을 제시하며 다양하고 복잡한 이미지 데이터를 합성하는 강력한 도구로 부상했습니다. 본 연구는 과학 이미지 합성을 목적으로 Variational Autoencoder (VAE), Generative Adversarial Network (GAN), Diffusion Model 등 주요 생성 모델 아키텍처를 포괄적으로 비교 분석합니다. 각 모델의 기본 원리, 최신 아키텍처 발전, 실제 적용 시 장단점을 검토했습니다. 암석 및 복합 섬유의 microCT 스캔, 식물 뿌리 고해상도 이미지 등 …

최근 1년 24회 인용

Zineb Sordo, Eric Chagnon 외·발표 2025.07· 24

원문 분석 보기

#뇌 시각 정보 #대규모 언어 모델 #LLM

인간 뇌 시각 정보와 LLM 표현의 정렬

High-level visual representations in the human brain are aligned with large language models

인간의 뇌는 시각 입력에서 객체, 공간적·의미론적 관계, 환경과의 상호작용 등 복잡한 정보를 추출하지만, 이를 정량적으로 연구하는 방법은 여전히 부족합니다. 본 연구는 대규모 언어 모델(LLM)에 인코딩된 맥락 정보가 뇌가 자연 장면에서 추출하는 복잡한 시각 정보를 모델링하는 데 유용한지 탐구합니다. 연구팀은 장면 캡션의 LLM 임베딩이 자연 장면을 볼 때 유발되는 뇌 활동을 성공적으로 특성화함을 보였습니다. 이 매핑은 다양한 뇌 영역의 선택성을 포착하며, 뇌 활동으로부터 정확한 장면 캡션을 재구성할 수 있을 만큼 견고합니다. 엄…

최근 1년 32회 인용

Adrien Doerig, Tim C. Kietzmann 외·발표 2025.08· 32

원문 분석 보기

#AI #AGI #컴퓨터 과학

BIFACE 기반 문장 좌표 문서: AI+AGI 연동 프레임워크

Paper 1 — BIFACE-Based Sentence Coordinate Documents: Human-Readable Surfaces and AI+AGI-Referable Coordinates Across Documents, Code, Media, and Conversations

본 연구는 인간이 인지 가능한 결과물을 AI 및 AGI 시스템이 동시에 참조할 수 있도록 하는 비실행 구조 프레임워크인 BIFACE 기반 문장 좌표 문서(SCD)를 제안한다. 이는 문서, 오피스 출력물, 코드, 이미지 영역, 비디오 장면, 자막, 음성, 대화, 검토 및 수정 지침 등 다양한 형태의 데이터에서 인간이 읽을 수 있는 표면과 AI+AGI가 참조할 수 있는 좌표 레이어가 공존하는 참조 구조를 정의한다. SCD/BIFACE는 데이터 저장, 실행, 승인, 동의, 판단, 법적 효력, 정산, 증거 확인 또는 AI/AGI 의사결정…

최근 1년 20회 인용

The First Waters·발표 2026.05· 20

원문 분석 보기

#AI 지식 그래프 #개체 무결성 #메타데이터

AI 지식 그래프의 개체 무결성 유지

Entity Integrity: Maintaining Accurate Representation in AI Knowledge Graphs

인공지능(AI) 시스템에서 개체를 명확하고 정확하게 표현하는 것은 지식 그래프의 신뢰성을 보장하는 데 필수적입니다. 본 연구는 개체 무결성을 'AI 시스템이 개체를 고유하고 올바르게 속성이 부여된 노드로 표현하도록 보장하는 것'으로 정의하고, AI 지식 그래프에서 발생하는 다섯 가지 주요 실패 모드를 체계적으로 분석합니다. 제시된 실패 모드에는 개체 충돌, 개체 파편화, 속성 표류, 범주 흡수, 시간적 붕괴가 포함됩니다. 이러한 문제들을 해결하기 위한 핵심 방법론으로 'AI 색인화를 위한 메타데이터 패킷'을 제안합니다. 이 패킷은…

최근 1년 16회 인용

Rex Fraction, Lee Sharks·발표 2026.04· 16

원문 분석 보기

#FMEA #지식 그래프 #RAG

FMEA 지식 그래프 RAG 시스템

Knowledge graph enhanced retrieval-augmented generation for failure mode and effects analysis

신제품 출시 단계에서 잠재적 고장을 완화하는 데 필수적인 FMEA(고장 모드 및 영향 분석)는 기존 도구의 제한된 추론 능력으로 인해 효과가 저해됩니다. 대규모 언어 모델(LLM)은 자연어 처리에서 새로운 가능성을 제시하지만, 사실적 지식 요구 사항에서 약점을 보입니다. 이를 보완하기 위해 비모수적 데이터 저장소에서 정보를 검색하여 응답을 생성하는 RAG(검색 증강 생성) 접근 방식이 주목받고 있습니다. 본 연구는 RAG 프레임워크의 비모수적 데이터 저장소를 지식 그래프(KG)로 강화하는 방법을 제안합니다. FMEA 데이터를 위한…

최근 1년 42회 인용

Lukas Bahr, Christoph Wehner 외·발표 2025.03· 42

원문 분석 보기

#지식 그래프 #LLM #검증

LLM과 휴먼-인-더-루프를 활용한 지식 그래프 검증

Knowledge graph validation by integrating LLMs and human-in-the-loop

지식 그래프(KG)의 품질은 이를 기반으로 하는 지능형 애플리케이션의 성공에 필수적입니다. 최근 대규모 언어 모델(LLM)의 발전은 다양한 작업에서 인간 수준의 성능을 보여주며, KG 검증에서의 잠재력에 대한 질문을 제기합니다. 본 연구는 LLM과 도메인 전문가 간의 다양한 협업 전략을 탐색하며, 인간 중심의 KG 검증 워크플로우에서 LLM의 역할을 탐구합니다. 저자들은 완전 자동화된 검증부터 전문가 감독과 AI 지원을 결합한 하이브리드 방식에 이르기까지 9가지 접근 방식을 제안하고 평가했습니다. 이 워크플로우들은 과학계량학적 작…

최근 1년 40회 인용

Stefani Tsaneva, Danilo Dessı̀ 외·발표 2025.04· 40

원문 분석 보기

#설명가능인공지능 #XAI #AI모델해석

설명 가능한 AI 최신 기술 동향

Recent Emerging Techniques in Explainable Artificial Intelligence to Enhance the Interpretable and Understanding of AI Models for Human

설명 가능한 인공지능(XAI)의 발전에도 불구하고, 복잡한 AI 모델의 해석과 이해에는 여전히 어려움이 있어 광범위한 채택에 제약이 있습니다. 특히 AI 모델의 투명성과 해석 가능성 부족은 사용자 신뢰를 저해하고 중요한 의사결정 과정에 통합되는 것을 방해합니다. 본 연구는 이러한 문제를 해결하기 위해 XAI의 최근 부상하는 기술들을 탐색합니다. 연구는 AI 모델의 해석 가능성을 높이고 인간이 의사결정 과정을 더 잘 이해하도록 돕는 것을 목표로 합니다. 이를 위해 사후 설명, 모델 투명성 방법, 대화형 시각화 기술 등 다양한 방법론…

최근 1년 125회 인용

Daniel J. Mathew, Deborah Ebem 외·발표 2025.02· 125

원문 분석 보기

#AGI #인공지능 #교차 검증

AGI 시대 다층 교차 검증 방법론

Paper 6 — Multi-Layer Cross Verification in the AGI Era: Role Feasibility, Output Reference, and Pre-Transaction Validation

본 연구는 AGI(인공 일반 지능) 시대에 AI 및 AGI 시스템의 출력을 검증하기 위한 구조적 방법론인 '다층 교차 검증'을 제안한다. 기존 AGI 구조 정렬 시리즈의 1~5편을 기반으로, 본 논문은 AI+AGI 결과물이 역할, 책임, 권한 범위, 증거 참조, 보존 맥락 또는 사전 거래 조건과 연계되기 전에 어떻게 교차 검증될 수 있는지 다룬다. 제안하는 프레임워크는 고정된 검증 체크리스트를 제시하지 않는다. 대신, 검증 계층의 수와 구성은 출력 유형, 도메인 위험, 역할 민감도, 권한 경계, 거래 관련성, 증거 요구사항 및 보…

최근 1년 52회 인용

The First Waters·발표 2026.05· 52

원문 분석 보기

#거대 언어 모델 #LLM #인간-AI 상호작용

거대 언어 모델의 지식과 인간의 인식

What large language models know and what people think they know

인공지능 시스템, 특히 거대 언어 모델(LLM)이 의사결정 과정에 깊이 통합되면서, 그 결과물에 대한 신뢰는 매우 중요해지고 있습니다. LLM이 인간의 신뢰를 얻으려면 예측의 정확도를 정확하게 평가하고 전달하는 능력이 필수적입니다. 기존 연구는 LLM의 내부 확신도에 초점을 맞췄으나, 사용자에게 불확실성을 얼마나 효과적으로 전달하는지에 대한 이해는 부족했습니다. 본 연구는 LLM이 생성한 답변에 대한 인간의 확신도와 모델의 실제 확신도 간의 차이인 '보정 격차'와, 인간과 모델이 정답과 오답을 얼마나 잘 구별하는지를 나타내는 '판…

최근 1년 136회 인용

Mark Steyvers, Heliodoro Tejeda 외·발표 2025.01· 137

원문 분석 보기

#AI 음성 #음성 복제 #딥페이크

AI 음성 복제물 탐지 능력 부족

People are poorly equipped to detect AI-powered voice clones

생성형 인공지능(AI)의 급격한 발전은 텍스트, 오디오, 이미지, 비디오 등 다양한 형태의 콘텐츠가 인간이 생성한 콘텐츠를 모방하는 능력을 지속적으로 향상시키고 있습니다. 특히 음성 분야에서 AI 기술은 실제 사람의 목소리와 구별하기 어려울 정도로 정교해지고 있으며, 이는 사회적, 윤리적 문제를 야기할 수 있습니다. 본 연구는 일련의 지각 연구를 통해 AI 생성 음성의 사실성, 특히 신원 일치 및 자연스러움 측면을 평가했습니다. 참가자들에게 실제 음성과 AI 생성 음성을 들려주고, 두 음성의 동일성 여부와 AI 생성 여부를 판단하…

최근 1년 41회 인용

Sarah Barrington, Emily A. Cooper 외·발표 2025.03· 41

원문 분석 보기

#다중모드 감성 분석 #트랜스포머 #적대적 훈련

강건한 다중모드 감성 분석 융합 트랜스포머 RAFT

RAFT: Robust Adversarial Fusion Transformer for multimodal sentiment analysis

다중모드 감성 분석(MSA)은 텍스트, 오디오, 시각 신호를 통합 처리하여 인간의 감정을 이해하는 핵심 기술로 부상했습니다. 그러나 기존 융합 모델은 양상 잡음, 채널 누락, 약한 양상 간 결합 등 실제 환경의 문제에 취약합니다. 이 연구는 이러한 한계를 해결하고자 교차 양상 및 자기 주의 메커니즘과 잡음 모방 적대적 훈련을 통합한 RAFT(Robust Adversarial Fusion Transformer)를 제안합니다. RAFT는 불완전한 입력 조건에서 특징 상호작용과 복원력을 강화합니다. 특히, MSA에서 잡음 및 불완전 데…

최근 1년 66회 인용

Rui Wang, Dan Xu 외·발표 2025.07· 66

원문 분석 보기

#AGI #인공지능 #컴퓨터과학

AGI 시대 출력 참조 경계 구조: SCD+보안

Paper 2 — SCD + Security: Output Reference Boundary Structures in the AGI Era

본 연구는 AGI 시대를 위한 비실행 출력 참조 경계 구조인 SCD+보안을 소개한다. AGI 구조 정렬 시리즈의 첫 번째 논문에서 BIFACE 기반 문장 좌표 문서(SCD)를 좌표 참조 문법으로 확립한 것에 이어, 본 논문은 다음 구조적 질문에 답한다: 어떤 역할, AI+AGI 환경, 검토 맥락에서 어떤 문장, 코드, 이미지 영역, 비디오 장면, 자막, 음성 세그먼트, 대화 또는 수정 지침 좌표를 어떤 경계 조건 하에 참조할 수 있는가? SCD+보안은 사이버 보안, 인증, 암호화, 접근 제어, 저장, 실행, 증거 확인, 승인, 동…

최근 1년 52회 인용

The First Waters·발표 2026.05· 52

원문 분석 보기

#내러티브 리뷰 #문헌 검토 #연구 방법론

내러티브 리뷰 방법론: 실용적 지침

Trilhas metodológicas para a revisão narrativa: orientações pragmáticas para sua elaboração

과학 연구에서 신뢰성과 목표 달성을 위해 연구 방법론은 필수적이며, 문헌 검토는 지식 통합의 핵심 도구입니다. 특히 내러티브 리뷰와 같은 비체계적 검토의 엄격성과 품질을 보장하기 위한 구조화의 중요성이 강조됩니다. 이 연구는 내러티브 리뷰 수행을 위한 체계적인 방법론적 조직을 제안하는 것을 목표로 합니다. 내러티브 리뷰는 변수 조작 없이 2차 자료를 통해 지식을 종합하는 기술적, 횡단적 설계입니다. 이는 주관적인 조직과 임의적인 자료 선택을 특징으로 하며, 재현성보다는 이론적 관련성을 우선시합니다. 엄격한 방법론적 구조는 없지만,…

최근 1년 65회 인용

Dante Ogassavara, Thais da Silva Ferreira 외·발표 2025.12· 65

원문 분석 보기

#트랜스포머 #토큰 임베딩 #어텐션 메커니즘

임베딩 가설: 푸리에 회로에서 No-Q 어텐션까지

The Embedding Hypothesis: From Fourier Circuits to No-Q Attention

토큰 임베딩 레이어는 트랜스포머 어텐션의 기하학적 기반을 형성한다. 본 연구는 이 주장을 네 단계에 걸쳐 발전시킨다. 첫째, 임베딩 기울기에 나이퀴스트 주파수 모드를 부여하는 PFFT(Prescribed Fourier Frequency Training)가 모듈러 산술에서 그로킹(grokking) 도달 에포크를 92.7% 단축하고(782회→57회), 암기 단계를 97.9% 감소시킴을 보인다. 이는 임베딩의 기하학적 권위를 유지하고 기울기 노이즈를 줄여 달성된다. 둘째, Sounding Hammer 진단 결과, 기울기 영역 푸리에 조…

최근 1년 38회 인용

Rigoni, Nathan·발표 2026.03· 327

원문 분석 보기

#시계열 분석 #나선형 시간 #머신러닝

나선형 시간: 시공간 재해석 및 머신러닝 응용

Spiral Time: A Geometric Reframing of Temporal Structure and Its Applications in Machine Learning

본 연구는 시간의 구조를 수직선상의 스칼라가 아닌 2D 공간의 아르키메데스 나선으로 재개념화하는 '나선형 시간(Spiral Time)' 프레임워크를 제안한다. 이 프레임워크에서 모든 순간은 누적 진행(추세)을 나타내는 반경 좌표와 반복 주기(계절성) 내의 위상을 나타내는 각도 좌표를 가진다. 이러한 기하학적 분해는 시간 좌표 자체의 고유한 속성이며, 대상 변수의 학습되거나 분석적인 변환이 아니다. 수학적 구조를 도출하고, 미국 월간 소매 판매 데이터(RSXFS)에 대한 10가지 LSTM 제거 실험을 통해 성능을 입증했다. 또한, …

최근 1년 28회 인용

Ajieh, Frank·발표 2026.06· 178

원문 분석 보기

#함수언어논리 #경쟁적전문가혼합 #역설없는추론

추상 함수 언어 논리: 역설 없는 추론

Abstract Functional Language Logic: A Competitive Mixture of Experts Architecture for Paradox-Free Reasoning and Adaptive Intelligence

현재 대규모 언어 모델(LLM)은 확률 기반의 다음 토큰 예측에 의존하여 언어 유창성은 뛰어나지만, 엄격한 논리적 추론에서는 의미론적 환각, 언어적 역설, 높은 계산 지연 등의 문제에 직면합니다. 본 논문은 이러한 확률적 텍스트 기반 추론 방식에서 벗어나, 함수 언어 논리(FLL) 기반의 경쟁적 전문가 혼합(CMoE) 프레임워크를 제안합니다. CMoE 아키텍처는 거대하고 불투명한 언어 트랜스포머로부터 '사고' 과정을 수학적 함수 근사기(선형, 포물선, 타원 프리미티브)로 구축된 효율적인 전용 인지 엔진으로 오프로드합니다. 논리를 연…

최근 1년 90회 인용

Ivan, Bussalayev·발표 2025.11· 581

원문 분석 보기

#보편적 캐스케이드 법칙 #프랙탈 기하학 #비선형 동역학

비선형 시스템의 보편적 기하학적 조직화 법칙

The Universal Cascade Law: A Universal Law of Geometric Organization in Nonlinear Systems

19세기 후반 복잡성 수학은 비선형 시스템을 기하학적 구조에 따라 분류하고자 했으나, 지난 40년간 단일 방정식군에 집중하며 다차원 비선형 결합 시스템 분류는 미완으로 남았습니다. 본 연구는 MESA 방법론을 통해 이 초기 목표를 복원하고, 일반 상대론, 입자 물리학, 유체 역학 등 6개 과학 분야의 19개 방정식 시스템에 적용하여 단 한 건의 반례도 없이 성공적으로 검증했습니다. 특히, 유럽우주국 가이아 DR3 항성 목록의 5,000개 별에 대한 Feigenbaum 서브하모닉 분석을 통해 p = 1.20 x 10^-54 수준에서…

최근 1년 55회 인용

Lucian Randolph·발표 2026.02· 58

원문 분석 보기

#대규모 언어 모델 #LLM #환각 공격

임상 LLM의 적대적 환각 취약성 분석

Multi-model assurance analysis showing large language models are highly vulnerable to adversarial hallucination attacks during clinical decision support

대규모 언어 모델(LLM)은 임상 환경에서 유용성이 기대되지만, 허위 정보를 생성하는 환각 현상이 문제로 지적됩니다. 특히, 프롬프트에 조작된 세부 정보를 삽입하여 모델이 거짓 정보를 생성하거나 정교화하도록 유도하는 적대적 공격으로 인한 환각은 심각한 위험을 초래할 수 있습니다. 본 연구는 이러한 적대적 환각 공격에 대한 LLM의 취약성을 다중 모델 분석을 통해 평가했습니다. 연구팀은 300개의 의사 검증 시뮬레이션 임상 시나리오를 개발했으며, 각 시나리오에는 조작된 실험 결과, 신체/방사선 징후, 또는 의학적 상태와 같은 단일 …

최근 1년 100회 인용

Mahmud Omar, Vera Sorin 외·발표 2025.08· 101

원문 분석 보기

#법률 AI #다중 에이전트 #LLM

챗로: 법률 전문가 AI 비서

Chatlaw: A Multi-Agent Legal Assistant based on a Role-Aligned Mixture-of-Experts Architecture

인공지능은 법률 서비스 분야에서 큰 잠재력을 가지고 있지만, 기존 대규모 언어 모델(LLM)은 중국 법률 시스템에 대한 제한된 지식과 환각 현상에 취약하다는 문제에 직면해 있습니다. 본 연구는 이러한 한계를 극복하기 위해 다중 에이전트 법률 비서인 Chatlaw를 제안합니다. Chatlaw는 실제 법률 사무소의 표준 운영 절차(SOP)를 모방하여 설계되었습니다. 법률 보조원, 연구원, 선임 변호사 등 다양한 역할이 사건을 협력하여 처리하는 구조를 반영하기 위해, 우리는 새로운 역할 정렬 전문가 혼합(RA-MoE) 아키텍처를 개발했…

최근 1년 30회 인용

Jiaxi Cui, Munan Ning 외·발표 2026.05· 91

원문 분석 보기

#다중센서융합 #결정론적프레임워크 #잔차엔벨로프

계층적 잔차-엔벨로프 신뢰: 그룹 센서 융합

Hierarchical Residual-Envelope Trust: A Deterministic Framework for Grouped Multi-Sensor Fusion

이 연구는 구조화된 다중 센서 시스템을 위한 새로운 결정론적 프레임워크인 계층적 잔차-엔벨로프 신뢰(HRET)를 제시한다. HRET는 기존의 Drift-Slew Fusion Bootstrap(DSFB) 프레임워크를 확장하여 명시적인 센서 그룹화와 상관 교란 모델링을 통합한다. 기존의 확률론적 또는 공분산 기반 접근 방식과 달리, HRET는 결정론적 유계 교란 가정을 기반으로 하며, 채널 및 그룹 수준에서 잔차-엔벨로프 동역학을 통해 신뢰도를 조절한다. 각 센서 채널은 채널 수준의 신뢰도를 관리하는 잔차 엔벨로프를 유지하며, 그룹 …

최근 1년 57회 인용

Riaan de Beer·발표 2026.02· 57

원문 분석 보기

#컴퓨터 병리학 #파운데이션 모델 #멀티모달 학습

병리 분석을 위한 멀티모달 파운데이션 모델

A multimodal whole-slide foundation model for pathology

컴퓨터 병리학 분야는 자기 지도 학습을 통해 조직 병리 관심 영역(ROI)을 다재다능하고 전이 가능한 특징 표현으로 인코딩하는 파운데이션 모델의 발전으로 변화하고 있습니다. 그러나 이러한 발전이 환자 및 슬라이드 수준의 복잡한 임상 문제를 해결하는 데 적용되는 것은 질병별 코호트의 제한된 임상 데이터, 특히 희귀 질환에 대한 데이터 부족으로 인해 제약을 받습니다. 본 연구에서는 이러한 한계를 극복하기 위해 Transformer 기반의 병리 이미지 및 텍스트 정렬 네트워크(TITAN)를 제안합니다. TITAN은 335,645개의 전…

최근 1년 70회 인용

Tong Ding, Sophia J. Wagner 외·발표 2025.11· 70

원문 분석 보기

#에이전트 AI #생성형 AI #자율 시스템

에이전트 AI: 정의, 프레임워크, 도전과제

The Rise of Agentic AI: A Review of Definitions, Frameworks, Architectures, Applications, Evaluation Metrics, and Challenges

최근 등장한 에이전트 AI 시스템은 자율성, 적응성, 목표 지향적 추론에 중점을 두어 기존 AI, 생성형 AI, 자율 시스템을 넘어서는 중요한 접근 방식입니다. 본 연구는 에이전트 AI 시스템의 정의, 프레임워크, 아키텍처를 통합적으로 검토하고, 생성형 AI, 자율 컴퓨팅, 다중 에이전트 시스템과 같은 관련 분야와 비교하여 명확한 이해를 제공합니다. 이를 위해 현재 LLM 기반 및 비LLM 기반 에이전트 시스템에 대한 143개의 주요 연구를 분석하여 계획, 기억, 성찰, 목표 추구 지원 방식을 살펴보았습니다. 또한, 에이전트 AI…

최근 1년 88회 인용

Ajay Bandi, Bhavani Kongari 외·발표 2025.09· 89

원문 분석 보기

#결정론적 동역학 #항공우주 시스템 #상태 추정

대수적 결정론적 동역학: 비확률론적 시스템 모델링

Algebraic Deterministic Dynamics (ADD): A Non-Stochastic Structural Extension of DSFB

안전이 중요한 항공우주 시스템은 적대적 교란, 플라즈마 블랙아웃, 비가우시안 센서 손상 또는 구조적 체제 변화 시 성능이 저하되는 확률론적 상태 추정 및 통계 모델링 가정에 의존하는 경우가 많습니다. 본 연구는 이러한 한계를 극복하기 위해 확률론적 기본 요소를 대수적 성장 불변량, 도달 가능성 구조 및 필터링 기반 진단으로 대체하는 결정론적 구조 모델링 프레임워크인 대수적 결정론적 동역학(ADD)을 소개합니다. ADD는 확률론적 가정이 없어도 엄격하게 양의 엔트로피 유사 성장, 구조적 상전이 및 교차 계층 임계 불변량이 결정론적 …

최근 1년 53회 인용

Riaan de Beer·발표 2026.03· 53

#AI 학습 도구 #고등 교육 #체계적 문헌 검토

고등 교육 AI 학습 도구 설계 및 평가

Design and assessment of AI-based learning tools in higher education: a systematic review

인공지능(AI) 기반 학습 도구는 개인 맞춤 학습, 실시간 피드백, 유연성 증대 등 고등 교육에 다양한 이점을 제공하며 빠르게 확산되고 있습니다. 그러나 이러한 도구의 효과적인 설계 및 구현 전략은 아직 명확히 정립되지 않은 실정입니다. 본 연구는 이 격차를 해소하고자 체계적인 문헌 검토를 수행했습니다. 2014년 1월부터 2024년 4월까지 발표된 동료 심사 논문 63편을 분석하여, AI 기반 학습 도구의 설계 특징(알고리즘 유형, 훈련 데이터셋, 정보 제시 방식, 학습 과정 내 역할)을 요약하고, 대학생의 인지적, 기술 기반,…

최근 1년 72회 인용

Jihao Luo, Chenxu Zheng 외·발표 2025.07· 72

원문 분석 보기

#양자 컴퓨팅 #불모지대 #양자 변분 알고리즘

불모지대 회피가 고전적 시뮬레이션 가능성을 의미하는가?

Does provable absence of barren plateaus imply classical simulability?

최근 양자 변분 알고리즘의 성능을 저해하는 불모지대(barren plateau) 현상에 대한 이해가 활발히 진행되고 있습니다. 본 연구는 불모지대를 피할 수 있는 구조가 손실 함수의 고전적 시뮬레이션 가능성으로 이어지는지에 대한 중요한 질문을 던집니다. 저자들은 불모지대를 회피하는 것으로 알려진 많은 양자 모델들이 초기 데이터 수집 단계에서 양자 장치로부터 일부 고전적 데이터를 얻을 수 있다면 고전적으로 시뮬레이션될 수 있다는 증거를 제시합니다. 이는 불모지대가 차원의 저주에서 비롯되며, 이를 해결하려는 현재 접근 방식들이 문제를…

최근 1년 66회 인용

M. Cerezo, Martín Larocca 외·발표 2025.08· 66

원문 분석 보기

#소형 객체 탐지 #컴퓨터 비전 #딥러닝

소형 객체 탐지: 도전과 기술 동향

Small object detection: A comprehensive survey on challenges, techniques and real-world applications

소형 객체 탐지(SOD)는 컴퓨터 비전 분야에서 감시, 자율 시스템, 의료 영상, 원격 탐사 등 다양한 응용 분야에 필수적이지만, 해결하기 어려운 과제입니다. 소형 객체는 해상도가 낮고 공간 및 문맥 정보가 제한적이며, 가려짐, 배경 간섭, 클래스 불균형 등의 문제로 인해 정확한 탐지가 어렵습니다. 이 조사는 2024-2025년 Q1 저널에 발표된 딥러닝 기반 SOD 관련 최신 연구들을 종합적으로 검토합니다. 주요 도전 과제, 최신 기술, 데이터셋, 평가 지표 및 실제 적용 사례를 분석했습니다. 특히 다중 스케일 특징 추출, 초해…

최근 1년 75회 인용

Mahya Nikouei, Bita Baroutian 외·발표 2025.07· 75

원문 분석 보기

#설명가능인공지능 #의료영상 #딥러닝

의료 영상 딥러닝 XAI 종합 분석

Explainable artificial intelligence for medical imaging systems using deep learning: a comprehensive review

2016년 디지털 혁명 이후 인공지능(AI)은 다양한 분야에서 급성장했지만, AI의 '블랙박스' 특성은 특히 의료와 같은 중요 분야에서 심각한 우려를 낳고 있습니다. AI 시스템이 결정을 내리면서도 그 이유를 설명하지 못하는 점은 생명을 위협할 수 있는 의료 분야에서 치명적인 문제를 야기하며, 이는 생물의학 정보학 및 컴퓨팅 분야에서 활발히 논의되는 주제입니다. 이러한 문제를 해결하기 위해 설명 가능한 인공지능(XAI) 분야가 등장했습니다. XAI는 딥러닝(DL)과 같은 기존 AI 방식과 달리, 인간이 이해할 수 있는 방식으로 의…

최근 1년 66회 인용

Essam H. Houssein, Amr Gamal Fouad 외·발표 2025.07· 66

원문 분석 보기

#AIGC #검색 증강 생성 #RAG

AIGC를 위한 검색 증강 생성: 서베이

Retrieval-Augmented Generation for AI-Generated Content: A Survey

인공지능 생성 콘텐츠(AIGC)는 모델 알고리즘 발전, 대규모 기반 모델 성장, 고품질 데이터셋 접근성 향상에 힘입어 빠르게 발전했습니다. 하지만 AIGC는 지식 업데이트, 롱테일 데이터 처리, 데이터 유출 완화, 높은 훈련 및 추론 비용 관리 등 여러 난관에 직면해 있습니다. 이러한 문제 해결을 위해 최근 검색 증강 생성(RAG) 패러다임이 부상했습니다. RAG는 정보 검색 과정을 도입하여 관련성 높은 객체를 데이터 저장소에서 검색함으로써 생성 정확도와 견고성을 향상시킵니다. 본 서베이 논문은 AIGC 시나리오에 RAG 기술을 통…

최근 1년 54회 인용

Penghao Zhao, Hailin Zhang 외·발표 2026.01· 54

원문 분석 보기

#상태추정 #잔차보정 #컴퓨터과학

드리프트-슬루 융합 부트스트랩: 결정론적 잔차 기반 상태 보정

Drift--Slew Fusion Bootstrap: A Deterministic Residual-Based State Correction Framework

본 문서는 Drift-Slew Fusion Bootstrap (DSFB) 저장소 및 관련 참조 구현을 위한 아키텍처 사양과 운영 프레임워크를 정의한다. 이 작업은 슬루 인지 신뢰 적응형 상태 추정 및 상태 재구성의 신뢰 적응형 다중 진단 가중치에 대한 이전 연구에서 소개된 기초 이론적 구성 요소를 전제로 한다. 이 프레임워크는 결정론적 교란 가정, 드리프트 및 슬루 구성 요소로의 정규 잔차 분해, 그리고 참조 코드베이스에 인코딩된 부트스트랩 보정 업데이트 구조를 공식화한다. 이는 인과 분리 연산자, 잔차 엔벨로프, 업데이트 의미론…

최근 1년 61회 인용

Riaan de Beer·발표 2026.02· 61

원문 분석 보기

#교란 모델링 #잔여 엔벨로프 #융합 시스템

잔여-엔벨로프 융합 시스템 교란 모델링

Deterministic Disturbance Modeling Framework for Residual-Envelope Fusion Systems

이 논문은 잔여-엔벨로프 융합 시스템(예: DSFB, HRET)을 위한 결정론적 교란 모델링 프레임워크(DDMF)를 제시한다. 확률론적 가정을 배제하고 이산 시간 신호 클래스로 교란을 정의하며, 점별 유계, 드리프트형, 슬루율 유계, 충격성, 그룹 상관 구조로 엄격하게 분류한다. 엔벨로프 허용성은 잔여-엔벨로프 재귀의 유계성을 통해 정량화되며, 교란이 유계 응답, 지속적 억제, 또는 신뢰 가중치의 지수적 회복을 유도하는 명시적 조건을 제공한다. 이 프레임워크는 허용 가능한 교란과 허용 불가능한 교란 영역을 구분한다. 본 연구는 …

최근 1년 55회 인용

Riaan de Beer·발표 2026.02· 55

#인공지능 교육 #AI 교육 #교육 기술

교육 AI의 동향, 이점 및 과제 체계적 고찰

Systematic Review of Artificial Intelligence in Education: Trends, Benefits, and Challenges

인공지능(AI)은 교육 방식에 혁신을 가져올 잠재력으로 기대를 모으는 동시에 우려를 낳고 있습니다. 본 연구는 AI의 교육 통합에 대한 논의에 기여하고자, 최신 연구 동향(출판 연도, 연구 국가, 학술지, 교육 수준, 교육 분야, AI 유형)과 AI 활용의 이점 및 과제를 체계적으로 분석했습니다. 2015년부터 2025년 사이에 발표된 155편의 동료 심사 논문을 분석 대상으로 삼았습니다. 특히 챗GPT와 같은 생성형 AI 도구의 영향으로 2022년 이후 연구 활동이 크게 증가했음을 확인했습니다. 연구 결과, AI는 학습 성과 …

최근 1년 110회 인용

Juan Garzón, Eddy Patiño 외·발표 2025.08· 110

원문 분석 보기

#블렌디드러닝 #하이브리드학습 #농촌교육

농촌 교육기관의 블렌디드 러닝 구현 전략

Estrategias para la Implementación Efectiva del Aprendizaje Híbrido (Blended Learning) en Instituciones Educativas Rurales del Ecuador: Un Análisis Integral

본 연구는 에콰도르 농촌 교육기관에서 블렌디드 러닝(하이브리드 학습)을 효과적으로 구현하기 위한 전략을 분석한다. 디지털 사회의 요구에 부응하고 기관의 회복탄력성을 강화하며 블렌디드 러닝의 이점을 극대화하는 것을 목표로 한다. 2019년부터 2024년 사이에 발표된 12개 연구를 분석하는 질적 문헌 연구 방법론을 적용했다. 진단 평가, 유연한 교육과정 설계, 교사의 기술 및 교육학적 역량 훈련, 능동적 학습 방법론 등 주요 구현 전략을 식별했다. 연구 결과, 디지털 역량 평가, 적절한 기술 자원, 참여형 방법론을 포함하는 견고한…

최근 1년 68회 인용

Pedro Luis Añapa Quiñónez, José Páez 외·발표 2025.07· 68

원문 분석 보기

#하이브리드교육 #고등교육 #교수법

하이브리드 고등교육 교수법 도전과제

Desafíos de la Educación Superior en Contextos Híbridos: Análisis de las Prácticas Docentes en la Universidad Estatal de Milagro durante el Periodo Académico 2025

이 연구는 2025학년도 밀라그로 주립대학교의 하이브리드 교육 환경에서 나타나는 고등교육의 주요 도전과제와 교수 관행을 분석합니다. 하이브리드 모델 도입으로 유연성과 접근성은 향상되었지만, 교수법 적응, 기술 도구 활용, 학습 평가 등에서 상당한 난관이 지속되고 있습니다. 교수와 학생 대상 설문조사, 반구조화된 인터뷰, 하이브리드 수업 참여 관찰을 포함하는 혼합 연구 방법론을 적용했습니다. 이를 통해 하이브리드 교육의 실제적 운영과 관련된 다양한 관점과 경험을 심층적으로 탐색했습니다. 연구 결과, 교사의 지속적인 역량 강화와 학…

최근 1년 77회 인용

Eduardo Stalyn Guadalupe Beltrán, Jeniffer Yadira Palomeque Zambrano 외·발표 2025.07· 77

원문 분석 보기

#스파이킹 신경망 #증분 학습 #파국적 망각

감성 스파이킹 신경망의 증분 학습

Maya-Manas: Oscillatory Thalamo-Cortical Gating for Class-Incremental Learning in Affective Spiking Neural Networks

본 연구는 스파이킹 신경망(SNN)에서 클래스 증분 학습(Class-Incremental Learning)의 고질적인 문제인 파국적 망각(Catastrophic Forgetting)을 해결하기 위한 새로운 접근 방식인 Maya-Manas를 제안한다. 이 모델은 산스크리트어의 '마나스(Manas)' 개념에서 영감을 받아, 자극을 심층 처리하기 전에 걸러내는 감각 수용 및 진동하는 마음의 기능을 모방한다. Maya-Manas는 시상-피질의 주의 게이팅 메커니즘을 도입하며, 이는 누설성 통합-점화(leaky integrate-and-f…

최근 1년 65회 인용

Venkatesh Swaminathan·발표 2026.05· 65

원문 분석 보기

#NISQ #초전도 큐비트 #Floquet 엔지니어링

비선형 붕괴 동역학 제어 및 큐비트 복구

Engineering Non-Linear Decay Dynamics: Pulse-Level Control and Software-Defined Qubit Rescue on Superconducting Processors

현재 NISQ(Noisy Intermediate-Scale Quantum) 장치의 확장성은 초전도 큐비트의 공명 디코히어런스를 유발하는 재료 결함, 특히 2준위 시스템(TLS)에 의해 제한된다. 본 연구는 IBM Quantum ibm_fez 프로세서를 활용하여 "소프트웨어 정의 하드웨어" 최적화를 시연하고, "명령어 수준 보정 주입" 기법을 통해 컴파일러 제약을 우회하여 연속적인 비공명 AC 스타크 구동을 적용했다. 방법론으로 Floquet 엔지니어링 접근 방식을 사용하여 펄스 수준 해밀토니안 엔지니어링을 수행했다. 맞춤형 명령어…

최근 1년 309회 인용

K S, Unnikuttan·발표 2025.12· 773

원문 분석 보기

#신경 형태 시스템 #행동 이상 탐지 #AI 안전

Danger-OS: 신경 위험 이론 기반 이상 탐지

Danger-OS: Spiking Neural Danger Theory — Affective Neuromodulatory Arbitration for Real-Time Behavioural Anomaly Detection

Danger-OS는 기존의 하드코딩된 의사결정 로직을 생체에서 영감을 받은 네 가지 스파이킹 뉴런(Bhaya, Vairagya, Shraddha, Spanda)으로 대체한 신경 형태 행동 이상 탐지 시스템입니다. 이 뉴런들의 정서적 전압 역학은 500ms 주기로 운영체제가 실시간 위협 신호에 반응하는 방식을 지속적으로 제어합니다. 서명 매칭이나 정적 규칙 적용 대신, 유휴 모니터링부터 프로세스 종료에 이르는 모든 행동 클래스는 이러한 신경 조절 상태의 상호작용을 통해 유기적으로 발생하며, 모든 OS 수준 개입은 기본적으로 명시적인 …

최근 1년 64회 인용

Venkatesh Swaminathan·발표 2026.05· 64

원문 분석 보기

#시계열 예측 #거대 언어 모델 #멀티모달

거대 언어 모델 재프로그래밍 시계열 예측

TimeLLM: Time Series Forecasting by Reprogramming Large Language Models

시계열 예측은 다양한 동적 시스템에 필수적이며, 활발히 연구되는 분야입니다. 그러나 대부분의 기존 예측 모델은 단일 시계열 데이터 양식에 특화되어 있어, 자연어 처리나 컴퓨터 비전 분야와 달리 범용적인 대규모 모델 개발이 더디게 진행되었습니다. 이는 고품질의 대규모 시계열 코퍼스가 부족하기 때문입니다. 한편, 최근 연구들은 거대 언어 모델(LLM)이 긴 토큰 시퀀스를 이해하고 추론하는 데 탁월한 능력을 보임을 시사합니다. 이러한 LLM의 역량을 시계열 예측에 활용하기 위해, 본 연구는 숫자 시계열 신호와 언어 토큰을 연결하는 체계…

최근 1년 87회 인용

Ming Jin, Shiyu Wang 외·발표 2026.05· 132

원문 분석 보기

#대규모 추론 모델 #LLM #추론 능력

사고의 환상: 대규모 추론 모델의 한계

The Illusion of Thinking

최근 대규모 언어 모델(LLM)은 답변 도출 전 상세한 사고 과정을 생성하는 대규모 추론 모델(LRM)을 도입하며 추론 벤치마크에서 성능 향상을 보였습니다. 그러나 이러한 모델의 근본적인 능력, 스케일링 특성, 그리고 한계는 아직 충분히 이해되지 않고 있습니다. 기존 평가는 주로 최종 답변의 정확성에 초점을 맞추며 데이터 오염 문제와 추론 과정의 구조 및 품질에 대한 통찰력 부족이라는 한계를 가집니다. 본 연구는 이러한 간극을 체계적으로 탐구하기 위해 제어 가능한 퍼즐 환경을 활용했습니다. 이 환경은 일관된 논리 구조를 유지하면서…

최근 1년 119회 인용

Parshin Shojaee, Iman Mirzadeh 외·발표 2025.09· 119

원문 분석 보기

#지속 학습 #스파이킹 신경망 #평가 지표

지속 학습 평가 라이브러리: SNN 에너지 효율성 확장

cl-metrics: A Stateless Python Library for Continual Learning Evaluation with SNN Energy-Aware Extensions

cl-metrics는 지속 학습(Continual Learning) 모델의 표준 평가 지표(평균 정확도, 역전이, 순전이 등)를 계산하는 파이썬 라이브러리입니다. 이 라이브러리는 N×N 태스크별 정확도 행렬만으로 작동하며, 특정 훈련 프레임워크에 의존하지 않아 논문 간 결과 비교를 어렵게 하는 평가 공식의 미묘한 불일치를 해소합니다. 특히, cl-metrics는 스파이킹 신경망(SNN)의 지속 학습을 위한 최초의 표준화된 평가 도구를 제공합니다. 이는 스파이크 발화율에 기반한 네 가지 에너지 효율성 지표를 포함하여, 정확도만으로는…

최근 1년 65회 인용

Venkatesh Swaminathan·발표 2026.05· 65

원문 분석 보기

#AI 에이전트 #에이전틱 AI #생성형 AI

AI 에이전트와 에이전틱 AI: 개념 분류 및 활용

AI Agents vs. Agentic AI: A Conceptual taxonomy, applications and challenges

생성형 AI 시대의 정보 융합은 AI 에이전트와 에이전틱 AI를 명확히 구분해야 할 필요가 있습니다. 본 연구는 이 두 개념의 설계 철학과 역량 차이를 규명하기 위해 구조화된 개념 분류 체계, 응용 분야 매핑, 그리고 기회와 도전 과제 분석을 제시합니다. 특히, AI 에이전트는 LLM과 LIM을 기반으로 특정 작업을 자동화하는 모듈형 시스템으로 정의하며, 생성형 AI를 그 기반으로 봅니다. 연구는 검색 전략과 기본 정의를 시작으로, AI 에이전트가 도구 통합, 프롬프트 엔지니어링, 추론 강화를 통해 발전함을 설명합니다. 반면, 에…

최근 1년 117회 인용

Ranjan Sapkota, Konstantinos I. Roumeliotis 외·발표 2025.08· 117

원문 분석 보기

#스파이킹 신경망 #지속 학습 #인공지능 망각

신경망 지속 학습을 위한 마야-CL

Maya-CL: Nociceptive Metaplasticity and Vairagya-Governed Heterosynaptic Decay for Continual Learning in Spiking Neural Networks

인공지능 분야의 오랜 난제인 기존 학습 내용 망각 없이 새로운 작업을 지속적으로 학습하는 문제를 해결하기 위해, Maya-CL은 통증 기반 가소성 및 아드바이타 베단타 철학의 비집착(Vairagya) 개념에서 파생된 생물학적 원리를 활용한 스파이킹 신경망(SNN) 지속 학습 시스템입니다. 이 시스템은 고정 가중치 합성곱 아키텍처를 기반으로 하며, 재생 메모리나 작업 식별 신호 없이 5가지 시각 분류 작업을 순차적으로 학습합니다. Maya-CL은 베단타의 비집착(Vairagya) 개념을 경사 마스킹 메커니즘으로 구현하여, 중요한 시…

최근 1년 65회 인용

Swaminathan, Venkatesh·발표 2026.05· 65

원문 분석 보기

#AI 에이전트 #에이전트형 AI #개념 분류

AI 에이전트와 에이전트형 AI: 개념 분류 및 과제

AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges

본 연구는 AI 에이전트와 에이전트형 AI 간의 차이를 명확히 하고, 이들의 상이한 설계 철학 및 역량을 규명하기 위해 개념적 분류 체계, 응용 분야 매핑, 그리고 기회 및 과제 분석을 제시한다. AI 에이전트는 LLM 및 LIM에 의해 구동되는 모듈형 시스템으로, 특정 작업을 자동화하는 데 중점을 둔다. 이는 도구 통합, 프롬프트 엔지니어링, 추론 강화를 통해 발전한다. 반면, 에이전트형 AI 시스템은 다중 에이전트 협업, 동적 작업 분해, 영구 메모리, 그리고 조정된 자율성을 특징으로 하는 패러다임 전환을 나타낸다. 본 연구는…

최근 1년 127회 인용

Ranjan Sapkota, Konstantinos I. Roumeliotis 외·발표 2025.07· 128

원문 분석 보기

#ChatGPT #LLM #챗봇

ChatGPT 활용 양상 분석

How People Use ChatGPT

대규모 언어 모델(LLM) 챗봇의 급속한 확산에도 불구하고, 실제 사용 방식에 대한 이해는 부족한 실정이다. 본 연구는 2022년 11월 출시부터 2025년 7월까지 ChatGPT 소비자 제품의 성장과 활용 패턴을 분석한다. 이 기간 동안 ChatGPT는 전 세계 성인 인구의 약 10%가 사용하게 되었다. 초기 사용자층은 남성 편향적이었으나 성별 격차는 크게 줄었으며, 저소득 국가에서 더 높은 성장률을 보였다. 본 연구는 개인 정보 보호를 준수하는 자동화된 파이프라인을 활용하여 대표적인 ChatGPT 대화 샘플 내 사용 패턴을 분…

최근 1년 131회 인용

Aaron Chatterji, Thomas Cunningham 외·발표 2025.09· 131

원문 분석 보기

#AI 검색 #메타데이터 #엔티티 검색

AI 검색을 위한 메타데이터 패킷

Metadata Packet for AI Indexing: A Formal Specification for Entity-Level Retrieval Architecture

본 기술 사양(EA-META-01)은 AI 검색 시스템에서 엔티티를 효과적으로 표현하기 위한 7가지 구성 요소를 포함하는 방법론을 정의한다. 기존 메타데이터 표준인 Dublin Core, schema.org, METS/MODS와 차별화되는 이 접근 방식은 엔티티 수준의 정보 검색 아키텍처를 목표로 한다. 제안된 7가지 구성 요소는 엔티티 정의(JSON-LD), 모호성 제거 매트릭스, 키워드 블록, 부정 태그, 의미론적 무결성 마커, DOI 참조 목록, 그리고 증거 멤브레인이다. 각 요소는 AI 시스템이 엔티티를 정확하게 식별하고 …

최근 1년 53회 인용

Rex Fraction, Lee Sharks·발표 2026.04· 53

원문 분석 보기

#유한 구별 시스템 #경계 유지 #컴퓨터 과학

유한 용량 경계 유지 시스템

Active Finite Distinction Systems: A Formal Core for Boundary Maintenance under Finite Capacity

이 연구는 유한 용량 시스템이 표현, 에너지, 시간 제약 하에서 상태 의존적 업데이트를 통해 운영 경계를 유지하는 방식인 능동 유한 구별 시스템(FDS)을 정의한다. 광범위한 구별 이론(Distinction Theory)의 주장 공간 아카이브에서 FDS의 형식적 핵심을 추출하여, 이를 제한된 수학적 프레임워크로 제시한다. 중심 객체는 내부 상태, 환경, 경계, 기억, 관찰, 행동, 업데이트, 유한 투영, 경계 유지 손실, 자원 예산, 교란/가지치기, 업데이트 시간 척도를 나타내는 12가지 구성 요소의 FDS 튜플 S로 구성된다. …

최근 1년 65회 인용

Yining Wu·발표 2026.05· 65

원문 분석 보기

#LLM #대규모언어모델 #시스템신뢰성

어포던스 컴파일 지능: LLM 시스템 신뢰성 향상

Affordance-Compiled Intelligence: Observable-Only Cognitive Impedance Matching for No-Meta LLM-Integrated Systems

본 연구는 대규모 언어 모델(LLM) 통합 시스템의 신뢰성을 높이기 위한 새로운 이론인 인지 임피던스 매칭 이론(CIMT)을 제안한다. CIMT는 관측 가능 요소만을 활용하며, 모델 가중치 개선이 아닌 시스템 주변 환경 재설계를 통해 고정된 모델 정책의 운영 능력을 향상시키는 데 초점을 맞춘다. 이는 시스템 수준의 역량 증폭을 '세계 측 컴파일 문제'로 접근한다. CIMT는 관측, 유형화된 액션 핸들, 검증자, 복구 경로, 롤백 모드, 권한 범위, 컨텍스트 요약, 감사 가능한 영수증 등 다양한 요소를 통해 시스템 환경을 재구성한다…

최근 1년 1,389회 인용

Patrick Lewis, Ethan Perez 외·발표 2026.03· 3,008

원문 분석 보기

#트랜스포머 #어텐션 메커니즘 #자연어 처리

어텐션 메커니즘만으로 충분하다

Attention Is All You Need

기존의 지배적인 시퀀스 변환 모델들은 인코더-디코더 구조의 복잡한 순환 또는 컨볼루션 신경망을 기반으로 하며, 최신 모델들은 어텐션 메커니즘을 통해 인코더와 디코더를 연결했습니다. 본 연구는 순환 및 컨볼루션을 완전히 배제하고 오직 어텐션 메커니즘에만 기반한 새로운 신경망 아키텍처인 트랜스포머(Transformer)를 제안합니다. 두 가지 기계 번역 태스크에 대한 실험 결과, 트랜스포머 모델은 기존 모델들보다 우수한 번역 품질을 보였으며, 병렬화가 용이하여 훈련 시간이 현저히 단축되었습니다. 특히 WMT 2014 영어-독일어 번역…

최근 1년 110회 인용

Ashish Vaswani, Noam Shazeer 외·발표 2025.08· 6,578

원문 분석 보기

#대규모언어모델 #LLM #인공지능

대규모 언어 모델 연구 동향

A Survey of Large Language Models

대규모 언어 모델(LLM)의 급속한 발전은 인공지능 분야에 혁신적인 변화를 가져왔으며, 연구 패러다임과 실제 응용 분야를 재편하고 있습니다. 전례 없는 규모와 향상된 역량을 특징으로 하는 LLM은 그 개발, 동작 및 사회적 영향을 이해하기 위한 새로운 프레임워크를 요구합니다. 본 조사는 LLM 기술의 최근 발전을 네 가지 핵심 차원에서 체계적으로 검토합니다. 첫째, 대규모 자기 지도 학습, 아키텍처 혁신, 데이터 큐레이션 전략을 통해 모델의 핵심 역량을 확립하는 사전 학습 방법론을 다룹니다. 둘째, 지도 미세 조정 및 강화 학습을…

최근 1년 511회 인용

Wayne Xin Zhao, Kun Zhou 외·발표 2026.05· 1,411

원문 분석 보기

#BIFACE #문장 좌표 문서 #AI 참조

BIFACE 기반 문장 좌표 문서: AI+AGI 참조

Paper 1 - BIFACE-Based Sentence Coordinate Documents: Human-Readable Surfaces and AI+AGI-Referable Coordinates Across Documents, Code, Media, and Conversations

본 연구는 인간이 읽고 인지할 수 있는 결과물을 AI 및 AGI 시스템이 동시에 참조할 수 있도록 하는 비실행 구조 프레임워크인 BIFACE 기반 문장 좌표 문서(SCD)를 소개한다. SCD/BIFACE는 문서, 오피스 출력물, 코드, 이미지 영역, 비디오 장면, 자막, 음성, 대화, 검토 및 수정 지침 등 다양한 형태에서 인간이 읽을 수 있는 표면과 AI+AGI가 참조할 수 있는 좌표 레이어가 공존하는 참조 구조로 정의된다. 이 프레임워크는 SCD나 BIFACE를 저장, 실행, 승인, 동의, 판단, 법적 효력, 정산, 증거 확인…

최근 1년 52회 인용

The First Waters·발표 2026.05· 52

원문 분석 보기

#자기참조 시스템 #계산 가능성 #재귀 이론

자기참조 시스템의 수학적 기초

The Mathematical Foundations of Self-Referential Systems:From Computability to Transfinite Dynamics

이 연구는 자기참조 시스템에 대한 통합된 수학적 접근 방식을 제시하는 초기 단계의 모노그래프입니다. 계산 가능성과 논리부터 초한(transfinite) 및 장론적(field-theoretic) 구조에 이르기까지 폭넓은 영역을 다룹니다. 연구는 크게 두 부분으로 구성됩니다. 1부에서는 재귀적 표현 이론(Recursive Representation Theory, RRT)을 형식화하고, 2부에서는 자기참조 재규격화군(Self-Referential Renormalization Group, SRRG)을 소개합니다. 이는 자기참조 현상을 수…

최근 1년 292회 인용

Nova Spivack·발표 2025.09· 292

원문 분석 보기

#대규모 언어 모델 #강화 학습 #추론 능력

강화 학습 기반 LLM 추론 능력 강화

DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning

인공지능 분야에서 일반 추론 능력은 오랜 난제였습니다. 최근 대규모 언어 모델(LLM)과 CoT(Chain-of-Thought) 프롬프팅 기법의 발전으로 기본적인 추론 작업에서 상당한 성과를 보였지만, 이는 방대한 양의 인간 주석 데이터에 크게 의존하며 복잡한 문제 해결에는 여전히 한계가 있었습니다. 본 연구는 인간이 직접 레이블링한 추론 궤적 없이 순수한 강화 학습(RL)만으로 LLM의 추론 능력을 효과적으로 향상시킬 수 있음을 보여줍니다. 제안된 RL 프레임워크는 자기 성찰, 검증, 동적 전략 적응과 같은 고급 추론 패턴의 자…

최근 1년 590회 인용

Daya Guo, Dejian Yang 외·발표 2025.09· 591

원문 분석 보기

#그래프 기반 메모리 #에이전트 시스템 #비선형 동적 시스템

RhizoDB: 그래프 기반 메모리 시스템

RhizoDB: A Bounded Activation-Flow Architecture for Graph-Based Memory Systems

RhizoDB는 에이전트 시스템을 위한 그래프 기반 메모리 아키텍처로, 제한된 활성화 흐름, 안정성 변조 시간 감쇠, 깊이 제한 전파, 주기적 초기화, 구조적 가지치기 등의 원칙에 기반을 둡니다. 이 시스템은 반복적인 신호 구성에서 발생하는 안정화 문제를 해결하기 위해 설계되었습니다. 본 기술 보고서는 RhizoDB를 가변적인 방향성 그래프 상의 비선형 동적 시스템으로 공식화합니다. 이는 시스템의 내부 작동 방식을 수학적으로 명확히 정의하여, 복잡한 상호작용을 분석하고 예측할 수 있는 기반을 제공합니다. RhizoDB의 국소적 …

최근 1년 45회 인용

Jorge Augusto Guberte·발표 2026.06· 918

원문 분석 보기

#FASTQ 전처리 #품질 관리 #생물정보학 소프트웨어

fastp 1.0: FASTQ 데이터 품질 관리 및 전처리

fastp 1.0: An ultra‐fast all‐round tool for FASTQ data quality control and preprocessing

fastp는 강력한 기능과 탁월한 성능으로 가장 널리 사용되는 FASTQ 파일 전처리 도구 중 하나로 인정받고 있습니다. 본 논문에서는 fastp의 첫 번째 주요 업데이트인 fastp 1.0을 공식적으로 소개하며, 새로운 기능과 구현 원리를 상세히 설명합니다. fastp 1.0은 단순성, 효율성 및 다용성 측면에서 Trimmomatic 및 Cutadapt와 같은 다른 인기 있는 FASTQ 전처리 도구들과 비교하여 그 우수성을 입증합니다. 특히, 배치 처리 스크립트와 같은 모듈을 통해 FASTQ 파일을 효율적으로 처리하는 fastp…

최근 1년 138회 인용

Shifu Chen·발표 2025.09· 138

원문 분석 보기

전체 분야 보기