
총 17개
-
DQN과 A2C network를 활용한 CartPole 강화학습 훈련과정 및 code2025.01.131. CartPole environment OpenAI gym의 CartPole은 카트 위에 막대기가 고정되어 있고 막대기는 중력에 의해 바닥을 향해 자연적으로 기울게 되는 환경을 제공한다. CartPole의 목적은 카트를 좌, 우로 움직이며 막대기가 기울지 않고 서 있을 수 있도록 유지시켜 주는 것이 목적인데, 강화 학습 알고리즘을 이용하여 막대기를 세울 수 있는 방법을 소프트웨어 에이전트가 스스로 학습할 수 있도록 한다. 2. DQN algorithm Deep Q-Network는 state-action value Q값을 Deep...2025.01.13
-
만성질환에 대한 적응적 치료 전략에서의 강화학습2025.05.111. 강화학습의 개념과 의의 강화학습은 환경과의 상호작용을 통해 최적의 의사 결정을 수행하는 방법을 학습하는 머신러닝 기법입니다. 강화학습은 만성질환 환자의 상태 변화에 적응하여 최적의 치료 전략을 개발하는데 활용됩니다. 2. 강화학습의 응용 분야 강화학습은 환자의 생체 반응과 약물 투여의 상호작용을 고려하여 최적의 약물 투여 전략을 탐색하고, 환자의 위험 요인과 생활 습관을 고려하여 개인 맞춤형 예방 전략을 개발합니다. 3. 강화학습의 장점 강화학습은 개별 환자의 특성과 응답에 따라 최적화된 치료 전략을 제시하며, 시뮬레이션을 통...2025.05.11
-
강화학습을 이용한 unslotted CSMA_CA backoff 학습법2025.04.251. IEEE 802.15.4 프로토콜 IEEE 802.15.4 프로토콜은 저전력 및 저속 WSN(Wireless Sensor Network)의 특성을 달성하기 위한 프로토콜입니다. MAC계층은 unslotted, slotted 두가지의 CSMA/CA알고리즘을 지원하며, 본 논문에서는 Unslotted CSMA/CA 알고리즘을 개선하고자 합니다. 2. Unslotted CSMA/CA 알고리즘 Unslotted CSMA/CA 알고리즘은 시간동기화 없이 패킷을 전송하지만, 주변 트래픽이 혼잡해질수록 패킷 충돌확률이 높아져 PDR이 급격...2025.04.25
-
머신러닝의 3가지 학습 방법: 지도학습, 비지도 학습, 강화학습2025.01.041. 지도학습 지도학습은 입력과 출력 간의 관계를 학습하는 방식으로, 정답과 사례를 연결시켜주는 방식으로 이루어집니다. 데이터 집합을 통해 입력과 출력 간의 함수관계를 기계가 배우게 되며, 이렇게 얻어진 함수를 모델이라고 합니다. 지도학습으로 만들 수 있는 대표적인 것은 패턴 분류와 회귀분석입니다. 2. 비지도 학습 비지도학습은 입력 데이터 세트에 레이블을 달아주지 않고, 기계가 데이터를 묶을 수 있는 특징을 스스로 찾아내게 합니다. 비지도 학습은 데이터 집합 속에서 숨겨진 패턴을 배우며, 군집화를 이용해 서로 유사한 데이터를 묶습...2025.01.04
-
모방학습 4단계 상세 설명 및 개인 경험 공유2025.01.291. 모방학습의 4단계 모방학습은 데이터 수집, 데이터 전처리, 정책 학습, 평가 및 개선의 4단계로 구성됩니다. 데이터 수집 단계에서는 전문가나 시범자의 작업을 기록하여 학습에 필요한 데이터를 확보합니다. 데이터 전처리 단계에서는 수집된 데이터를 정제하고 구조화하는 과정이 필요합니다. 정책 학습 단계에서는 전처리된 데이터를 바탕으로 모델이 최적의 행동 정책을 학습하게 됩니다. 마지막으로 평가 및 개선 단계에서는 학습된 모델의 성능을 평가하고, 필요에 따라 모델을 개선하는 과정이 이루어집니다. 2. 모방학습 적용 사례 및 경험 프로...2025.01.29
-
고전적 조건형성과 도구적 조건형성에 대한 이해2025.05.081. 고전적 조건형성 고전적 조건형성의 구성요소로는 무조건 자극(US), 무조건 반응(UR), 조건 자극(CS), 조건 반응(CR)이 있다. 고전적 조건형성의 과정은 1단계에서 개에게 종소리(CS)를 들려주고, 2단계에서 종소리(CS)를 울린 다음 먹기(US)를 준다. 이러한 과정을 수십차례 반복하면 3단계에서 종소리(CS)만 들려주고 먹이(US)를 주지 않아도 개가 침(UR)을 분비하는 조건 반응(CR)이 나타난다. 2. 도구적 조건형성 도구적 조건형성은 어떤 행동을 학습시키고자 할 때 그 행동이 나타났을 때 보상을 주는 것이다....2025.05.08
-
인공지능의 역사적 발전과 현재 동향2025.05.161. 인공지능 연구의 역사 인공지능 기술의 역사적 발전 과정을 살펴보며 현대에 이르기까지의 중요한 이정표와 혁신적인 발견들을 중점적으로 다룹니다. 앨런 튜링의 '컴퓨터와 지능' 논문에서 제시된 튜링 테스트는 인공지능 연구의 초기 방향을 제시했으며, 1950년대와 1960년대에는 인공지능의 기초적인 개념과 알고리즘이 개발되었습니다. 1980년대에는 신경망과 딥러닝 같은 현대 인공지능 기술의 기반이 형성되었고, 최근에는 인공지능 기술이 빠르게 발전하며 다양한 분야에서 혁신적인 변화를 가져오고 있습니다. 2. 인공지능 관련 연구 동향 딥...2025.05.16
-
유아교육론_1. 다음은 유아교사의 역할과 자질에 대한 내용입니다. 아래 문제를 잘 읽고 답안을 작성하시오. 2. 다양한 발달이론 중 한 가지를 선택하여 관련 내용을 간단하게 요약하고, 이와 관련되어 실생활에서 접목할 수 있는 사례를 2가지 이상 들어 설명하시오. (3)2025.01.251. 유아교사의 역할 지원자의 역할이 가장 중요하다고 생각한다. 유아교사가 유아들을 관찰하고 지원하는 것은 매우 중요하다. 창의성 향상과 문제해결 능력 개발을 위해 유아교사의 지원자 역할이 필수적이다. 2. 유아교사의 자질 유아교사에게 필요한 자질로는 성찰과 학습이 중요하다. 성찰을 통해 초심을 잃지 않고 올바른 지도와 훈육을 할 수 있으며, 지속적인 학습을 통해 유아들의 변화하는 요구에 맞는 안정적이고 일관적인 교육을 제공할 수 있다. 3. 반두라 사회학습이론 반두라 사회학습이론은 인간의 행동이 외적 자극에 의해 수동적으로 결정되...2025.01.25
-
MATLAB 머신러닝, 딥러닝, 강화학습 예제 실습하기2025.05.161. MATLAB MATLAB은 MathWorks사에서 개발한 공학용 소프트웨어로, 행렬을 기반으로 계산, 함수나 데이터를 그림으로 그리는 기능 및 프로그래밍을 통한 알고리즘 구현 등을 제공하며, 수치계산이 필요한 과학 및 공학 분야에서 다양하게 사용되는 프로그램이다. 2. 머신러닝 머신러닝은 인공지능의 하위 분야 중 하나로, 데이터를 기반으로 컴퓨터가 스스로 학습하고 예측하는 알고리즘을 연구하고 개발하는 기술 분야이다. 알고리즘의 유형에는 지도학습, 비지도학습(자율학습), 강화학습 이렇게 크게 세가지 정도가 있다. 3. 딥러닝 딥...2025.05.16
-
장애 영유아의 자폐 범주성 장애와 교수 방법2025.01.201. 자폐 범주성 장애의 판단 기준과 증상 자폐 범주성 장애는 사회적 의사소통 및 상호작용의 부족, 행동·관심·활동의 제한적이고 반복적인 패턴이 특징이다. 사회적 측면에서 전형적이지 않은 방식으로 부모에게 달라붙고 눈 맞춤이 어려우며, 다른 사람과의 관계 형성이 어렵다. 행동 측면에서는 변화에 대한 저항감이 크고 특정 무생물에 과도한 애착을 보이거나 반복적인 행동을 한다. 2. 자폐 범주성 장애의 교수 방법 자폐 범주성 장애 학생을 위한 교수 방법으로는 장애 특성을 고려한 개별화된 교육과정 운영, 시각적 접근과 강화 방법이 있다. ...2025.01.20