해피캠퍼스 토픽위키

토픽위키

총 21개

연관순
조회순

- 연관순
- 조회순

DQN과 A2C network를 활용한 CartPole 강화학습 훈련과정 및 code

2025.01.13

1. CartPole environment OpenAI gym의 CartPole은 카트 위에 막대기가 고정되어 있고 막대기는 중력에 의해 바닥을 향해 자연적으로 기울게 되는 환경을 제공한다. CartPole의 목적은 카트를 좌, 우로 움직이며 막대기가 기울지 않고 서 있을 수 있도록 유지시켜 주는 것이 목적인데, 강화 학습 알고리즘을 이용하여 막대기를 세울 수 있는 방법을 소프트웨어 에이전트가 스스로 학습할 수 있도록 한다. 2. DQN algorithm Deep Q-Network는 state-action value Q값을 Deep...

2025.01.13
[인공지능의세계 A+] 기말고사 문제풀이 객관식 + 서술형 + 단답형 문제+해설

2025.05.10

1. 기계학습 기계학습은 인간의 학습능력을 기계나 컴퓨터에서 구현한 것으로, 지도학습과 비지도학습으로 구분할 수 있다. 지도학습은 학습 데이터의 정답이 주어지는 반면, 비지도학습은 정답이 주어지지 않는다. 신경망은 자동으로 가중치를 학습하는 기계학습 방식이다. 강화학습은 보상을 통해 최적의 행동을 학습하는 방식으로, 알파고가 자체 연습 대국을 통해 좋은 수를 학습하는 데 사용되었다. 2. 클러스터링 K-Means 클러스터링은 데이터를 K개의 클러스터로 분류하는 방법이다. K-Means 클러스터링의 단점은 k의 개수를 사전에 정해야 ...

2025.05.10
MATLAB 머신러닝, 딥러닝, 강화학습 예제 실습하기

2025.05.16

1. MATLAB MATLAB은 MathWorks사에서 개발한 공학용 소프트웨어로, 행렬을 기반으로 계산, 함수나 데이터를 그림으로 그리는 기능 및 프로그래밍을 통한 알고리즘 구현 등을 제공하며, 수치계산이 필요한 과학 및 공학 분야에서 다양하게 사용되는 프로그램이다. 2. 머신러닝 머신러닝은 인공지능의 하위 분야 중 하나로, 데이터를 기반으로 컴퓨터가 스스로 학습하고 예측하는 알고리즘을 연구하고 개발하는 기술 분야이다. 알고리즘의 유형에는 지도학습, 비지도학습(자율학습), 강화학습 이렇게 크게 세가지 정도가 있다. 3. 딥러닝 딥...

2025.05.16
장애 영유아의 자폐 범주성 장애와 교수 방법

2025.01.20

1. 자폐 범주성 장애의 판단 기준과 증상 자폐 범주성 장애는 사회적 의사소통 및 상호작용의 부족, 행동·관심·활동의 제한적이고 반복적인 패턴이 특징이다. 사회적 측면에서 전형적이지 않은 방식으로 부모에게 달라붙고 눈 맞춤이 어려우며, 다른 사람과의 관계 형성이 어렵다. 행동 측면에서는 변화에 대한 저항감이 크고 특정 무생물에 과도한 애착을 보이거나 반복적인 행동을 한다. 2. 자폐 범주성 장애의 교수 방법 자폐 범주성 장애 학생을 위한 교수 방법으로는 장애 특성을 고려한 개별화된 교육과정 운영, 시각적 접근과 강화 방법이 있다. ...

2025.01.20
고전적 조건형성과 도구적 조건형성에 대한 이해

2025.05.08

1. 고전적 조건형성 고전적 조건형성의 구성요소로는 무조건 자극(US), 무조건 반응(UR), 조건 자극(CS), 조건 반응(CR)이 있다. 고전적 조건형성의 과정은 1단계에서 개에게 종소리(CS)를 들려주고, 2단계에서 종소리(CS)를 울린 다음 먹기(US)를 준다. 이러한 과정을 수십차례 반복하면 3단계에서 종소리(CS)만 들려주고 먹이(US)를 주지 않아도 개가 침(UR)을 분비하는 조건 반응(CR)이 나타난다. 2. 도구적 조건형성 도구적 조건형성은 어떤 행동을 학습시키고자 할 때 그 행동이 나타났을 때 보상을 주는 것이다....

2025.05.08
강화학습을 이용한 unslotted CSMA_CA backoff 학습법

2025.04.25

1. IEEE 802.15.4 프로토콜 IEEE 802.15.4 프로토콜은 저전력 및 저속 WSN(Wireless Sensor Network)의 특성을 달성하기 위한 프로토콜입니다. MAC계층은 unslotted, slotted 두가지의 CSMA/CA알고리즘을 지원하며, 본 논문에서는 Unslotted CSMA/CA 알고리즘을 개선하고자 합니다. 2. Unslotted CSMA/CA 알고리즘 Unslotted CSMA/CA 알고리즘은 시간동기화 없이 패킷을 전송하지만, 주변 트래픽이 혼잡해질수록 패킷 충돌확률이 높아져 PDR이 급격...

2025.04.25
유아교육론_1. 다음은 유아교사의 역할과 자질에 대한 내용입니다. 아래 문제를 잘 읽고 답안을 작성하시오. 2. 다양한 발달이론 중 한 가지를 선택하여 관련 내용을 간단하게 요약하고, 이와 관련되어 실생활에서 접목할 수 있는 사례를 2가지 이상 들어 설명하시오. (3)

2025.01.25

1. 유아교사의 역할 지원자의 역할이 가장 중요하다고 생각한다. 유아교사가 유아들을 관찰하고 지원하는 것은 매우 중요하다. 창의성 향상과 문제해결 능력 개발을 위해 유아교사의 지원자 역할이 필수적이다. 2. 유아교사의 자질 유아교사에게 필요한 자질로는 성찰과 학습이 중요하다. 성찰을 통해 초심을 잃지 않고 올바른 지도와 훈육을 할 수 있으며, 지속적인 학습을 통해 유아들의 변화하는 요구에 맞는 안정적이고 일관적인 교육을 제공할 수 있다. 3. 반두라 사회학습이론 반두라 사회학습이론은 인간의 행동이 외적 자극에 의해 수동적으로 결정되...

2025.01.25
슈퍼 마리오 - 인공지능은 어떻게 게임을 할까?

2025.05.08

1. 데이터 기반 학습 인공지능은 슈퍼 마리오 게임 플레이 데이터를 사용하여 게임의 규칙과 패턴을 학습합니다. 이를 통해 어떤 상황에서 점프를 해야 하는지, 어떤 적과의 접촉을 피해야 하는지 등을 학습하게 됩니다. 2. 강화 학습 인공지능은 게임 플레이를 통해 보상과 벌점을 받고, 이를 통해 자동으로 학습하게 됩니다. 예를 들어 도착 지점에 도달하면 보상을 받고, 적에게 맞으면 벌점을 받는 식으로 학습하면서 게임을 플레이합니다. 3. 신경망과 패턴 인식 인공지능은 신경망 모델을 사용하여 게임 화면의 정보를 분석하고, 적의 위치, 장...

2025.05.08
머신러닝의 3가지 학습 방법: 지도학습, 비지도 학습, 강화학습

2025.01.04

1. 지도학습 지도학습은 입력과 출력 간의 관계를 학습하는 방식으로, 정답과 사례를 연결시켜주는 방식으로 이루어집니다. 데이터 집합을 통해 입력과 출력 간의 함수관계를 기계가 배우게 되며, 이렇게 얻어진 함수를 모델이라고 합니다. 지도학습으로 만들 수 있는 대표적인 것은 패턴 분류와 회귀분석입니다. 2. 비지도 학습 비지도학습은 입력 데이터 세트에 레이블을 달아주지 않고, 기계가 데이터를 묶을 수 있는 특징을 스스로 찾아내게 합니다. 비지도 학습은 데이터 집합 속에서 숨겨진 패턴을 배우며, 군집화를 이용해 서로 유사한 데이터를 묶습...

2025.01.04
교육심리학) 조작적 조건형성의 특징과 인간관, 그리고 응용방법을 서술하시오(A+리포트)

2025.05.13

1. 조작적 조건형성의 특징 조작적 조건형성은 교육심리학에서 중요한 개념으로서, 개인의 행동을 형성하고 조절하는 과정을 설명하는 모델이다. 조작적 조건형성의 주요 특징은 조작적 자극의 역할, 강화와 효과, 행동의 조작성, 예측성과 제어성 등이다. 이를 통해 개인의 학습과 행동을 이해하고 개선할 수 있다. 2. 조작적 조건형성의 인간관 조작적 조건형성은 인간의 본성적 욕구와 목표지향성, 학습과 적응 능력, 자기효능감과 성취감, 예측과 제어 능력 등 인간관과 깊은 연관성을 갖는다. 이러한 인간의 특성들이 조작적 조건형성의 원리와 상호작...

2025.05.13

1 / 3