Notice
250x250
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 넘파이
- CodeEngn
- writeup
- html
- abex crackme
- 알고리즘
- 웹해킹
- php
- 보안
- 인공지능
- webhacking
- 리버싱
- 어셈블리어
- 리눅스
- sql injection
- 리액트
- webhacking.kr
- C언어
- 워게임
- 해킹
- 웹
- 리버싱 워게임
- 컴퓨터 구조
- 회귀 수식
- 리버싱 문제
- 머신러닝
- 백준
- MySQL
- 자바스크립트
- 백준 알고리즘
Archives
- Today
- Total
목록온라인 메타 학습 (1)
인공지능 개발일지
[RL] Offline Meta Reinforcement-Learning이란?
이번 포스트에서는 최신 AI 논문에서 자주 등장하는 Offline Meta-Reinforcement-Learning에 대해 정리해 보았다. 이 Offline Meta-RL을 이해하기 위해서는 Meta-Learning, Online-Offline Learning에 대해서 이해가 필요해서 이를 정리하고, 추가적으로 Offline Meta-RL과 함께 자주 언급되는 Online Self-Supervision에 대해서도 정리해 보았다. 1. Meta-Learning - Meta는 한 단계 더 위에 있는 것을 가리킬 때 사용한다. 예를 들어, meta-data는 데이터에 대한 정보이고, meta 인지는 스스로에 대해 인지하는 것을 뜻한다. 그래서, Meta-Learning은 학습하는 방법을 학습하는 것입니다. 즉..
카테고리 없음
2023. 7. 1. 21:49