Notice
250x250
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
Tags
- CodeEngn
- 자바스크립트
- 백준
- 워게임
- 리버싱 문제
- 머신러닝
- 리버싱 워게임
- 인공지능
- 리버싱
- webhacking
- 웹
- 웹해킹
- abex crackme
- C언어
- MySQL
- webhacking.kr
- php
- 해킹
- 컴퓨터 구조
- 알고리즘
- 어셈블리어
- 리눅스
- writeup
- sql injection
- 리액트
- 넘파이
- 백준 알고리즘
- 보안
- 회귀 수식
- html
Archives
- Today
- Total
목록online learning (1)
로보틱스 연구일지
이번 포스트에서는 최신 AI 논문에서 자주 등장하는 Offline Meta-Reinforcement-Learning에 대해 정리해 보았다. 이 Offline Meta-RL을 이해하기 위해서는 Meta-Learning, Online-Offline Learning에 대해서 이해가 필요해서 이를 정리하고, 추가적으로 Offline Meta-RL과 함께 자주 언급되는 Online Self-Supervision에 대해서도 정리해 보았다. 1. Meta-Learning - Meta는 한 단계 더 위에 있는 것을 가리킬 때 사용한다. 예를 들어, meta-data는 데이터에 대한 정보이고, meta 인지는 스스로에 대해 인지하는 것을 뜻한다. 그래서, Meta-Learning은 학습하는 방법을 학습하는 것입니다. 즉..
카테고리 없음
2023. 7. 1. 21:49