Notice
250x250
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 인공지능
- 리버싱
- writeup
- html
- 넘파이
- 회귀 수식
- sql injection
- 리눅스
- 백준
- webhacking
- C언어
- 자바스크립트
- 웹
- webhacking.kr
- 어셈블리어
- abex crackme
- 리액트
- 리버싱 워게임
- 백준 알고리즘
- php
- 워게임
- 보안
- MySQL
- 알고리즘
- 해킹
- 리버싱 문제
- 웹해킹
- 머신러닝
- 컴퓨터 구조
- CodeEngn
Archives
- Today
- Total
목록분산처리 (1)
인공지능 개발일지
Apache Spark와 Hadoop의 용도 및 차이점
안녕하세요. 이번 시간에는 스파크와 하둡의 차이에 대해 알아봅시다. 요즘 드는 생각이 머신러닝이 이런 거고 딥러닝이 이런 것이란 건 알겠는데 이게 실제 서비스단에서 배포가 되고 사용될 때는 파이프라인이 어떤 방식으로 구축되고 실시간으로 들어온 데이터는 구체적으로 어떻게 처리가 되지 하는 의문점이 있었다. 이에 찾아보니 분산처리를 이용해 실시간 데이터를 처리하는 프레임워크가 크게 Apache Spark와 Hadoop이 있었다. 그래서 이에 대해 간단히 알아보자. 하둡은 슈퍼 컴퓨터 없이 서버를 여러대 연결해 빅데이터 분석을 가능하게 했다. 그러나 여러 단점이 있어 이를 보완해 나온것이 아파치 스파크이다. 하둡과 비슷하게 분산처리를 하지만 이에 비해 메모리를 효율적으로 빠르게 처리한다. 우선 하둡은 아래와 ..
인공지능/데이터 분석
2022. 6. 4. 15:17