P101~150
인터넷 계층을 처리하는 기기
1. 라우터
여러 개의 네트워크를 연결, 분할, 구분시켜 주는 역할, 라우팅을 하는 장비
라우팅
다른 네트워크에 존재하는 장치끼리 서로 데이터를 주고받을 때 패킷 소모를 최소화하고 경로를 최적화하여 최소 경로로 패킷을 포워딩하는 일
2. L3 스위치
L2 스위치의 기능과 라우팅 기능을 갖춘 장비. 라우터는 소프트웨어 기반의 라우팅과 하드웨어 기반의 라우팅을 하는 것으로 나누어지는데 하드웨어 기반의 라우팅을 담당하는 장치가 L3 스위치
데이터 링크 계층을 처리하는 기기
1. L2 스위치
장치들의 MAC 주소를 MAC 주소 테이블을 통해 관리하며 연결된 장치로부터 패킷이 왔을 때 패킷 전송을 담당. IP 주소를 이해하지 못해 IP 주소 기반으로 라우팅은 불가. 단순히 패킷의 MAC 주소를 읽어 스위칭하는 역할. 목적지가 MAC 주소 테이블에 없다면 전체 포트에 전달하고 MAC 주소 테이블의 주소는 일정 시간 이후 삭제
2. 브리지
두 개의 근거리 통신망(LAN) 을 상호 접속할 수 있도록 하는 통신망 연결 장치, 포트와 포트 사이의 다리 역할. 장치에서 받아온 MAC 주소를 MAC 주소 테이블로 관리. 브리지는 통신망 범위를 확장하고 서로 다른 LAN 등으로 이루어진 하나의 통신망을 구축할 때 쓰임.
물리 계층을 처리하는 기기
1. NIC
LAN 카드라고 하는 네트워크 인터페이스 카드.
2대 이상의 컴퓨터 네트워크를 구성하는 데 사용. 네트워크와 빠른 속도로 데이터를 송수신할 수 있도록 컴퓨터 내에 설치하는 확장 카드
고유의 식별번호인 MAC 주소가 있음.
2. 리피터
들어오는 약해진 신호를 증폭하여 다른 쪽으로 전달하는 장치 but. 광케이블 보급에 따라 현재는 거의 쓰이지 않음.
3. AP
패킷 복사하는 기기
AP에 유선 LAN을 연결한 후 다른 장치에서 무선 LAN 기술을 사용하여 무선 네트워크 연결 가능
IP 주소
ARP
컴퓨터와 컴퓨터는 IP 주소에서 ARP 를 통해 MAC 주소를 찾아 MAC 주소를 기반으로 통신함. ARP 란 IP 주소로부터 MAC 주소를 구하는 IP 와 MAC 주소의 다리 역할을 하는 프로토콜임. 반대로 RARP 를 통해 실제 주소인 MAC 주소를 가상 주소인 IP 주소로 변환하기도 함.
장치 A가 ARP Request 브로드캐스트를 보내서 IP 주소에 해당하는 MAC 주소를 찾음. 그 다음 해당 주소에 맞는 장치 B가 ARP reply 유니캐스트를 통해 MAC 주소를 반환하는 과정을 거쳐 IP 주소에 맞는 MAC 주소를 반환함.
+
브로드캐스트,유니캐스트
브로드캐스트: 송신 호스트가 전송한 데이터가 네트워크에 연결된 모든 호스트에 전송되는 방식
유니캐스트: 고유 주소로 식별된 하나의 네트워크 목적지에 1:1로 데이터를 전송하는 방식
홉바이홉 통신
IP 주소를 통해 통신하는 과정
통신 장치에 있는 라우팅 테이블의 ip 를 통해 시작 주소부터 시작하여 다음 ip 로 계속해서 이동하는 라우팅 과정을 거쳐 패킷이 최종 목적지까지 도달하는 통신
라우팅 = ip 주소를 찾아가는 과정
라우팅 테이블
송신지에서 수신지까지 도달하기 위해 사용되며 라우터에 들어가 있는 목적지 정보들과 그 목적지로 가기 위한 방법들이 들어 있는 리스트. 게이트웨이와 모든 목적지에 대해 해당 목적지에 도달하기 위해 거쳐야 야 할 다음 라우터의 정보를 담고 있음.
게이트웨이
서로 다른 통신망, 프로토콜을 사용하는 네트워크 간의 통신을 가능하게 하는 관문 역할을 하는 컴퓨터나 소프트웨어
사용자는 인터넷에 접속하려면 많은 게이트웨이를 거쳐야 함. 게이트 웨이는 서로 다른 네트워크 상의 통신 프로토콜을 변환해주는 역할을 하기도 함. 게이트웨이는 라우팅 테이블을 통해 볼 수 있음.
IP 주소 체계
Ip 주소는 IPv4 와 IPv6 로 나뉨. IPv4 는 32비트를 8비트 단위로 점을 찍어 표기하며 123.45.67.89 같은 방식으로 ip 주소를 나타냄. ipv6 는 64비트를 16비트 단위로 점을 찍어 표기하며 2001:db8::ff00:42:8923 같은 방식으로 ip 주소를 나타냄.
클래스 기반 할당 방식
초기에는 A,B,C,D,E 다섯 개의 클래스로 구분하는 클래스 기반 할당 방식을 썼음. 앞에는 네트워크 주소, 뒤에는 호스트 주소를 놓아 사용.
A,B,C는 일대일 통신으로 사용, 클래스 D는 멀티캐스트 통신, 클래스 E는 앞으로 사용할 예비용으로 쓰는 방식임. 맨 왼쪽의 비트가 구분 비트. 각 클래스는 주소 범위를 가짐.
네트워크의 첫 번째 주소는 네트워크 주소로 사용되고 마지막 주소는 브로드캐스트용 주소로 네트워크에 속한 모든 컴퓨터에 데이터 보낼 때 사용. 그 사이에 있는 수를 컴퓨터에 부여할 수 있는 호스트 주소로 사용이 가능함. but 사용하는 주소보다 버리는 주소 많으므로 DHCP, IPv6, NAT 가 나옴.
DHCP
IP 주소 및 기타 통신 매개변수를 자동으로 할당하기 위한 네트워크 관리 프로토콜. 네트워크 장치의 ip 주소를 수동으로 설정할 필요 없이 인터넷에 접속할 때마다 자동으로 ip 주소 할당 가능. 많은 라우터와 게이트웨이 장비에 이 기능 있고 대부분의 가정용 네트워크에서 ip 주소 할당.
NAT
패킷이 라우팅 장치를 통해 전송되는 동안 패킷의 ip 주소 정보를 수정하여 ip 주소를 다른 주소로 매핑하는 방법. IPv4 주소 체계의 단점을 해결하기 위해 NAT 로 공인 ip 와 사설 ip 로 나눠 많은 주소 처리. NAT 가능케 하는 소프트웨어: ICS, RRAS, Netfilter 등이 있음.
구성원 각각이 서로 다른 사설 ip 를 가져도 nat 장치를 통해 하나의 공인 ip 를 외부 인터넷에 요청 가능. nat 를 통해 사설 ip 를 공인 ip 로 변한하거나 반대로 변환 가능.
공유기와 nat
nat 쓰는 이유: 여러 대의 호스트가 하나의 공인 ip 주소를 사용하여 인터넷에 접속하기 위함. 인터넷 공유기에 nat 기능 탑재되어 있음.
nat 를 이용한 보안
nat 이용 시 내부 네트워크에서 사용하는 ip 주소와 외부에 드러나는 ip 주소를 다르게 유지할 수 있으므로 네트워크에 대한 어느 정도의 보안 가능해짐.
nat 단점
nat 는 여러 명이 동시에 인터넷에 접속하게 되므로 실제 접속하는 호스트 숫자에 따라 접속 속도 느려질 수 있음.
IP 주소를 이용한 위치 정보
IP 주소는 인터넷에서 사용하는 네트워크 주소이므로 이를 통해 위치 추적 가능함.
HTTP
http 는 애플리케이션 계층으로서 웹 서비스 통신에 사용됨.
http 1.0
< 기본적으로 한 연결 당 하나의 요청을 처리하도록 설게되었음. 이는 RTT 증가를 불러오게 됨. 서버로부터 파일을 가져올 때마다 TCP의 3 웨이 핸드셰이크를 계속해서 열어야 하므로 RTT 가 증가하는 단점 있었음.
RTT = 패킷이 목적지에 도달하고 나서 다시 돌아오기까지 걸리는 시간. 패킷 왕복 시간
RTT 증가를 해결하기 위한 방법
이미지 스플리팅
많은 이미지가 합쳐 있는 하나의 이미지를 다운로드받고 이를 기반으로 background-image 의 position 을 이용하여 이미지 표기
코드 압축
코드 압축해서 개행 문자, 빈칸 없애서 코드 크기 최소화
이미지 BASE64 인코딩
파일을 64진법으로 이루어진 문자열로 인코딩. 서버와의 연결을 열고 이미지에 대해 서버 http 요청을 할 필요가 없음. but base64 문자열로 반환 시 크기가 37%정도 더 커짐.
>
http 1.1
< 매번 TCP 연결을 하는 것이 아닌 한 번 TCP 초기화를 한 이후 keep-alive 옵션으로 여러 개의 파일을 송수신할 수 있게 바뀜. but 문서 안에 포함된 다수의 리소스를 처리하려면 요청할 리소스 개수에 비례해서 대기 시간이 길어진다는 단점
HOL Blocking
네트워크에서 같은 큐에 있는 패킷이 그 첫 번째 패킷에 의해 지연될 때 발생하는 성능 저하 현상
무거운 헤더 구조
헤더에 쿠키 등 많은 메타 데이터가 들어 있고 압축이 되지 않아 무거웟음
>
http/2
<http/1 보다 지연시간을 줄이고 응답 시간 더 빠르게, 멀티플렉싱, 헤더 압축, 서버 푸시, 요청의 우선순위 처리를 지원하는 프로토콜
멀티 플렉싱
여러 개의 스트림을 사용하여 송수신한다는 것. 특정 스트림의 패킷이 손실되었다 해도 해당 스트림에만 영향을 미치고 나머지 스트림은 정상 동작. -> HOL Blocking 문제 해결 가능.
스트림
시간이 지남에 따라 사용할 수 있게 되는 일련의 데이터 요소를 가리키는 데이터 흐름
헤더 압축
허프만 코딩 압축 알고리즘 사용.
허프만 코딩
문자열을 문자 단위로 쪼개 빈도수를 세어 빈도가 높은 정보는 적은 비트 수를 사용하여 표현하고 빈도가 낮은 정보는 비트 수를 많이 사용하여 표현해서 전체 데이터의 표현에 필요한 비트양을 줄이는 원리.
서버 푸시
클라이언트 요청 없이 서버가 바로 리소스를 푸시할 수 있음.
>
HTTPS
<http.2 는 https 위에서 동작함. https 는 애플리케이션 계층과 전송 계층 사이에 신뢰 계층인 SSL/TLS 게층을 넣은 신뢰할 수 있는 HTTP 요청을 말함. 이를 통해 통신을 암호화함.
SSL/TLS
SSL은 버전이 올라가며 마짐막으로 TLS 로 이름이 바뀌었으나 보통 두 개를 합쳐서 부름. 이는 전송 계층에서 보안을 제공하는 프로토콜임. 클라이언트가 서버와 통신할 때 이를 이용해 제 3자가 메시지를 도청하거나 변조하지 못하도록 함.
이를 통해 공격자가 서버인 척하며 사용자 정보를 가로채는 네트워크상의 인터셉터를 방지할 수 있음.
이는 보안 세션을 기반으로 데이터를 암호화하며 보안 세션이 만들어질 때 인증 메커니즘, 키 교환 암호화 알고리즘, 해싱 알고리즘이 사용됨.
보안 세션
보안이 시작되고 끝나는 동안 유지되는 세션. SSL/TLS 는 핸드셰이크를 통해 보안 세션을 생성하고 이를 기반으로 상태 정보 등을 공유함.
세션
운영체제가 어떤 사용자로부터 자신의 자산 이용을 허락하는 일정한 기간
클라이언트가 서버와 키를 공유하고 이를 기반으로 인증, 인증 확인 등의 작업이 일어나는 단 한 번의 1-RTT가 생긴 후 데이터를 송수신할 수 있음.
클라이언트에서 사이퍼 슈트를 서버에 전달하면 서버는 받은 사이퍼 슈트의 암호화 알고리즘 리스트를 제공할 수 있는지 확인. 제공할 수 있다면 서버에서 클라이언트로 인증서를 보내는 인증 메커니즘이 시작되고 이후 해싱 알고리즘 등으로 암호화된 데이터의 송수신이 시작됨.
사이퍼 슈트
프로토콜, AEAD 사이퍼 모드, 해싱 알고리즘이 나열된 규약.
AEAD 사이퍼 모드
데이터 암호화 알고리즘
인증 메커니즘
CA에서 발급한 인증서를 기반으로 이루어짐. CA 에서 발급한 인증서는 안전한 연결을 시작하는 데 있어 필요한 공개키를 클라이언트에 제공하고 사용자가 접속한 서버가 신뢰할 수 있는 서버임을 보장함. 인증서는 서비스 정보, 공개키, 지문, 디지털 서명 등으로 이루어져 있음. CA 는 아무 기업이나 할 수 있는 것이 아니고 신뢰성이 엄격하게 공인된 기업들만 참여할 수 있음.
CA 발급 과정
자신의 서비스가 CA 인증서를 발급받으려면 자신의 사이트 정보와 공개키를 CA 에 제출해야 함. 이후 CA 는 공개키를 해시한 값인 지문을 사용하는 CA 의 비밀키 등을 기반으로 CA 인증서를 발급함.
개인키 = 비밀키 = 개인이 소유하고 있는 키이자 반드시 자신만이 소유해야 하는 키
공개키 = 공개되어 있는 키
암호화 알고리즘
키 교환 암호화 알고리즘으로는 대수곡선 기반의 ECDHE 또는 모듈식 기반의 DHE 를 사용. 둘 다 디피-헬만 방식을 근간으로 만들어짐.
디피-헬만 키 교환 암호화 알고리즘
암호키를 교환하는 하나의 방법.
처음에 공개 값을 공유하고 각자의 비밀 값과 혼합한 후 혼합 값을 공유. 그 다음 각자의 비밀 값과 또 혼합. 그 이후에 공통의 암호 생성. 클라이언트와 서버 모두 개인키와 공개키를 생성하고 서로에게 공개키를 보내고 공개키와 개인키를 결합하여 psk 가 생성된다면 악의적인 공격자가 개인키 또는 공개키를 가지고도 psk 가 없기 때문에 아무것도 할 수 없음. 이를 통해 키를 암호활 수 있음.
해싱 알고리즘
데이터를 추정하기 힘든 더 작고 섞여 있는 조각으로 만드는 알고리즘. SSL/TLS 는 해싱 알고리즘으로 SHA-256/-384 알고리즘을 쓰고 256을 더 많이 씀.
SHA-256 알고리즘
해시 함수의 결괏값이 256비트인 알고리즘이며 비트 코인을 비롯한 블록체인 시스템에서도 씀. 해싱을 해야 할 메시지에 1을 추가하는 등 전처리를 하고 전처리된 메시지를 기반으로 해시를 반환함.
해시
다양한 길이를 가진 데이터를 고정된 길이를 가진 데이터로 매핑한 값
해싱
임의의 데이터를 해시로 바꿔주는 일이며 해시 함수가 이를 담당
해시 함수
임의의 데이터를 입력으로 받아 일정한 길이의 데이터로 바꿔주는 함수
SEO에도 도움이 되는 https
SEO
검색 엔진 최적화. 검색엔진으로 웹 사이트를 검색했을 때 그 결과를 페이지 상단에 노출시켜 많은 사람이 볼 수 있도록 최적화하는 방법을 의미. 서비스를 운영한다면 SEO 관리는 필수. 구글은 사이트 내 모든 요소가 동일하다면 HTTPS 서비스를 하는 사이트가 그렇지 않은 사이트보다 SEO 순위가 높을 것이라고 공식적으로 밝혔음. 이를 위한 방법으로는 캐노니컬 설정, 메타 설정, 페이지 속도 개선, 사이트맵 관리 등이 있음.
HTTPS 구축 방법
1. 직접 CA 에서 구매한 인증키를 기반으로 HTTPS 서비스 구축
2. 서버 앞단의 HTTPS 를 제공하는 로드밸런서를 두기
3. 서버 앞단에 HTTPS 를 제공하는 CDN 두기
>
3. HTTP/3
<TCP 위에서 돌아가는 HTTP/2 와 달리 HTTP/3 은 QUIC 라는 계층 위에서 돌아감. TCP 기반이 아닌 UDP 기반으로 돌아감.
HTTP/2 에서 장점이었던 멀티플렉싱을 가지고 있으며 초기 연결 설정 시 지연 시간 감소라는 장점 있음.
초기 연결 설정 시 지연 시간 감소
QUIC 는 TCP 를 사용하지 않기 때문에 통신을 시작할 때 번거로운 3 웨이 핸드셰이크 과정을 거치지 않음. QUIC 는 첫 연결 설정에 1-RTT 만 소요됨. 클라이언트가 서버에 어떤 신호를 한 번 주고, 서버도 거기에 응답하기만 하면 바로 본 통신을 시작할 수 잇음. QUIC 는 순방향 오류 수정 메커니즘이 적용되어 전송한 패킷이 손실되었다면 수신 측에서 에러를 검출하고 수정하는 방식임. 열악한 네트워크 환경에서도 낮은 패킷 손실률을 자랑함.
>
운영체제
< 사용자가 컴퓨터를 쉽게 다루게 해주는 인터페이스. 한정된 메모리나 시스템 자원을 효율적으로 분배. 운영체제와 유사하지만 소프트웨어를 추가 설치할 수 없는 것을 펌웨어라 함.
운영체제의 역할
1. CPU 스케줄링과 프로세스 관리
CPU 소유권을 어떤 프로세스에 할당할지, 프로세스의 생성과 삭제, 자원 할당 및 반환을 관리함.
2. 메모리 관리
한정된 메모리를 어떤 프로세스에 얼만큼 할당해야 하는지 관리함
3. 디스크 파일 관리
디스크 파일을 어떠한 방법으로 보관할지 관리함
4. I/O 디바이스 관리
I/O 디바이스들인 마우스, 키보드와 컴퓨터 간에 데이터를 주고 받는 것을 관리함.
운영체제의 구조
유저 프로그램 (맨 위)
GUI
시스템콜
커널
드라이버
하드웨어
유저 프로그램과 하드웨어 빼고 운영체제
GUI
사용자가 전자장치와 상호 작용할 수 있도록 하는 사용자 인터페이스의 한 형태. 단순 명령어 창이 아닌 아이콘을 마우스로 클릭하는 단순한 동작으로 컴퓨터와 상호작용할 수 있게 해줌.
드라이버
하드웨어를 제어하기 위한 소프트웨어
CUI
그래픽이 아닌 명령어로 처리하는 인터페이스
시스템콜
운영체제가 커널에 접근하기 위한 인터페이스, 유저 프로그램이 운영체제의 서비스를 받기 위해 커널 함수를 호출할 때 씀. 유저 프로그램이 I/O 요청으로 트랩을 발동하면 올바른 I/O 요청인지 확인한 후 유저 모드가 시스템콜을 통해 커널 모드로 변환되어 실행됨. 유저 모드에서 파일을 읽지 않고 커널 모드로 들어가 파일을 읽고 다시 유저 모드로 돌아가 그 뒤에 있는 유저 프로그램의 로직을 수행 -> 컴퓨터 자원에 대한 직접 접근을 차단할 수 있고 프로그램을 다른 프로그램으로부터 보호할 수 있음.
I/O 요청
입출력 함수, 데이터베이스, 네트워크, 파일 접근 등에 관한 일
드라이버
하드웨어를 제어하기 위한 소프트웨어
메모리에 있는 프로세스나 스레드에서 운영체제로 어떠한 요청을 할 때 시스템콜이라는 인터페이스와 커널을 거쳐 운영체제에 전달됨. 이때 시스템콜은 하나의 추상화 계층으로 이를 통해 네트워크 통신이나 데이터베이스와 같은 낮은 단계의 영역 처리에 대한 부분을 많이 신경 쓰지 않고 프로그램을 구현할 수 있는 장점이 있음.
modebit
시스템콜이 작동될 때 modebit 을 참고해서 유저 모드와 커널 모드를 구분한다. modebit 은 1 또는 0의 값을 가지는 플래그 변수이다. I/O 디바이스는 운영체제를 통해서만 작동해야 한다. 운영체제를 통해 작동하게 하면 공격자의 침입을 쉽게 막을 수 있다. 이를 위한 장치가 modebit 이다. modebit 의 0은 커널 모드, 1은 유저 모드로 설정되며 유저 모드의 경우 시스템콜을 못하게 막아서 한정된 일만 가능하게 한다.
유저 모드
유저가 접근할 수 잇는 영역을 제한적으로 두며 컴퓨터 자원에 함부로 침범하지 못하는 코드
커널 모드
모든 컴퓨터 자원에 접근할 수 있는 모드
커널
운영체제의 핵심 부분이자 시스템콜 인터페이스를 제공하며 운영체제의 중처적인 역할을 함.
>
컴퓨터의 요소
< 컴퓨터는 CPU, DMA 컨트롤러, 메모리, 타이머, 디바이스 컨트롤러 등으로 이루어져 있음.
CPU
산술논리연산장치, 제어장치, 레지스터로 구성되어 있는 컴퓨터 장치를 말하며, 인터럽트에 의해 단순히 메모리에 존재하는 명령어를 해석해서 실행하는 일꾼.
관리자 역할을 하는 운영체제의 커널이 프로그램을 메모리에 올려 프로세스로 만들면 일꾼인 CPU가 이를 처리함
제어 장치
프로세스 조작을 지시하는 CPU의 한 부품. 입출력 장치 간 통신을 제어하고 명령어들을 읽고 해석하며 데이터 처리를 위한 순서를 결정
레지스터
CPU 안에 있는 매우 빠른 임시기억장치. CPU와 직접 연결되어 있으므로 연산속도가 메모리보다 훨씬 빠름. CPU 는 자체적으로 데이터를 저장할 방법이 없기 때문에 레지스터를 거쳐 데이터를 전달함.
산술논리연산장치
산술 연산과 배타적 논리합, 논리곱 같은 논리 연산을 계산하는 디지털 회로
CPU 의 연산 처리
1. 제어장치가 메모리에 계산할 값을 로드함. 레지스터에도 로드함.
2. 제어장치가 레지스터에 있는 값을 계산하라고 산술논리연산장치에 명령
3. 제어장치가 계산된 값을 다시 레지스터에서 메모리로 계산한 값을 저장함.
인터럽트
어떤 신호가 들어왔을 때 CPU 를 잠깐 정지시키는 것. 인터럽트 발생 시 인터럽트 핸들러 함수가 모여 있는 인터럽트 벡터로 가서 인터럽트 핸들러 함수가 실행됨. 인터럽트 간에는 우선순위가 있고 우선순위에 따라 실행됨. 인터럽트의 종류는 하드웨어와 소프트웨어 인터럽트 가 있음.
인터럽트 핸들러 함수
인터럽트가 발생했을 때 이를 핸들링하기 위한 함수. 커널 내부의 IRQ 를 통해 호출되고 request_irq() 를 통해 인터럽트 핸들러 함수를 등록 가능.
하드웨어 인터럽트
IO 디바이스에서 발생하는 인터럽트. 인터럽트 라인이 설계된 이후 순차적인 인터럽트 실행을 중지하고 운영체제에 시스템콜을 요청해서 원하는 디바이스로 향해 디바이스에 있는 작은 로컬 버퍼에 접근하여 일을 수행함.
소프트웨어 인터럽트
트랩이라고도 함. 프로세스 오류 등으로 프로세스가 시스템콜을 호출할 때 발동.
DMA 컨트롤러
IO 디바이스가 메모리에 직접 접근할 수 있도록 하는 하드웨어 장치. CPU 에만 너무 많은 인터럽트 요청이 들어오기 때문에 CPU 부하를 막아주며 CPU의 일을 부담하는 보조 일꾼.
메모리
전자 회로에서 데이터나 상태, 명령어 등을 기록하는 장치. 보통 RAM 을 일컬어 메모리라고도 함. CPU는 계산 담당, 메모리는 기억 담당.
타이머
몇 초 안에는 작업이 끝나야 한다는 것을 정하고 특정 프로그램에 시간 제한을 다는 역할. 시간이 많이 걸리는 프로그램 작동 시 제한을 걸기 위해 존재
디바이스 컨트롤러
컴퓨터와 연결되어 있는 IO 디바이스들의 작은 CPU
>
메모리
< 메모리 계층과 메모리 관리를 알아보자.
메모리 계층
레지스터 : CPU 안에 있는 작은 메모리, 휘발성, 속도 가장 빠름. 기억 용량이 가장 작음.
캐시 : L1, L2 캐시를 지칭. 휘발성, 속도 빠름, 기억 용량 적음.
메모리 = 주기억장치 : RAM 을 가리킴. 휘발성, 속도 보통, 기억 용량 보통
저장장치 = 보조기억장치 : HDD, SDD 일컬으며 휘발성, 속도 낮음. 기억 용량 많음.
램은 하드디스크로부터 일정량의 데이터를 복사해서 임시 저장하고 이를 필요 시마다 CPU에 빠르게 전달하는 역할. 계층 위로 올라갈수록 가격은 비싸지는데 용량은 작아지고 속도는 빨라짐. 이러한 계층이 있는 이유는 경제성과 캐시 때문.
캐시
데이터를 미리 복사해 놓는 임시 저장소이자 빠른 장치와 느린 장치에서 속도 차이에 따른 병목 현상을 줄이기 위한 메모리. 데이터를 접근하는 시간이 오래 걸리는 경우를 해결하고 무언가를 다시 계산하는 시간을 절약할 수 잇음. 메모리와 CPU 사이의 속도 차이가 너무 크기 때문에 그 중간에 레지스터 계층을 둬서 속도 차이를 해결함. 이렇듯 속도 차이를 해결하기 위해 계층과 계층 사이에 있는 계층을 캐싱 계층이라 함. 예를 들어 캐시 메모리와 보조기억장치 사이에 있는 주기억장치를 보조기억장치의 캐싱계층이라 할 수 잇음.
지역성의 원리
캐시 계층을 두는 것 말고 캐시를 직접 설정할 때 -> 자주 사용하는 데이터 기반으로 설정해야 함. 자주 사용하는 데이터에 대한 근거 = 지역성. 지역성의 종류: 1. 시간 지역성 2. 공간 지역성
시간 지역성
최근 사용한 데이터에 다시 접근하려는 특성.
공간 지역성
최근 접근한 데이터를 이루고 있는 공간이나 그 가까운 공간에 접근하는 특성
캐시히트와 캐시미스
캐시히트: 캐시에서 원하는 데이터를 찾은 것
캐시미스: 해당 데이터가 캐시에 없다면 주 메모리로 가서 데이터를 찾아오는 것
캐시히트를 하게 되면 해당 데이터를 제어장치를 거쳐 가져오게 됨. 이 경우 위치도 가깝고 CPU 내부 버스를 기반으로 작동하므로 빠름.
캐시미스가 발생되면 메모리에서 가져오게 되는데 이는 시스템 버스를 기반으로 작동하므로 느림
캐시매핑
캐시가 히트되기 위해 매핑하는 방법
CPU 의 레지스터와 주 메모리(RAM) 간에 데이터를 주고받을 때를 기반으로 설명. 레지스터는 주 메모리에 비하면 굉장히 작고 주 메모리는 굉장히 크므로 작은 레지스터가 캐시 계층으로써 역할을 잘 해주려면 이 매핑을 어떻게 하느냐가 중요. 캐시매핑의 종류로는 직접 매핑, 연관 매핑, 집합 연관 매핑이 있음.
웹 브라우저의 캐시
소프트웨어적인 대표적 캐시 = 웹 브라우저의 작은 저장소 쿠키, 로컬 스토리지, 세션 스토리지 가 있음. 보통 사용자의 커스텀한 정보나 인증 모듈 관련 사항들을 웹 브라우저에 저장해서 추후 서버에 요청할 때 자신을 나타내는 아이덴티티나 중복 요청 방지를 위해 쓰임.
쿠키
만료기한이 있는 키-값 저장소. same site 옵션을 strict 로 설정하지 않았을 경우 다른 도메인에서 요청햇을 때 자동 전송됨. 4kb 까지 데이터 저장 가능, 만료 기한 정할 수 있음. 쿠키 설정 시 document.cookie 로 쿠키를 볼 수 없게 httponly 옵션을 거는 것 중요. 클라이언트도 할 수 있으나 보통 서버에서 만료기한을 정함.
로컬 스토리지
만료기한 없는 키-값 저장소 10mb 까지 저장 가능. 웹 브라우저 닫아도 유지. 도메인 단위로 저장, 생성됨. html5를 지원하지 않는 웹 브라우저에서는 사용 불가. 클라이언트에서만 수정 가능
세션 스토리지
만료기한 없는 키-값 저장소. 탭 단위로 세션 스토리지 생성, 탭 닫을 때 해당 데이터 삭제됨. 5mb 까지 저장 가능. html5를 지원하지 않는 웹 브라우저에서는 사용 불가. 클라이언트에서만 수정 가능
데이터베이스의 캐싱 계층
데이터베이스 시스템을 구축할 때도 메인 데이터베이스 위에 레디스 데이터 베이스 계층을 캐싱 계층으로 둬서 성능을 향상시키기도 함.
>
메모리 관리
< 운영체제의 대표적인 업무가 메모리 관리
가상 메모리
메모리 관리 기법의 하나로 컴퓨터가 실제로 이용 가능한 메모리 자원을 추상화하여 이를 사용하는 사용자들에게 매우 큰 메모리로 보이게 만드는 것. 이때 가상적으로 주어진 주소 = 가상 주소, 실제 메모리상에 잇는 주소 = 실제 주소
가상 주소는 메모리관리장치에 의해 실제 주소로 변환됨. 덕분에 사용자는 실제 주소 의식할 필요 없이 프로그램 구축 가능.
가상 메모리는 가상 주소와 실제 주소가 매핑되어 있고 프로세스의 주소 정보가 들어 있는 페이지 테이블로 관리됨. 이때 속도 향상을 위해 TLB 를 씀.
TLB
메모리와 CPU 사이에 있는 주소 변환을 위한 캐시. 페이지 테이블에 잇는 리스트를 보관하며 CPU가 페이지 테이블까지 가지 않도록 해 속도를 향상시킬 수 있는 캐시 계층.
스와핑
가상 메모리는 존재하지만 실제 메모리인 RAM에는 현재 없는 데이터나 코드에 접근할 경우 페이지 폴트가 발생함. 이를 방지하기 위해 당장 사용하지 않는 영역을 하드디스크로 옮겨 필요할 때 다시 RAM 으로 불러와 올리고 사용하지 않으면 다시 하드디스크로 내림을 반복하여 RAM 을 효과적으로 관리하는 것을 스와핑이라 함.
페이지 폴트
프로세스의 주소 공간에는 존재하지만 RAM 에는 없는 데이터에 접근햇을 경우에 발생. 운영체제는 다음 과정으로 해당 데이터를 메모리로 가져와서 마치 페이지 폴트가 전혀 발생하지 않은 것처럼 프로그램이 작동하도록 함.
1. CPU 는 물리 메모리를 확인하여 해당 페이지가 없으면 트랩을 발생해서 운영체제에 알림.
2. 운영체제는 CPU의 동작을 잠시 멈춤
3. 운영체제는 페이지 테이블 확인하여 가상 메모리에 페이지가 존재하는지 확인하고 없으면 프로세스를 중단, 현재 물리 메모리에 비어 있는 프레임이 있는지 찾음. 물리 메모리에도 없다면 스와핑 발동.
4. 비어 잇는 프레임에 해당 페이지 로드, 페이지 테이블 최신화
5. 중단되었던 cpu 다시 시작
페이지
가상 메모리를 사용하는 최소 크기 단위
프레임
실제 메모리를 사용하는 최소 크기 단위
스레싱
메모리의 페이지 폴트율이 높은 것을 의미. 컴퓨터의 심각한 성능 저하 초래.
메모리에 너무 많은 프로세스가 동시에 올라가게 되면 스와핑이 많이 일어나서 발생. 페이지 폴트가 발생하면 cpu 이용률이 낮아짐. 그럼 운영체제는 가용성을 높이기 위해 더 많은 프로세스를 메모리에 올리며 악순환 반복 -> 스레싱 일어남. 이를 해결하는 방법
1. 메모리 늘리기 2. HDD 를 SDD 로 바꾸기. 이외의 운영체제에서 할 수 있는 방법 = 작업 세트와 PFF
>
'면접을 위한 CS 전공지식 노트' 카테고리의 다른 글
2022.07.23 (0) | 2022.07.24 |
---|---|
2022.07.13 (0) | 2022.07.14 |
2022.07.11 (0) | 2022.07.12 |
댓글