Intro
- HTTP 학습내용의 기본 출처: 김영한님의 모든 개발자를 위한 HTTP 웹 기본지식
- 강의를 듣고 정리한 내용과 모르는 부분에 대한 추가 내용을 합쳐 올린다.
- 이 강의는 HTTP에 대한 웹 기본지식을 설명하는 강의이므로, 내용이 간략할 수 있다.
- 학습 이유: 프레임워크를 사용하여 웹 개발을 배우기 전에, HTTP에 대해 기본적인 지식을 알고자 HTTP 공부를 시작한다. 이 강의에 대해 공부 후, 네트워크 전반에 대해 공부한다.
이번 chapter에서는 HTTP header 여러 종류에서 주로 사용하는 헤더에 대해 알아보겠다.
HTTP header의 용도는 [TIL] Network HTTP basic을 참고한다.
RFC2616(과거) - HTTP Header 분류
- HTTP header 종류에 대해 알아보기 전, 과거 ‘RFC2616’ 일 때 헤더 분류를 살펴보자.
- General 헤더: 메시지 전체에 적용되는 정보, 예) Connection: close
- Request 헤더: 요청 정보, 예) User-Agent: Mozilla/5.0 (Macintosh; ..)
- Response 헤더: 응답 정보, 예) Server: Apache
- Entity 헤더: 엔티티 바디 정보, 예) Content-Type: text/html, Content-Length: 3423
RFC2616(과거) - HTTP body
- 메세지 본문(message body)은 엔티티 본문(entity body)을 전달하는데 사용
- entity body는 요청이나 응답에서 전달할 실제 데이터
- entity header는 entity 본문의 데이터를 해석할 수 있는 정보를 제공한다.
- 데이터 유형(html, json), 데이터 길이, 압축 정보 등등
RFC2616 폐지 그리고, RFC7230~7235 등장
- RFC2616이 폐지되고, RFC7230~7235가 등장하면서
- Entity 라는 표현이 Representation 으로 바꼈다.
- 그리고, Representation 이란 representation Metadata와 Representation Data를 합친 걸 의미한다.
엔티티(Entity)
->Representation
Representation
=Representation Metadata
+Representation Data
RFC7230 - HTTP Body
- 메시지 본문(message body)을 통해 표현 데이터를 전달한다.
- 메시지 본문을 다른 말로
페이로드(payload)
라 한다. representation
은 요청이나 응답에서 전달할 실제 데이터representation header
는Representation Data
를 해석할 수 있는 정보를 제공한다.- 데이터 유형(html, json), 데이터 길이, 압축 정보 등등
- 참고: Representation header는 representation metadata 와 payload message를 구분해야 하지만, 여기서는 생략한다.
- 그러면 이
representation
이 뭔지 알아보자.
1. 표현(representation)
1.0 Representation header 란??
client와 server 간에 주고 받는 resource의 data를 어떻게 표현할지 결정하는 header
예) DB에 있는 binary data를 바로 서버에 전송하는 게 아니라, HTML 또는 XML 또는 JSON 형태로 전달한다.
Representation header는 전송, 응답 둘 다 사용한다.
그래서 representation header 에는 여러 정보들이 담긴다.
- Content-Type: 표현 데이터의 형식 설명
- Content-Encoding: 표현 데이터의 압축 방식
- Content-Language: 표현 데이터의 자연 언어
- Content-Length: 표현 데이터의 길이
1.1 Content-Type
표현 데이터의 형식 설명
- 미디어 타입, 문자 인코딩
- 예)
- text/html; charset =utf-8
- application/json
- image/png
1.2 Content-Encoding
표현 데이터의 압축 방식 설명
- 표현 데이터를 압축하기 위해 사용
- 데이터를 전달하는 곳에서 압축 후 인코딩 헤더 추가
- 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축 해제
- 예)
- gzip
- deflate
- identity
1.3 Content-Language
표현 데이터의 자연어 설명
- 표현 데이터의 자연 언어를 표현
- 예)
- ko
- en
- en-US
1.4 Content-Length
표현 데이터의 길이 설명
- 바이트 단위
- Transfer-Encoding(전송 코딩)을 사용하면 Content-Length를 사용하면 안된다.
2. 콘텐츠 협상
클라이언트가 선호하는 표현을 서버에게 요청하는 것
서버에 요청 사항이 다양하다면, 우선 순위에 맞춰 서버에서 만든다.
클라이언트가 요청할 때 작성하기 때문에, 요청 시에만 사용한다.
협상 헤더 종류
- Accept: 클라이언트가 선호하는 미디어 타입 전달
- Accept-Charset: 클라이언트가 선호하는 문자 인코딩
- Accept-Encoding: 클라이언트가 선호하는 압축 인코딩
- Accept-Language: 클라이언트가 선호하는 자연 언어
2.1 Accept-Language 적용 전과 후
- 적용 전
- 적용 후
- 복잡한 예시
2.2 협상과 우선순위 (Quality Values(q))
2.2.1 협상과 우선순위 첫 번째
첫 번째: Quality Values(q)가 높을 수록 우선순위가 높다.
Quality Values(q) 값 사용
- 0~1, 클수록 높은 우선순위
- 생략하면 1
Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7
- ko-KR;q=1 (q생략)
- ko;q=0.9
- en-US;q=0.8
- en:q=0.7
인터넷 창 -> 검사 -> Network -> Headers -> Request Headers 창에 들어가면 사용하는 도메인의 우선순위를 볼 수 있다.
2.2.2 협상과 우선순위 두 번째
두 번째: 구체적인 것이 우선된다. GET /event
Accept: text/*, text/plain, text/plain;format=flowed, */*
Accept: text/_, text/plain, text/plain;format=flowed, _/*
- text/plain;format=flowed
- text/plain
- text/*
- */*
2.2.3 협상과 우선순위 세 번째
세 번째: 구체적인 것을 기준으로 미디어 타입을 맞춘다.
- Media Type 우선도
- Accept: text/*;q=0.3, text/html;q=0.7, text/html;level=1,text/html;level=2;q=0.4, */*;q=0.5
3. 전송 방식
- 전송 방식에는 4 종류가 있다.
- 단순 전송(Content-Length)
- 압축 전송(Content-Encoding)
- 분할 전송(Transfer-Encoding)
- 범위 전송(Range, Content-Range)
3.1 단순 전송(Content-Length)
- content의 길이를 알 수 있을 때 사용한다.
- 한 번에 요청하고,한 번에 받는다.
3.2 압축 전송(Content-Encoding)
- 서버에서 메세지 바디를 압축해서 전달하는 방식
- Content-Encoding에 어떻게 압축했는지 알려줘야, 웹 브라우저에서 이에 맞게 풀어서 접근할 수 있다.
3.3 분할 전송(Transfer-Encoding)
- 용량이 커서 한 번에 보내면 받는데 시간이 걸리기 때문에, 분할하여 보내서 오는 대로 바로 구현한다.
- 이 때는 content-length를 넣으면 안된다. 전체 길이를 알 수 없기 때문이다.
- 5 byte 씩 나눠서 보내고, 마지막에는 보낼 게 없어서 0이다.
3.4 범위 전송(Range, Content-Range)
4. 일반 정보
4.1 From
유저 에이전트의 이메일 정보
- 일반적으로 잘 사용되지 않는다.
- 검색 엔진 같은 곳에서, 주로 사용한다.
- 요청에서 사용한다.
4.2 Referer
이전 웹 페이지 주소
- 유입 경로 분석을 위해 많이 사용한다.
- 현재 요청된 페이지의 이전 웹 페이지 주소
- A -> B로 이동하는 경우 B를 요청할 때 Referer: A 를 포함해서 요청한다.
- Referer를 사용해서 유입 경로 분석이 가능하다.
- 요청에서 사용한다.
- 참고: referer는 단어 referrer의 오타다. 이미 너무 많은 곳에서 사용해서 그냥 사용한다.
4.3 User-Agent
유저 에이전트 애플리케이션 정보
user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36
- 검사(F12) -> Network -> Headers -> User-Agent 확인
- 클리이언트의 애플리케이션 정보(웹 브라우저 정보, 등등)
- 통계 정보
- 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
- 요청에서 사용
4.4 Server
요청을 처리하는 ORIGIN 서버의 소프트웨어 정보
여러 proxy server를 거치고, 최종적으로 나의 요청을 처리하는 서버를 ORIGIN 서버라 한다.
- Server: Apache/2.2.22 (Debian)
- server: nginx
- 응답에서 사용한다.
4.5 Data
메시지가 생성된 날짜
- Date: Tue, 15 Nov 1994 08:12:31 GMT
- 응답에서 사용한다.
5. 특별 정보
- Host: 요청한 호스트 정보(도메인)
- Location: 페이지 리다이렉션
- Allow: 허용 가능한 HTTP 메서드
- Retry-After: 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간
5.1 Host
GET /search?q=hello&hl=ko HTTP/1.1
Host: www.google.com
- 요청에서 사용
- 필수
- 하나의 서버가 여러 도메인을 처리할 때
- 하나의 IP 주소에 여러 도메인이 적용되어 있을 때
- 가상 호스트를 통해 여러 도메인을 한 번에 처리할 수 있는 서버에서는 실제 애플리케이션이 여러 개 구동될 수 있다.
- 이럴 때 HOST가 없이 요청을 하면 어느 도메인으로 들어가야하는지 알 수 없다.
- 이럴 때, 헤더 정보에 host를 추가하여 어느 도메인으로 들어가야 할지 알 수 있다.
5.2 Location
페이지 리다이렉션
- 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 자동 이동 (리다이렉트)
- 응답코드 3xx에서 설명
201 (Created)
: Location 값은 요청에 의해 생성된 리소스 URI3xx (Redirection)
: Location 값은 요청에 의해 생성된 리소스 URI
5.3 Allow
허용 가능한 HTTP 메서드를 명시한다.
하지만, 실제로 많이 구현되어 있지 않으므로 이런 게 있다 정도만 알자.
- 405 (Method Not Allowed) 에서 응답에 포함해야 한다.
- Allow: GET, HEAD, PUT
5.4 Retry-After
유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간
하지만, 실제로는 사용하기 어렵다.
- 503 (Service Unavailable): 서비스가 언제까지 불능인지 알려줄 수 있음
- Retry-After: Fri, 31 Dec 1999 23:59:59 GMT (날짜 표기)
- Retry-After: 120 (초단위 표기)
6. 인증
6.1 Authorization
클라이언트 인증 정보를 서버에 전달한다.
- Authorization: Basic xxxxxxxxxxxxxxxx
- 인증 관련해서 여러 매커니즘이 있다. 각 매커니즘마다 넣는 헤더가 다르다. 추가적으로 알아보자.
6.2 WWW-Authenticate
리소스 접근시 필요한 인증 방법 정의한다.
- 401 Unauthorized 응답과 함께 사용한다.
- WWW-Authenticate: Newauth realm=“apps”, type=1,
title=“Login to "apps"”, Basic realm=“simple”
- 인증할려면 : 이후의 내용들을 참고해서 인증 방법을 만들라는 의미다.
7. 쿠키(중요)
7.1 쿠키란??
쿠키: HTTP의 stateless 성질 때문에 필요 하에, 서버가 자동 생성하여 클라이언트에 저장하는 데이터
캐시: 클라이언트 자체에서 페이지 로드를 효율적으로 하려고 저장하는 데이터
매우 많이 사용하고, 많이 중요하다.
웹 브라우저는 서버에서 보낸 이 쿠키를 웹 브라우저 내부에 쿠키 저장소에 저장해 놓았다가, 서버의 응답에 클라이언트가 HTTP 메세지를 보낼 때, 이 쿠키 정보를 포함하여 보내는 용도
Cookie 를 사용할 때는
2가지 header
를 사용한다.- Set-Cookie: server에서 client로 쿠키를 전달할 때(응답)
- Cookie: client가 server에서 받은 쿠키를 저장하고, HTTP 요청 시 서버로 전달할 때
그러면 먼저 쿠키를 사용하지 않으면 어떻게 되는지 알아보자.
- GET으로
/welcome
resource를 조회한다. - 서버에서는 손님으로 인식한다.
- 로그인을 해야 서버에서 가입된 유저로 인식한다.
- 하지만, 로그인후 다시 welcome page에 접근하면 다시 손님으로 인식한다.
- HTTP는
stateless 프로토콜
이기 때문에, 클라이언트와 서버가 요청과 응답을 주고 받으면 연결이 끊어진다. - 그래서 클라이언트가 다시 요청하면 서버는 이전 요청을 기억하지 못하기 때문에, 클라이언트와 서버는 서로 상태를 유지하지 않는다.
- 이에 대한 대안으로 모든 요청에 사용자 정보가 포함되도록 개발한다면??
- 현실적으로 매우 힘들다.
- 그래서 이에 대한 대책으로 만든게
쿠키(cookie)
다.
- 쿠키를 사용하면 어떻게 되는지 알아보자.
- 웹 브라우저 내부에 쿠키 저장소가 있어서, 서버가 만든 쿠키를 이 저장소에 저장한다.
- 서버에 요청을 보낼 때마다 쿠키 저장소를 조회하여 Cookie HTTP header를 생성한다.
- 모든 요청에 쿠키 정보를 자동으로 포함한다.
7.2 쿠키의 사용처와 문제점
ex) set-cookie: sessionId=abcde1234; expires=Sat, 26-Dec-2020 00:00:00 GMT; path=/; domain=.google.com; Secure
사용처
- 사용자 로그인 세션 관리 (위 이미지 사례)
- 광고 정보 tracking
- 이 웹 브라우저의 사용자는 이런 광고를 주로 클릭한다는 걸 추적한다.
문제점
- 네트워크 트래픽 추가 유발한다.
- 그래서 최소한의 정보만 사용한다.
- (세션 id, 인증토큰)
- 서버에 전송하지 않고, 웹 브라우저 내부에 데이터를 저장하고 싶으면 웹 스토리지 (localStorage, sessionStroage) 참고
주의사항!
- 보안에 민감한 데이터는 저장하면 안된다.
- ex) 주민번호, 신용카드 번호 등등
- 보안에 민감한 데이터는 저장하면 안된다.
7.3 쿠키 - 생명주기 header
쿠키가 언제까지 지속되는지 알려주는 header
Expries, max-age
Set-Cookie:
expires
= Sat, 26-Dec-2020 04:39:21 GMT- 만료일이 되면 쿠키를 삭제한다.
Set-Cookie:
max-age
= 3600 (3600초)- 0이나 음수를 지정하면 쿠키 삭제
세션 쿠키: 만료 날짜를 생략하면 브라우저 종료 시까지만 유지
영속 쿠키: 만료 날짜를 입력하면 해당 날짜까지 유지
7.4 쿠키 - domain header
ex)
domain
= example.org
쿠키는 도메인을 지정할 수 있다.
2가지 방법
명시: 명시한 문서 기준 도메인 + 서브 도메인을 포함한다.
- domain = example.org 를 지정해서 쿠키 생성
- example.org는 물론이고,
- dev.example.org도 쿠키 접근한다.
- domain = example.org 를 지정해서 쿠키 생성
생략:
현재 무선 기준 도메인만
적용한다.- example.org에서 쿠키를 생성하고 domain 지정을 생략한다.
- exmple.org 에서만 쿠키 접근 가능하다.
- dev.example.org는 쿠키 미접근
- 하위 도메인은 접근 불가능하다.
- example.org에서 쿠키를 생성하고 domain 지정을 생략한다.
7.5 쿠키 - 경로 header
예)
path
= /home
- 이 경로를 포함한 하위 경로 페이지만 쿠키 접근 가능하다.
- 일반적으로 path=/ 루트로 지정한다.
- 예
- path =/home 지정
- /home -> 가능
- /home/level1 -> 가능
- /home/level1/level2 -> 가능
- /hello -> 불가능
- path =/home 지정
7.6 쿠키 - 보안 header
Secure
,HttpOnly
,SameSite
Secure
- 쿠키는 http, https를 구분하지 않고 전송한다.
- Secure를 적용하면 https인 경우에만 전송
HttpOnly
- xSS 공격 방지
- 자바스크립트에서 접근 불가(document.cookie)
- HTTP 전송에만 사용
SameSite
- XSRF 공격방지
- 요청 도메인과 쿠키에 설정된 도메인이 같은 경우만 쿠키 전송