• 회원가입
  • 로그인
  • 구글아이디로 로그인

[web] (utf-8 / euc-kr) 차이점 - 문자셋 인코딩 방식 종류

2,086  

목차

  1. UTF-8 (Unicode Transformation Format - 8-bit)
  2. EUC-KR (Extended Unix Code-KR)
  3. 선택 시 고려사항

둘 다, 문자 인코딩 방식으로, 서로 다른 방식으로 문자를 표현하고 전송함. 

 

UTF-8 (Unicode Transformation Format - 8-bit)

 

1. 문자 표현 방식

  • UTF-8은 Unicode 문자 집합을 표현하기 위한 가변 길이 인코딩 방식임 (각 문자는 1~4바이트까지 다양한 크기로 표현)
  • ASCII 문자는 1바이트로 표현되며, 다국어 문자는 2바이트 이상으로 표현됨.


2. 다국어 지원

  • UTF-8은 모든 유니코드 문자를 지원하므로 전 세계의 거의 모든 문자를 나타낼 수 있음.
  • UTF-8은 유니코드 표준을 기반으로 하기 때문에 다양한 언어와 기호체계를 포함함.


3. 호환성

  • UTF-8은 ASCII와 역호환성이 있음. (즉, ASCII로 표현된 문서는 UTF-8로 인코딩되어도 동일한 결과를 보임.)

 

 

EUC-KR (Extended Unix Code-KR)

 

1. 문자 표현 방식

  • EUC-KR은 대부분의 한국어 문자를 2바이트로 표현하는 고정 길이 인코딩방식. (ASCII 문자는 1바이트로 표현되고, 한국어 문자는 2바이트로 표현)

 

2. 다국어 지원

  • EUC-KR은 주로 한국어를 위한 인코딩이며, 한글 외의 문자에 대한 지원은 부족함.
  • 다국어 환경에서 사용하기에는 제한적임.


3. 호환성

  • EUC-KR은 ASCII와는 호환성이 있지만, 다른 인코딩 방식과의 호환성은 제한적임.

 

 

선택 시 고려사항

 

  • 다국어 지원 여부: UTF-8 선택. (UTF-8은 대부분의 언어 및 문자를 지원하며, 글로벌 웹에서 널리 사용됨.)
  • 주로 한국어 여부: EUC-KR은 한국어 텍스트에 특화되어 있음. 그러나, 현대 웹 환경에서는 UTF-8 사용 권장됨.
  • 파일 크기의 고려: UTF-8은 가변 길이 인코딩이므로 파일 크기가 증가할 수 있음. 그러나 현대 시스템에서는 크게 걱정할 필요 없음.

 

결론: 묻지도 따지지도 말고, UTF-8 선택. (그누보드도 최근엔 UTF-8만 지원.)

 


분류 제목
sports 토트넘 vs 아스널 경기 중 개인적으로 가장 인상 깊었던 장면
dance 큐빅스 Q6IX 현주 님 - Hype boy 하입보이 & Poppy 파피 [댄스/누나]
girl 목점이 매력인 분홍마스크 마기꾼 [누나]
dance 치어리더 최홍라 님 불금 댄스
girl 힘든 월요일 아침을 시작하기에 딱인 누나
ucc 신호대기 중 날아든 참새, 널 어떡하니? [동물]
ucc 치명적인 귀염 매력 발산하는 레서판다
girl 트리플에스 김채연 원피스 패션 맵시
dance 하와이 날씨 너무 좋다 띵띵땅땅띵 댄스
military K2 횩표 (블랙팬서 Black Panther)는 왜 검은색이 아닐까요?
talk 오후에 진눈깨비 온다고 하길래 뭔가 하고 찾아봤더니...
sports 2023 AFC 카타르 아시안컵 A조 1R (카타르 vs 레바논) 축구 하이라이트
talk 손흥민 해트트릭 단숨에 팀내 득점 랭킹 1위
sports 토트넘 미쳤다.
girl 하지원 치어리더 님 기쁨의 고속발동동
dance 런닝머신 위에서 토카토카 댄스 추는 누나
sports 23/24 (7R) 토트넘 : 리버풀 VAR 오심 발생 원인
sports 손흥민 단짝 해리케인, 이젠 김민재와 한팀
talk 실수로 많이 산 치즈 처리 방법
sports 토트넘, 경기 막판 에버튼에 통한의 동점골 허용
25/163
목록
찾아주셔서 감사합니다. Since 2012