• 회원가입
  • 로그인
  • 구글아이디로 로그인

[web] (utf-8 / euc-kr) 차이점 - 문자셋 인코딩 방식 종류

1,915  

목차

  1. UTF-8 (Unicode Transformation Format - 8-bit)
  2. EUC-KR (Extended Unix Code-KR)
  3. 선택 시 고려사항

둘 다, 문자 인코딩 방식으로, 서로 다른 방식으로 문자를 표현하고 전송함. 

 

UTF-8 (Unicode Transformation Format - 8-bit)

 

1. 문자 표현 방식

  • UTF-8은 Unicode 문자 집합을 표현하기 위한 가변 길이 인코딩 방식임 (각 문자는 1~4바이트까지 다양한 크기로 표현)
  • ASCII 문자는 1바이트로 표현되며, 다국어 문자는 2바이트 이상으로 표현됨.


2. 다국어 지원

  • UTF-8은 모든 유니코드 문자를 지원하므로 전 세계의 거의 모든 문자를 나타낼 수 있음.
  • UTF-8은 유니코드 표준을 기반으로 하기 때문에 다양한 언어와 기호체계를 포함함.


3. 호환성

  • UTF-8은 ASCII와 역호환성이 있음. (즉, ASCII로 표현된 문서는 UTF-8로 인코딩되어도 동일한 결과를 보임.)

 

 

EUC-KR (Extended Unix Code-KR)

 

1. 문자 표현 방식

  • EUC-KR은 대부분의 한국어 문자를 2바이트로 표현하는 고정 길이 인코딩방식. (ASCII 문자는 1바이트로 표현되고, 한국어 문자는 2바이트로 표현)

 

2. 다국어 지원

  • EUC-KR은 주로 한국어를 위한 인코딩이며, 한글 외의 문자에 대한 지원은 부족함.
  • 다국어 환경에서 사용하기에는 제한적임.


3. 호환성

  • EUC-KR은 ASCII와는 호환성이 있지만, 다른 인코딩 방식과의 호환성은 제한적임.

 

 

선택 시 고려사항

 

  • 다국어 지원 여부: UTF-8 선택. (UTF-8은 대부분의 언어 및 문자를 지원하며, 글로벌 웹에서 널리 사용됨.)
  • 주로 한국어 여부: EUC-KR은 한국어 텍스트에 특화되어 있음. 그러나, 현대 웹 환경에서는 UTF-8 사용 권장됨.
  • 파일 크기의 고려: UTF-8은 가변 길이 인코딩이므로 파일 크기가 증가할 수 있음. 그러나 현대 시스템에서는 크게 걱정할 필요 없음.

 

결론: 묻지도 따지지도 말고, UTF-8 선택. (그누보드도 최근엔 UTF-8만 지원.)

 


분류 제목
sports 탄성 절로 나는 다이빙 자세
dance 유히로 님 손 꽁꽁 언 고통 감수 Ditto (디토) 댄스
life 좋은 (달걀/계란) 고르는 법
sports 동네북 된 토트넘
sports 나폴리 리그 연승 행진 중 (아쉽게, 김민재는 실점 빌미 제공)
sports 2022 카타르 월드컵 이변/이슈 모음 정리
ucc 히든싱어 - 진짜 코요태 신지 찾기
military 대한민국이 핵개발 시 , 핵실험장은 어디가 좋을까요?
dance 김나연 치어리더 님 황희찬 리그 6호골 축하 댄스 - UNFORGIVEN (LE SSERAFIM)
dance 버스터즈 BUSTERS 지은 JiEun 누나 - Aiya 아이야 댄스
talk 변동아이피 ....요거 은근히 불편하네요. ㅡㅡ;;
sports 토트넘 손흥민 2골 1어시스트, 토트넘 4위로 다시 도약
sports 토트넘 콘테 감독의 이른 손흥민 교체 합당했나?
dance 프리덤 윤서 님 - 씨스타 Loving U & So Cool & Touch My Body 댄스 버스킹 [누나…
sports 맨시티 덕배(=케빈 더 브라위너) 황희찬 울버햄튼 상대로 포트트릭 !!
girl 쌍거플 중요성 알려주는 누나
girl 회원 님 꿈속으로 가는 길을 잃어버린 처자
talk 쇼핑몰 무료배송 글자 낚시에 낚여서 하루 종일 고생
sports 2023 아시안컵 4강 요르단 vs 대한민국 하이라이트
dance BUSTERS (버스터즈) 타카라 님 댄스 - 빠빠빠 (Bar Bar Bar) + SHAKE IT
130/163
목록
찾아주셔서 감사합니다. Since 2012