• 회원가입
  • 로그인
  • 구글아이디로 로그인

[web] (utf-8 / euc-kr) 차이점 - 문자셋 인코딩 방식 종류

1,989  

목차

  1. UTF-8 (Unicode Transformation Format - 8-bit)
  2. EUC-KR (Extended Unix Code-KR)
  3. 선택 시 고려사항

둘 다, 문자 인코딩 방식으로, 서로 다른 방식으로 문자를 표현하고 전송함. 

 

UTF-8 (Unicode Transformation Format - 8-bit)

 

1. 문자 표현 방식

  • UTF-8은 Unicode 문자 집합을 표현하기 위한 가변 길이 인코딩 방식임 (각 문자는 1~4바이트까지 다양한 크기로 표현)
  • ASCII 문자는 1바이트로 표현되며, 다국어 문자는 2바이트 이상으로 표현됨.


2. 다국어 지원

  • UTF-8은 모든 유니코드 문자를 지원하므로 전 세계의 거의 모든 문자를 나타낼 수 있음.
  • UTF-8은 유니코드 표준을 기반으로 하기 때문에 다양한 언어와 기호체계를 포함함.


3. 호환성

  • UTF-8은 ASCII와 역호환성이 있음. (즉, ASCII로 표현된 문서는 UTF-8로 인코딩되어도 동일한 결과를 보임.)

 

 

EUC-KR (Extended Unix Code-KR)

 

1. 문자 표현 방식

  • EUC-KR은 대부분의 한국어 문자를 2바이트로 표현하는 고정 길이 인코딩방식. (ASCII 문자는 1바이트로 표현되고, 한국어 문자는 2바이트로 표현)

 

2. 다국어 지원

  • EUC-KR은 주로 한국어를 위한 인코딩이며, 한글 외의 문자에 대한 지원은 부족함.
  • 다국어 환경에서 사용하기에는 제한적임.


3. 호환성

  • EUC-KR은 ASCII와는 호환성이 있지만, 다른 인코딩 방식과의 호환성은 제한적임.

 

 

선택 시 고려사항

 

  • 다국어 지원 여부: UTF-8 선택. (UTF-8은 대부분의 언어 및 문자를 지원하며, 글로벌 웹에서 널리 사용됨.)
  • 주로 한국어 여부: EUC-KR은 한국어 텍스트에 특화되어 있음. 그러나, 현대 웹 환경에서는 UTF-8 사용 권장됨.
  • 파일 크기의 고려: UTF-8은 가변 길이 인코딩이므로 파일 크기가 증가할 수 있음. 그러나 현대 시스템에서는 크게 걱정할 필요 없음.

 

결론: 묻지도 따지지도 말고, UTF-8 선택. (그누보드도 최근엔 UTF-8만 지원.)

 


분류 제목
ucc 턱시도 고양이 추울까봐 옷 여미어주는 집사
web 무료호스팅 사이트 모음
talk 코드 몇 줄 수정/추가 하는 데 하루 이상 소요
ucc 층간 소음으로 입주민들 다 내쫒는 얌체 4층 입주민 고양이 [동물/유머]
talk BTS + KPOP 스타들, 일본 도쿄 올림픽 기간 동안 독도에서 콘서트 진행
sports 승리하는 법을 잊어버린 리버풀
dance 하지원 치어리더 님 유난히 검은 긴 생머리 찰랑찰랑 댄스
drama 어느날 여동생 3명이 생겼다. EP3 - 여동생들과 노숙자가 됐다 [웹드라마]
dance 매력적인 효이 님 카라 스텝 댄스
health 헬스장에 간 맑눈광 님 따라 코딩 준비운동 하기
web 사용자 입력값 받아 표시하기 시스템 이해하기
talk 구글 애드센스에서 GDPR 메시지 만드라고 알람 떴는데...
talk 유튜브 퍼가기 허용 후 나중에 펌 금지 시 저작권 권리행사
girl 앨리스 소희 님 대항마 두디 님 (에잇세컨즈 강남점 쇼핑/둘러보기)
dance 이라은 님 트와이스 TT(티티) 댄스 COVER
dance 브라더 루이 댄스
talk 물건도 안 보내면서 택배 송장만 먼저 접수시키는 경우
ucc 흙수저 괴롭히는 금수저 일진녀를 참교육하는 다이아수저 팡팡그룹 도련님
talk 교수가 학생에게 과도하게 레포트 내준 결과
health 오늘부터 히동이 따라서 헬스 스쿼드 10개씩 10세트 하기로 다짐
85/163
목록
찾아주셔서 감사합니다. Since 2012