• 회원가입
  • 로그인
  • 구글아이디로 로그인

[web] (utf-8 / euc-kr) 차이점 - 문자셋 인코딩 방식 종류

1,834  

목차

  1. UTF-8 (Unicode Transformation Format - 8-bit)
  2. EUC-KR (Extended Unix Code-KR)
  3. 선택 시 고려사항

둘 다, 문자 인코딩 방식으로, 서로 다른 방식으로 문자를 표현하고 전송함. 

 

UTF-8 (Unicode Transformation Format - 8-bit)

 

1. 문자 표현 방식

  • UTF-8은 Unicode 문자 집합을 표현하기 위한 가변 길이 인코딩 방식임 (각 문자는 1~4바이트까지 다양한 크기로 표현)
  • ASCII 문자는 1바이트로 표현되며, 다국어 문자는 2바이트 이상으로 표현됨.


2. 다국어 지원

  • UTF-8은 모든 유니코드 문자를 지원하므로 전 세계의 거의 모든 문자를 나타낼 수 있음.
  • UTF-8은 유니코드 표준을 기반으로 하기 때문에 다양한 언어와 기호체계를 포함함.


3. 호환성

  • UTF-8은 ASCII와 역호환성이 있음. (즉, ASCII로 표현된 문서는 UTF-8로 인코딩되어도 동일한 결과를 보임.)

 

 

EUC-KR (Extended Unix Code-KR)

 

1. 문자 표현 방식

  • EUC-KR은 대부분의 한국어 문자를 2바이트로 표현하는 고정 길이 인코딩방식. (ASCII 문자는 1바이트로 표현되고, 한국어 문자는 2바이트로 표현)

 

2. 다국어 지원

  • EUC-KR은 주로 한국어를 위한 인코딩이며, 한글 외의 문자에 대한 지원은 부족함.
  • 다국어 환경에서 사용하기에는 제한적임.


3. 호환성

  • EUC-KR은 ASCII와는 호환성이 있지만, 다른 인코딩 방식과의 호환성은 제한적임.

 

 

선택 시 고려사항

 

  • 다국어 지원 여부: UTF-8 선택. (UTF-8은 대부분의 언어 및 문자를 지원하며, 글로벌 웹에서 널리 사용됨.)
  • 주로 한국어 여부: EUC-KR은 한국어 텍스트에 특화되어 있음. 그러나, 현대 웹 환경에서는 UTF-8 사용 권장됨.
  • 파일 크기의 고려: UTF-8은 가변 길이 인코딩이므로 파일 크기가 증가할 수 있음. 그러나 현대 시스템에서는 크게 걱정할 필요 없음.

 

결론: 묻지도 따지지도 말고, UTF-8 선택. (그누보드도 최근엔 UTF-8만 지원.)

 


분류 제목
ucc 열라 쿨한 사람들 [유머]
talk 피를 하나도 빨아먹지 못 한 모기 잡고 든 생각
dance 하이큐티-제이 (HI CUTIE-J) 윤정, 유진 님 댄스 - BBHMM & No Thanks & 챔피온
girl 윗옷 지퍼가 잘 안 잠기는 누나
talk 1page 웹사이트로 10억 번 이야기
ucc 이웃집 토토로 닮은 고양이
dance 직딩이 금요일 출근할 때 추는 댄스
talk 새벽에 (뮌헨 : 맨유) 챔스 예선 축구경기 봤어요.
talk 빨래건조기 하나 장만해야 할 듯... ㅜㅜ
sports 손흥민, 뉴캐슬 전 1골 1어시. 14골로 득점 공동 2위
health 남성 전립선 (암 /비대증) 예방 대책
sports 프로 골퍼 김은선 님 멋진 경치 골프 필드샷
dance 비 오는 숲속에서 뉴진스 아니고 누진세(?) 댄스 추는 누나
dance 열대야 댄스
money 유튜버 애드센스 수익 세금세무안내 #1. 사업자등록 필수 여부
military 전국 하늘에서 발견된 미확인 물체 정체는 고체 추친 미사일 발사체
military 중국 고체 추친 미사일 발사 실험에 자극 받아 대한민국도 실험한 듯.
girl 골프 스윙폼 끝내주는 미니스커트 누나
news 이글루스 블로그 서비스 종료일 (2023.06.16)
dance 김시엘 치어리더 남 댄스 'I AM'
124/163
목록
찾아주셔서 감사합니다. Since 2012