• 회원가입
  • 로그인
  • 구글아이디로 로그인

[web] (utf-8 / euc-kr) 차이점 - 문자셋 인코딩 방식 종류

1,856  

목차

  1. UTF-8 (Unicode Transformation Format - 8-bit)
  2. EUC-KR (Extended Unix Code-KR)
  3. 선택 시 고려사항

둘 다, 문자 인코딩 방식으로, 서로 다른 방식으로 문자를 표현하고 전송함. 

 

UTF-8 (Unicode Transformation Format - 8-bit)

 

1. 문자 표현 방식

  • UTF-8은 Unicode 문자 집합을 표현하기 위한 가변 길이 인코딩 방식임 (각 문자는 1~4바이트까지 다양한 크기로 표현)
  • ASCII 문자는 1바이트로 표현되며, 다국어 문자는 2바이트 이상으로 표현됨.


2. 다국어 지원

  • UTF-8은 모든 유니코드 문자를 지원하므로 전 세계의 거의 모든 문자를 나타낼 수 있음.
  • UTF-8은 유니코드 표준을 기반으로 하기 때문에 다양한 언어와 기호체계를 포함함.


3. 호환성

  • UTF-8은 ASCII와 역호환성이 있음. (즉, ASCII로 표현된 문서는 UTF-8로 인코딩되어도 동일한 결과를 보임.)

 

 

EUC-KR (Extended Unix Code-KR)

 

1. 문자 표현 방식

  • EUC-KR은 대부분의 한국어 문자를 2바이트로 표현하는 고정 길이 인코딩방식. (ASCII 문자는 1바이트로 표현되고, 한국어 문자는 2바이트로 표현)

 

2. 다국어 지원

  • EUC-KR은 주로 한국어를 위한 인코딩이며, 한글 외의 문자에 대한 지원은 부족함.
  • 다국어 환경에서 사용하기에는 제한적임.


3. 호환성

  • EUC-KR은 ASCII와는 호환성이 있지만, 다른 인코딩 방식과의 호환성은 제한적임.

 

 

선택 시 고려사항

 

  • 다국어 지원 여부: UTF-8 선택. (UTF-8은 대부분의 언어 및 문자를 지원하며, 글로벌 웹에서 널리 사용됨.)
  • 주로 한국어 여부: EUC-KR은 한국어 텍스트에 특화되어 있음. 그러나, 현대 웹 환경에서는 UTF-8 사용 권장됨.
  • 파일 크기의 고려: UTF-8은 가변 길이 인코딩이므로 파일 크기가 증가할 수 있음. 그러나 현대 시스템에서는 크게 걱정할 필요 없음.

 

결론: 묻지도 따지지도 말고, UTF-8 선택. (그누보드도 최근엔 UTF-8만 지원.)

 


분류 제목
girl 회원 님, 또 코딩공부하러 오실거죠? 누나
sports 나폴리 김민재 약점 노출 (나폴리 연승 도전 실패)
talk 일본 아베 전 총리가 총격으로 결국엔 사망
news 이글루스 블로그 서비스 종료일 (2023.06.16)
sports 대한민국 월드컵 우승 길목을 지키고 있는 상대팀 (= 카타르 월드컵 16강 진출 국가 리스트)
ucc 여친과 만나는 중 전여친에게서 문자가 왔다 [웹드라마]
sports 애들아, 왜 싸워? 싸우지 마 !!
sports 토트넘 손흥민 골로 4위 도약하나 싶었는데, 아쉽게...
drama 미녀에게 인기 많은 츤데레 찐빵남 [웹드라마]
dance STAYC (스테이씨) 아이사 님 댄스 - Bubble 버블, Teddy Bear 테디베어, ASAP 에이셉
ucc 회원 님을 웃게 해줄 고양이 삼총사
dance 열대야 댄스
sports 손흥민, 뉴캐슬 전 1골 1어시. 14골로 득점 공동 2위
dance 중독성 쩌는 엉덩이 흔들기 댄스
sports 전반전은 나폴리(김민재), 후반전은 토트넘(손흥민) 경기 봤는데... (※ 손흥민을 영입하려고 하는 유력 축…
military 전국 하늘에서 발견된 미확인 물체 정체는 고체 추친 미사일 발사체
dance 코딩공부 시작 전 준비운동 댄스
talk 디즈니 드라마 「무빙」 10~11화 - 구룡포 액선&멜로
ucc 이웃집 토토로 닮은 고양이
health 남성 전립선 (암 /비대증) 예방 대책
39/163
목록
찾아주셔서 감사합니다. Since 2012