CP949 인코딩이란?

IT관련/C#

CP949 인코딩이란?

파란하늘999 2025. 10. 27. 17:26

CP949는 한국어 텍스트를 처리하기 위한 문자 인코딩 방식으로, 주로 Microsoft Windows 환경에서 사용되는 한국어 기본 코드 페이지입니다. 한글과 영어를 포함한 다국어 지원을 위해 개발되었으며, EUC-KR의 확장 버전으로 알려져 있습니다. '통합 완성형' 또는 '확장 완성형'이라고도 불리며, 웹 개발이나 파일 처리 시 자주 마주치는 인코딩 문제의 원인이 되기도 합니다. 이 글에서는 CP949의 기본 개념, 역사, 특징, 그리고 티스토리 블로그 운영 시 유용한 팁을 간단히 정리하겠습니다.

1. CP949의 기본 개념

정의: 컴퓨터가 텍스트를 숫자로 변환하는 '인코딩' 방식 중 하나. CP949는 한글 문자를 2바이트로 표현하는 고정 길이 인코딩으로, KS C 5601 표준을 기반으로 합니다. ASCII(영문)와 한글을 함께 처리할 수 있어 Windows의 기본 설정으로 채택되었습니다.
왜 필요한가?: 과거 컴퓨터는 한글을 제대로 표시하지 못했는데, CP949는 이를 해결하기 위해 개발된 '완성형' 코드(초성·중성·종성 조합으로 완성된 글자)입니다. 예를 들어, '가'는 별도의 코드로 저장되어 깨짐 현상을 방지합니다.

2. 역사와 배경

개발 배경: 1990년대 Microsoft가 Windows 95용으로 EUC-KR을 확장해 만들었습니다. EUC-KR(한국 표준 인코딩)이 일부 한글 문자를 커버하지 못하자, 이를 보완한 버전으로 등장했습니다.
현재 상태: Windows 10/11에서도 여전히 기본이지만, 웹 표준으로는 UTF-8이 대세입니다. (2025년 기준, 유니코드 전환이 진행 중이지만 레거시 시스템에서 자주 보입니다.)

3. 주요 특징

특징	설명	예시
바이트 길이	고정 2바이트 (한글) / 1바이트 (ASCII)	'안녕' → 4바이트
지원 문자	KS X 1001 한글 11,172자 + 추가 확장 문자 (총 23,540자)	EUC-KR보다 더 많은 한글 포함
장점	Windows 호환성 높음, 파일 크기 효율적	엑셀/워드 파일 처리 시 안정적
단점	유니코드와 호환성 낮아 웹에서 깨짐 발생	UTF-8로 변환 필요

인코딩 예시: Python에서 확인해보면 text.encode('cp949')으로 변환 가능. (코드 실행 시 에러 발생 시 errors='ignore' 옵션 추가.)

4. EUC-KR / UTF-8과의 비교

EUC-KR: 한국 표준 인코딩. CP949의 기반이지만, 일부 한글(예: 'ㆍ' 같은 특수문자) 미지원. CP949는 이를 모두 커버합니다.
UTF-8: 유니코드 기반 가변 길이(1~4바이트). 웹/모바일 표준으로, CP949보다 범용적. 하지만 CP949 파일을 UTF-8로 읽을 때 UnicodeDecodeError 에러가 발생할 수 있습니다.

인코딩	기반	바이트	주요 용도
CP949	MS Windows	2바이트 고정	데스크톱 앱
EUC-KR	KS C 5601	2바이트 고정	Unix/Linux
UTF-8	Unicode	1~4바이트 가변	웹/모바일

CP949는 레거시지만, 여전히 Windows 중심 작업에서 필수입니다.

'IT관련 > C#' 카테고리의 다른 글

Serilog 사용법 정리 (1)	2025.11.14
.NET의 Encoding.RegisterProvider(CodePagesEncodingProvider.Instance)란? (0)	2025.10.27
C# 원격 디버깅 자격 증명: MS 계정 이메일의 'abc'만 입력하는 이유 완벽 해부 (0)	2025.10.23
C# 원격 디버깅 통신 메커니즘: 깊이 파헤치기 (상세 버전) (0)	2025.10.23
VS2017: "원격 컴퓨터 사용" 옵션 vs. "디버그 > 프로세스에 연결" 차이점 완벽 정리 (1)	2025.10.23

현재글CP949 인코딩이란?

파란하늘 님의 블로그

파란하늘 님의 블로그 입니다.

#전기요금계산 #전기요금, #지하철 #출퇴근 #또타지하철 #칸별혼잡도 #카카오맵 #지하철앱 #서울지하철 #초정밀지하철, #지하철 #스크린도어 #역명표시 #대구지하철 #수도권지하철 #교통안전, #피드 #feed #소셜미디어 #유튜브 #영어어원 #인스타그램 #SNS용어, #조선왕족 #황사손 #전주이씨 #이원 #이홍 #대한제국후손, #T1WIN #Grok5 #페이커 #LoL, #캐스팅보트 #한국정치 #총선 #대선 #제3지대 #국회정치 #정치입문 #시사상식, #치아재생 #임플란트대체 #재생의학 #치과미래 #USAG1, #2026년운세 #띠별운세 #별자리운세, #쌤소나이트 #Samsonite #여행가방 #캐리어추천 #브랜드스토리, #현대자동차 #PLEOX #플레옥스 #미래모빌리티 #자율주행 #PBV #CES2025 #전기차, #나리타익스프레스 #NEX #나리타공항 #도쿄교통 #JR패스 #일본여행꿀팁, 국민연금 소득 감액 2025, #스마트폰구매 #핸드폰할인 #중고폰 #알뜰폰 #자급제 #단통법폐지 #2025핸드폰팁, #조지아여행 #무비자1년 #디지털노마드 #은퇴이민, #대한항공 #좌석지정 #항공권예약 #여행팁 #티스토리여행, #Angular #TDD #Jasmine #Karma #done #fakeAsync #RxJS #테스트 #비동기, #크롬단축키 #구글크롬 #단축키모음 #크롬꿀팁 #윈도우단축키 #브라우저단축키 #생산성업, #감기 #감기의역설 #위생가설 #건강상식 #winterhealth, #마라톤 #풀코스 #사점 #데드포인트 #러닝팁 #마라톤완주 #러너스하이,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

파란하늘 님의 블로그

CP949 인코딩이란?

1. CP949의 기본 개념

2. 역사와 배경

3. 주요 특징

4. EUC-KR / UTF-8과의 비교

'IT관련 > C#' 카테고리의 다른 글

'IT관련/C#'의 다른글

티스토리툴바

CP949 인코딩이란?

1. CP949의 기본 개념

2. 역사와 배경

3. 주요 특징

4. EUC-KR / UTF-8과의 비교

'IT관련 > C#' 카테고리의 다른 글

'IT관련/C#'의 다른글

관련글

티스토리툴바