잡다한 주제/기타 and 미분류

조합형 완성형

KSI 2005. 7. 28. 04:35

조합형과 완성형

한글은 자음 14개와 모음 10개로 글자를 표현하는데 초성, 중성, 종성을 조합하여 총 1만 1천 172가지의 글자를 표현할 수 있습니다. ( 받침 있는 글자 399자, 받침 없는 글자 10,773자 ) 그런데 이런 한글을 컴퓨터에서 표기하기 위해 만들어진 한글 코드는 처음에 표준안이 채택되지 않아 여러 가지 코드가 난무하게 되었고 크게는 조합형과 완성형으로 나누어지게 되었습니다. 조합형이란 한글의 자음과 모음을 코드화 해서 초성, 중성, 종성의 원리에 따라 한글을 표현하는 방식이며, 완성형은 완성된 글자에 코드를 부여하는 방식을 말합니다.

 

그렇다면 조합형과 완성형의 가장 큰 차이는 무엇일까요? 그건 바로 글자의 표현능력입니다. 조합형을 사용하면 한글 11,172자를 모두 표현할 수 있지만 완성형의 경우에는 코드가 부여된 2,350자만을 사용할 수가 있는 것이지요. 때문에 우리나라에서는 87년에 완성형을 표준으로 정했다가 91년에는 조합형 코드도 표준에 추가를 했습니다. 여기서 한가지 의문이 생기시는 분들이 많을 겁니다. 얼핏 보면 조합형 코드가 훨씬 좋아보이는데 왜 완성형을 먼저 표준으로 정한 것일까하는 의문이지요. 이 의문에 대합 해답은 바로 코드의 형태입니다. 조합형은 한글자를 만들기 위해 3바이트를 써야 하지만 완성형은 2바이트만 사용하면 되는 것이지요. 이는 프로그램을 한글화 할 때도 조합형보다는 완성형이 편하다는 의미이기도 합니다. 때문에 거의 모든 소프트웨어가 완성형을 사용했었고 조합형은 한글정도에서만 사용되었었지요. ( 한글과 컴퓨터에 박수.. ) 그럼 조합형과 완성형들간의 문제는 무엇이었을까요? 그건 바로 호환성이었습니다. 둘다 한글을 표현하는 방식이었지만 호환이 되지 않았기 때문에 서로 다른 코드를 읽으면 글자가 깨지게 되었던 거지요.

 

유니코드의 등장

세계의 많은 언어들이 통일된 언어코드가 없어 많은 불편이 생기자 전세계적으로 통일된 언어코드를 만들자는 움직임이 일어났고 그 결과 유니코드라는 획기적인 코드가 만들어지게 됩니다. 이 코드 덕분에 우리의 한글도 더 이상 완성형이다 조합형이다라고 고민할 필요가 없어졌지요. 유니코드라는 것은 '세계 문자 표준'이라고 할 수 있는 것으로, 세계 각국의 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 코드 규약을 말합니다. 유니코드는 최대 6만5천535자의 글자를 코드화할 수 있는데 3.0 버전에서는 5만7천709개의 글자들이 코드화 되어 있습니다. 한글 코드는 한글 자모 94자와, 옛글자를 포함한 조합형 한글 자모 240자, 현대 한글에서 쓰는 1만1천172자의 완성형 형태가 모두 포함되어 있습니다. 우리가 흔히 사용하는 윈도우 98에서는 유니코드를 기본으로 적용하고 있으며 윈도우 95에서는 'iso10646 .exe'라는 별도의 패치를 필요로 합니다.

 

현재는?

유니코드가 표준으로 자리를 잡으면서 서서히 조합형과 완성형에 대한 불편도 없어져 갔으며 현재는 한글 코드 표준이 유니코드로 자리를 잡아 조합형과 완성형을 모두 이용할 수 있고 컴퓨터에서 옛글자를 포함한 모든 한글을 우리의 어순에 맞게 표현할 수 있게 되었습니다. 하지만 이런 결과를 얻기 까지는 마이크로소프트의 확장 완성형 코드라는 무식한(?) 언어코드에 맞선 네티즌들의 노력이 있었고 수많은 관계자들의 노력이 있었습니다. 현재 우리는 아무런 불편없이 당연하게 '찦', '쓩' ,'똠', '펲' 등의 글자를 쓰지만 이런 글자를 제대로 사용하기까지 얼마나 많은 어려움과 많은분들의 노력이 있었는지 한번쯤 돌아보았으면 좋겠지요. 한글을 제대로 표현하기 위해 노력하신 많은 분들께 가족 여러분을 대신하여 감사하다는 말을 전합니다.
 

 출 처 : [기타]http://www.gamegru.co.kr/theme/computer/hancode.asp