2005. 11. 17. 14:43

어쩌다 눈에 띄여 사버린 3000원짜리 머그컵 '-'

색상도 박힌 글씨도 은근 여러가지였는데

난 역시 리블-_-.. 암튼 리블로 골라버렸다..



'Privacy > Real' 카테고리의 다른 글

지식의 충격과 신의 죽음  (4) 2005.11.20
새로움  (2) 2005.11.17
# - 2k05.11.14  (2) 2005.11.14
위대한 캣츠비  (0) 2005.11.14
azki's personality #11  (0) 2005.11.14
Posted by 아즈키
2005. 11. 16. 19:35
W.S. #01

첫번째 이야기다.

생각이 나는대로 쓰기에 역시 두서도 없고 별것도없다 진짜로

어차피 자기만족이기에 -_-.. 아무튼 시작한다 첫번째..


이야기의 시작은 비밀?들의 존재다..

작성자(프로그래머)에게 보고를 하면 바로 패치가 될텐데..

그리고 많은 사람들의 사생활이 보호되고, 크래킹의 피해를 줄일 수 있을테지만..

이러한 비밀들은 적어도 수십명이 알고 있지만, 패치를 위해 공개되지 않았다..

물론, 그들은 올바른 정신의 소유자들이며, 이것을 악용하지 않는다고 난 믿고있다.

어째뜬 나를 포함한 그들 모두는 공유하고 있는 이 비밀들을 아직 지키고있다

그것이 올바르게 보이는 그들의 정신에 위배되는 것이지만 말이다


이점에 대해 변명하자면 하나는 소유권의 문제다..

그렇다 나를 포함한 많은 사람들은 이 것들을 스스로 알아내진 않았다

적어도 몇개의 비밀들은 공유등을 통해서 알게 되었다..

그래서 스스로는 이것에 대해 자격이 없음을 느낀다..

이것은 한사람만의 것도 아닌 것이고, 게다가 한사람을 꼽는다 해도 자신은 아니기 때문에..


또 하나는 비밀에 대한 책임감이다

자신이 마치 고대 비밀의 수호자라도 된듯 비밀을 지키고있다

그동안 지켜왔던 비밀에 대한 관습적 행동.

하지만 진심으로 생각건대 비밀의 누설은 모두에게 미안한 일이 맞다.

그리고 미안한걸 떠나서 그것에 대한 책임의 결과는 앞으로 얻게될 비밀과도 연관된다.


그리고 마지막으로 생각 나는 단어는 자존심

인간은 본질적으로 특권을 갖고 싶어한다. 특권의 자존심이다..

비밀이 그들에겐 하나의 특권이 되고, 이 비밀의 특성상 특권적인 행동을 취할수도 있다.

그리고 몇몇의 꽤 비밀스러운 비밀은 그 자체로 자존심이 되기도 한다.

비밀을 알고 있는 그들을 동경해주는 누군가가 있기 때문에 더욱 숨기게된다


결론은 역시 자기, 자신을 위한 것이란 것이다.. 모든 것이 그렇듯..

비밀의 소유권이나 책임감보다는 말이다.. // 사실 그건 그렇게 중요하지도 않다-_-

나역시 누려왔던 특권들을 버리지 못하고있다 아직도.. '-'

'Hobby > Computer' 카테고리의 다른 글

linux command  (4) 2006.05.15
프로그래머만 이해하는 말들 -_-  (1) 2006.04.14
UTF-8  (0) 2005.11.15
PHP memory_limit Exploit Code  (0) 2005.11.15
Server Push  (0) 2005.11.15
Posted by 아즈키
2005. 11. 15. 12:19
UTF-8은 모든 Unicode 문자를 1바이트에서 4바이트까지 가변폭 바이트 스트림으로 인코딩한다.
6바이트가 아님. ISO JTC1/SC2/WG2는 공식적으로 ISO 10646에서 UTF-16으로 표현 가능한 상한선인 U+10FFFF를 넘는 범위에 문자를 배정하지 않으리라고 결정했고, Unicode Technical Committee는 그에 앞서 같은 결정을 내렸다.


하나의 Unicode 문자를 몇 바이트로 인코딩할지는 해당 글자에 할당된 코드값 (Unicode Scalar Value)에 따라 결정할 수 있다. U+007F까지는 1 바이트, U+0080에서 U+07FF까지는 2 바이트, U+0800에서 U+FFFF까지는 3 바이트, U+10000에서 U+10FFFF까지는 4 바이트를 쓴다. 따라서 US-ASCII에 속하는 문자는 U+0000 (NULL)을 포함해서 UTF-8에서는 한 바이트로 표현할 수 있다. 이 특성은 US-ASCII와 호환성을 유지해야 하는 유닉스 파일 시스템1, SMTP (인터넷 메일)를 비롯한 텍스트 기반인 여러 인터넷 프로토콜에서 쓰기에 적합하다.

Unicode를 인코딩하는 방법으로는 UTF-7, UTF-8, UTF-16, UTF-32 등 여러 가지 방법이 있다.
TeX에서는 주로 UTF-8을 사용하는데, CJK 문자는 U+0800 이후에 할당되어 있으므로 UTF-8에서 3 바이트를 써서 나타내야 한다. 반면에 UTF-16을 쓸 경우에는 CJK 글자를 포함해서 모든 BMP (Basic Multilingual Plane : Unicode 중 처음 65,536 코드 포인트)에 속하는 글자는 2 바이트로 나타낸다. 이런 이유로 UTF-16을 선호하는 경우가 있으나 (UTF-8이 UTF-16에 비해 최대 1.5배 더 많은 저장 공간/송신 시간을 요하므로) US-ASCII와의 호환성은 많은 경우에 대단히 중요하므로, Unix(Mac OS X)와 ?BeOS 등은 텍스트 형식과 그와 유사한 형식에서 UTF-8을 주로 쓴다. 같은 이유로 TeX/Omega에서도 UTF-8을 주로 쓴다. 반면에 Win32에서는 텍스트 문서 형식도 기본으로는 UTF-16을 사용한다.


텍스트 형식과 OS나 프로그램 혹은 라이브러리 내부에서 어떤 인코딩을 쓰느냐는 별개의 문제이다. Linux glibc는 UTF-32를 쓰고, Mac OS X, Win32, Omega, ICU (International Component for Unicode), Java, ECMAscript2, Mozilla 등은 UTF-16을 쓰고, ?BeOS, glib, Perl 등은 UTF-8을 쓴다. Python은 UTF-32 혹은 UCS-2 (2byte 혹은 4byte를 쓰는 가변폭 인코딩인 UTF-16과 달리 UCS-2는 2byte 고정폭 인코딩으로 오직 BMP만 지원할 수 있다.)를 쓰도록 컴파일할 수 있다.
UTF-32는 가변폭 인코딩인 UTF-16을 다루는데서 오는 불편함3을 피할 수 있는 반면에 UTF-8에 비해 최대 4배의 공간(US-ASCII에 속하는 글자라면)을, UTF-16에 비해서도 최대 2배 (BMP에 속하는 글자의 경우)의 공간을 쓴다는 단점이 있다.

IETF RFC :
http://www.cse.ohio-state.edu/cgi-bin/rfc/rfc2279.html

UTF-8, UTF-16, UTF-32 & BOM :
http://www.unicode.org/unicode/faq/utf_bom.html


옛날엔 UTF-8은 1byte or 3byte 인줄 알았는데 -_-;;

'Hobby > Computer' 카테고리의 다른 글

프로그래머만 이해하는 말들 -_-  (1) 2006.04.14
W.S. #01  (4) 2005.11.16
PHP memory_limit Exploit Code  (0) 2005.11.15
Server Push  (0) 2005.11.15
Zeroboard 4.x "preg_replace" Remote Command Execution Exploit  (2) 2005.11.15
Posted by 아즈키