Windows Vista対応 > サロゲートペア

サロゲートペア

◆サロゲートペアとは
 Unicodeは元々16ビットの文字コードだ。16ビットのコードを,16進数で書くと4桁になる。 
ところが16ビットしかないと,どうやっても最大6万5536字しか扱えない。 
一方,漢字は7万字も8万字も収録したいので,16進数4桁では無理になって, 
とうとう16進数5桁のところにハミ出ざるを得なくなった。

 Unicodeの方では,16進数5桁,つまり20ビットをそのままでは扱えないので, 
16ビットのコードを2つ組み合わせることで急場をしのいだ。例えば「2000B」であれば, 
実際には「D840 DC0B」という組み合わせで処理される。これが[[サロゲートペア]]だ。 
この場合には,1文字が16ビットではなく32ビットになる。

 「1文字=16ビット」と決め打ちになってるソフトウエアは,たちどころに処理が崩壊してしまう。
Windows XPのメモ帳ですら「D840 DC0B」を2文字と認識してしまう(Deleteは大丈夫だが,BackSpaceはダメだ)し,
ほかのソフトウエアでも似たようなことが起こったりする。

( http://itpro.nikkeibp.co.jp/article/COLUMN/20061211/256519/ より)


◆サロゲートペア一覧(画像版)
list.jpg

◆サロゲートペア一覧(テキスト版)
U+2000B
𠀋
U+2123D
𡈽
U+2131B
𡌛
U+2146E
𡑮
U+218BD
𡢽
U+20B9F
𠮟[2004]
U+216B4
𡚴
U+21E34
𡸴
U+231C4
𣇄
U+235C4
𣗄
U+2373F
𣜿
U+23763
𣝣
U+23CFE
𣳾
U+247F1
𤟱
U+2548E
𥒎
U+2550E
𥔎
U+25771
𥝱
U+259C4
𥧄
U+25DA1
𥶡
U+26AFF
𦫿
U+26E40
𦹀
U+270F4
𧃴
U+27684
𧚄
U+28277
𨉷
U+283CD
𨏍
U+2A190
𪆐
U+20089
𠂉
U+200A2
𠂢
U+200A4
𠂤
U+201A2
𠆢
U+20213
𠈓
U+2032B
𠌫
U+20381
𠎁
U+20371
𠍱
U+203F9
𠏹
U+2044A
𠑊
U+20509
𠔉
U+205D6
𠗖
U+20628
𠘨
U+2074F
𠝏
U+20807
𠠇
U+2083A
𠠺
U+208B9
𠢹
U+2097C
𠥼
U+2099D
𠦝
U+20AD3
𠫓
U+20B1D
𠬝
U+20D45
𠵅
U+20DE1
𠷡
U+20E95
𠺕
U+20E6D
𠹭
U+20E64
𠹤
U+20F5F
𠽟
U+21201
𡈁
U+21255
𡉕
U+2127B
𡉻
U+21274
𡉴
U+212E4
𡋤
U+212D7
𡋗
U+212FD
𡋽
U+21336
𡌶
U+21344
𡍄
U+213C4
𡏄
U+2146D
𡑭
U+215D7
𡗗
U+26C29
𦰩
U+21647
𡙇
U+21706
𡜆
U+21742
𡝂
U+219C3
𡧃
U+21C56
𡱖
U+21D2D
𡴭
U+21D45
𡵅
U+21D78
𡵸
U+21D62
𡵢
U+21DA1
𡶡
U+21D9C
𡶜
U+21D92
𡶒
U+21DB7
𡶷
U+21DE0
𡷠
U+21E33
𡸳
U+21F1E
𡼞
U+21F76
𡽶
U+21FFA
𡿺
U+2217B
𢅻
U+2231E
𢌞
U+223AD
𢎭
U+226F3
𢛳
U+2285B
𢡛
U+228AB
𢢫
U+2298F
𢦏
U+22AB8
𢪸
U+22B4F
𢭏
U+22B50
𢭐
U+22B46
𢭆
U+22C1D
𢰝
U+22BA6
𢮦
U+22C24
𢰤
U+22DE1
𢷡
U+231C3
𣇃
U+231F5
𣇵
U+231B6
𣆶
U+23372
𣍲
U+233D3
𣏓
U+233D2
𣏒
U+233D0
𣏐
U+233E4
𣏤
U+233D5
𣏕
U+233DA
𣏚
U+233DF
𣏟
U+2344A
𣑊
U+23451
𣑑
U+2344B
𣑋
U+23465
𣑥
U+234E4
𣓤
U+2355A
𣕚
U+23594
𣖔
U+23639
𣘹
U+23647
𣙇
U+23638
𣘸
U+2363A
𣘺
U+2371C
𣜜
U+2370C
𣜌
U+23764
𣝤
U+237FF
𣟿
U+237E7
𣟧
U+23824
𣠤
U+2383D
𣠽
U+23A98
𣪘
U+23C7F
𣱿
U+23D00
𣴀
U+23D40
𣵀
U+23DFA
𣷺
U+23DF9
𣷹
U+23DD3
𣷓
U+23F7E
𣽾
U+24096
𤂖
U+24103
𤄃
U+241C6
𤇆
U+241FE
𤇾
U+243BC
𤎼
U+24629
𤘩
U+246A5
𤚥
U+24896
𤢖
U+24A4D
𤩍
U+24B56
𤭖
U+24B6F
𤭯
U+24C16
𤰖
U+24D14
𤴔
U+24E0E
𤸎
U+24E37
𤸷
U+24E6A
𤹪
U+24E8B
𤺋
U+2504A
𥁊
U+25055
𥁕
U+25122
𥄢
U+251A9
𥆩
U+251E5
𥇥
U+251CD
𥇍
U+2521E
𥈞
U+2524C
𥉌
U+2542E
𥐮
U+254D9
𥓙
U+255A7
𥖧
U+257A9
𥞩
U+257B4
𥞴
U+259D4
𥧔
U+25AE4
𥫤
U+25AE3
𥫣
U+25AF1
𥫱
U+25BB2
𥮲
U+25C4B
𥱋
U+25C64
𥱤
U+25E2E
𥸮
U+25E56
𥹖
U+25E65
𥹥
U+25E62
𥹢
U+25ED8
𥻘
U+25EC2
𥻂
U+25EE8
𥻨
U+25F23
𥼣
U+25F5C
𥽜
U+25FE0
𥿠
U+25FD4
𥿔
U+2600C
𦀌
U+25FFB
𥿻
U+26017
𦀗
U+26060
𦁠
U+260ED
𦃭
U+26270
𦉰
U+26286
𦊆
U+2634C
𦍌
U+23D0E
𣴎
U+26402
𦐂
U+2667E
𦙾
U+266B0
𦚰
U+2671D
𦜝
U+268DD
𦣝
U+268EA
𦣪
U+26951
𦥑
U+2696F
𦥯
U+269DD
𦧝
U+26A1E
𦨞
U+26A58
𦩘
U+26A8C
𦪌
U+26AB7
𦪷
U+26C73
𦱳
U+26CDD
𦳝
U+26E65
𦹥
U+26F94
𦾔
U+26FF8
𦿸
U+26FF6
𦿶
U+26FF7
𦿷
U+2710D
𧄍
U+27139
𧄹
U+273DB
𧏛
U+273DA
𧏚
U+273FE
𧏾
U+27410
𧐐
U+27449
𧑉
U+27615
𧘕
U+27614
𧘔
U+27631
𧘱
U+27693
𧚓
U+2770E
𧜎
U+27723
𧜣
U+27752
𧝒
U+27985
𧦅
U+27A84
𧪄
U+27BB3
𧮳
U+27BBE
𧮾
U+27BC7
𧯇
U+27CB8
𧲸
U+27DA0
𧶠
U+27E10
𧸐
U+27FB7
𧾷
U+2808A
𨂊
U+280BB
𨂻
U+28282
𨊂
U+282F3
𨋳
U+2840C
𨐌
U+28455
𨑕
U+2856B
𨕫
U+285C8
𨗈
U+285C9
𨗉
U+286D7
𨛗
U+286FA
𨛺
U+28949
𨥉
U+28946
𨥆
U+2896B
𨥫
U+28987
𨦇
U+28988
𨦈
U+289BA
𨦺
U+289BB
𨦻
U+28A1E
𨨞
U+28A29
𨨩
U+28A71
𨩱
U+28A43
𨩃
U+28A99
𨪙
U+28ACD
𨫍
U+28AE4
𨫤
U+28ADD
𨫝
U+28BC1
𨯁
U+28BEF
𨯯
U+28D10
𨴐
U+28D71
𨵱
U+28DFB
𨷻
U+28E1F
𨸟
U+28E36
𨸶
U+28E89
𨺉
U+28EEB
𨻫
U+28F32
𨼲
U+28FF8
𨿸
U+292A0
𩊠
U+292B1
𩊱
U+29490
𩒐
U+295CF
𩗏
U+2967F
𩙿
U+296F0
𩛰
U+29719
𩜙
U+29750
𩝐
U+298C6
𩣆
U+29A72
𩩲
U+29DDB
𩷛
U+29E3D
𩸽
U+29E15
𩸕
U+29E8A
𩺊
U+29E49
𩹉
U+29EC4
𩻄
U+29EE9
𩻩
U+29EDB
𩻛
U+29FCE
𩿎
U+2A02F
𪀯
U+2A01A
𪀚
U+2A0F9
𪃹
U+2A082
𪂂
U+22218
𢈘
U+2A38C
𪎌
U+2A437
𪐷
U+2A5F1
𪗱
U+2A602
𪘂
U+2A61A
𪘚
U+2A6B2
𪚲


&br;

添付ファイル: filelist.jpg 800件 [詳細]

トップ   差分 バックアップ リロード   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-03-17 (水) 13:21:34 (5147d)