Windows Vista対応 > サロゲートペア
サロゲートペア †
◆サロゲートペアとは
Unicodeは元々16ビットの文字コードだ。16ビットのコードを,16進数で書くと4桁になる。
ところが16ビットしかないと,どうやっても最大6万5536字しか扱えない。
一方,漢字は7万字も8万字も収録したいので,16進数4桁では無理になって,
とうとう16進数5桁のところにハミ出ざるを得なくなった。
Unicodeの方では,16進数5桁,つまり20ビットをそのままでは扱えないので,
16ビットのコードを2つ組み合わせることで急場をしのいだ。例えば「2000B」であれば,
実際には「D840 DC0B」という組み合わせで処理される。これが[[サロゲートペア]]だ。
この場合には,1文字が16ビットではなく32ビットになる。
「1文字=16ビット」と決め打ちになってるソフトウエアは,たちどころに処理が崩壊してしまう。
Windows XPのメモ帳ですら「D840 DC0B」を2文字と認識してしまう(Deleteは大丈夫だが,BackSpaceはダメだ)し,
ほかのソフトウエアでも似たようなことが起こったりする。
( http://itpro.nikkeibp.co.jp/article/COLUMN/20061211/256519/ より)
◆サロゲートペア一覧(画像版)
◆サロゲートペア一覧(テキスト版)U+2000B 𠀋 | U+2123D 𡈽 | U+2131B 𡌛 | U+2146E 𡑮 | U+218BD 𡢽 | U+20B9F 𠮟[2004] | U+216B4 𡚴 | U+21E34 𡸴 | U+231C4 𣇄 | U+235C4 𣗄 |
U+2373F 𣜿 | U+23763 𣝣 | U+23CFE 𣳾 | U+247F1 𤟱 | U+2548E 𥒎 | U+2550E 𥔎 | U+25771 𥝱 | U+259C4 𥧄 | U+25DA1 𥶡 | U+26AFF 𦫿 |
U+26E40 𦹀 | U+270F4 𧃴 | U+27684 𧚄 | U+28277 𨉷 | U+283CD 𨏍 | U+2A190 𪆐 | U+20089 𠂉 | U+200A2 𠂢 | U+200A4 𠂤 | U+201A2 𠆢 |
U+20213 𠈓 | U+2032B 𠌫 | U+20381 𠎁 | U+20371 𠍱 | U+203F9 𠏹 | U+2044A 𠑊 | U+20509 𠔉 | U+205D6 𠗖 | U+20628 𠘨 | U+2074F 𠝏 |
U+20807 𠠇 | U+2083A 𠠺 | U+208B9 𠢹 | U+2097C 𠥼 | U+2099D 𠦝 | U+20AD3 𠫓 | U+20B1D 𠬝 | U+20D45 𠵅 | U+20DE1 𠷡 | U+20E95 𠺕 |
U+20E6D 𠹭 | U+20E64 𠹤 | U+20F5F 𠽟 | U+21201 𡈁 | U+21255 𡉕 | U+2127B 𡉻 | U+21274 𡉴 | U+212E4 𡋤 | U+212D7 𡋗 | U+212FD 𡋽 |
U+21336 𡌶 | U+21344 𡍄 | U+213C4 𡏄 | U+2146D 𡑭 | U+215D7 𡗗 | U+26C29 𦰩 | U+21647 𡙇 | U+21706 𡜆 | U+21742 𡝂 | U+219C3 𡧃 |
U+21C56 𡱖 | U+21D2D 𡴭 | U+21D45 𡵅 | U+21D78 𡵸 | U+21D62 𡵢 | U+21DA1 𡶡 | U+21D9C 𡶜 | U+21D92 𡶒 | U+21DB7 𡶷 | U+21DE0 𡷠 |
U+21E33 𡸳 | U+21F1E 𡼞 | U+21F76 𡽶 | U+21FFA 𡿺 | U+2217B 𢅻 | U+2231E 𢌞 | U+223AD 𢎭 | U+226F3 𢛳 | U+2285B 𢡛 | U+228AB 𢢫 |
U+2298F 𢦏 | U+22AB8 𢪸 | U+22B4F 𢭏 | U+22B50 𢭐 | U+22B46 𢭆 | U+22C1D 𢰝 | U+22BA6 𢮦 | U+22C24 𢰤 | U+22DE1 𢷡 | U+231C3 𣇃 |
U+231F5 𣇵 | U+231B6 𣆶 | U+23372 𣍲 | U+233D3 𣏓 | U+233D2 𣏒 | U+233D0 𣏐 | U+233E4 𣏤 | U+233D5 𣏕 | U+233DA 𣏚 | U+233DF 𣏟 |
U+2344A 𣑊 | U+23451 𣑑 | U+2344B 𣑋 | U+23465 𣑥 | U+234E4 𣓤 | U+2355A 𣕚 | U+23594 𣖔 | U+23639 𣘹 | U+23647 𣙇 | U+23638 𣘸 |
U+2363A 𣘺 | U+2371C 𣜜 | U+2370C 𣜌 | U+23764 𣝤 | U+237FF 𣟿 | U+237E7 𣟧 | U+23824 𣠤 | U+2383D 𣠽 | U+23A98 𣪘 | U+23C7F 𣱿 |
U+23D00 𣴀 | U+23D40 𣵀 | U+23DFA 𣷺 | U+23DF9 𣷹 | U+23DD3 𣷓 | U+23F7E 𣽾 | U+24096 𤂖 | U+24103 𤄃 | U+241C6 𤇆 | U+241FE 𤇾 |
U+243BC 𤎼 | U+24629 𤘩 | U+246A5 𤚥 | U+24896 𤢖 | U+24A4D 𤩍 | U+24B56 𤭖 | U+24B6F 𤭯 | U+24C16 𤰖 | U+24D14 𤴔 | U+24E0E 𤸎 |
U+24E37 𤸷 | U+24E6A 𤹪 | U+24E8B 𤺋 | U+2504A 𥁊 | U+25055 𥁕 | U+25122 𥄢 | U+251A9 𥆩 | U+251E5 𥇥 | U+251CD 𥇍 | U+2521E 𥈞 |
U+2524C 𥉌 | U+2542E 𥐮 | U+254D9 𥓙 | U+255A7 𥖧 | U+257A9 𥞩 | U+257B4 𥞴 | U+259D4 𥧔 | U+25AE4 𥫤 | U+25AE3 𥫣 | U+25AF1 𥫱 |
U+25BB2 𥮲 | U+25C4B 𥱋 | U+25C64 𥱤 | U+25E2E 𥸮 | U+25E56 𥹖 | U+25E65 𥹥 | U+25E62 𥹢 | U+25ED8 𥻘 | U+25EC2 𥻂 | U+25EE8 𥻨 |
U+25F23 𥼣 | U+25F5C 𥽜 | U+25FE0 𥿠 | U+25FD4 𥿔 | U+2600C 𦀌 | U+25FFB 𥿻 | U+26017 𦀗 | U+26060 𦁠 | U+260ED 𦃭 | U+26270 𦉰 |
U+26286 𦊆 | U+2634C 𦍌 | U+23D0E 𣴎 | U+26402 𦐂 | U+2667E 𦙾 | U+266B0 𦚰 | U+2671D 𦜝 | U+268DD 𦣝 | U+268EA 𦣪 | U+26951 𦥑 |
U+2696F 𦥯 | U+269DD 𦧝 | U+26A1E 𦨞 | U+26A58 𦩘 | U+26A8C 𦪌 | U+26AB7 𦪷 | U+26C73 𦱳 | U+26CDD 𦳝 | U+26E65 𦹥 | U+26F94 𦾔 |
U+26FF8 𦿸 | U+26FF6 𦿶 | U+26FF7 𦿷 | U+2710D 𧄍 | U+27139 𧄹 | U+273DB 𧏛 | U+273DA 𧏚 | U+273FE 𧏾 | U+27410 𧐐 | U+27449 𧑉 |
U+27615 𧘕 | U+27614 𧘔 | U+27631 𧘱 | U+27693 𧚓 | U+2770E 𧜎 | U+27723 𧜣 | U+27752 𧝒 | U+27985 𧦅 | U+27A84 𧪄 | U+27BB3 𧮳 |
U+27BBE 𧮾 | U+27BC7 𧯇 | U+27CB8 𧲸 | U+27DA0 𧶠 | U+27E10 𧸐 | U+27FB7 𧾷 | U+2808A 𨂊 | U+280BB 𨂻 | U+28282 𨊂 | U+282F3 𨋳 |
U+2840C 𨐌 | U+28455 𨑕 | U+2856B 𨕫 | U+285C8 𨗈 | U+285C9 𨗉 | U+286D7 𨛗 | U+286FA 𨛺 | U+28949 𨥉 | U+28946 𨥆 | U+2896B 𨥫 |
U+28987 𨦇 | U+28988 𨦈 | U+289BA 𨦺 | U+289BB 𨦻 | U+28A1E 𨨞 | U+28A29 𨨩 | U+28A71 𨩱 | U+28A43 𨩃 | U+28A99 𨪙 | U+28ACD 𨫍 |
U+28AE4 𨫤 | U+28ADD 𨫝 | U+28BC1 𨯁 | U+28BEF 𨯯 | U+28D10 𨴐 | U+28D71 𨵱 | U+28DFB 𨷻 | U+28E1F 𨸟 | U+28E36 𨸶 | U+28E89 𨺉 |
U+28EEB 𨻫 | U+28F32 𨼲 | U+28FF8 𨿸 | U+292A0 𩊠 | U+292B1 𩊱 | U+29490 𩒐 | U+295CF 𩗏 | U+2967F 𩙿 | U+296F0 𩛰 | U+29719 𩜙 |
U+29750 𩝐 | U+298C6 𩣆 | U+29A72 𩩲 | U+29DDB 𩷛 | U+29E3D 𩸽 | U+29E15 𩸕 | U+29E8A 𩺊 | U+29E49 𩹉 | U+29EC4 𩻄 | U+29EE9 𩻩 |
U+29EDB 𩻛 | U+29FCE 𩿎 | U+2A02F 𪀯 | U+2A01A 𪀚 | U+2A0F9 𪃹 | U+2A082 𪂂 | U+22218 𢈘 | U+2A38C 𪎌 | U+2A437 𪐷 | U+2A5F1 𪗱 |
U+2A602 𪘂 | U+2A61A 𪘚 | U+2A6B2 𪚲 |
&br;