Tablica znaków Unicode

Tabele Unicode (plan 0) Kluczowe dane

0000 - 0FFF	8000 - 8FFF
1000 - 1FFF	9000 - 9FFF
2000 - 2FFF	A000 - AFFF
3000 - 3FFF	B000 - BFFF
4000 - 4FFF	C000 - CFFF
5000 - 5FFF	D000 - DFFF
6000 - 6FFF	E000 - EFFF
7000 - 7FFF	F000 - FFFF

Inne plany Unicode

0000 - FFFF	plan 0 (PMB / BMP )
10000 - 1FFFF	plan 1 (PMC / SMP )
20000 - 2FFFF	plan 2 (PSC / SIP )
30000 - 3FFFF	plan 3 (PST / TIP )
40000 - DFFFF	strzały 4–13 (zarezerwowane)
E0000 - EFFFF	plan 14 (PCS / SSP )
F0000 - FFFFF	plan 15 (prywatny A)
100,000 - 10FFFF	plan 16 (prywatny B)

Unicode to standard komputerowy opracowany przez Unicode Consortium , które ma na celu dać każdy znak jakiegokolwiek systemu piśmie z języka unikalny identyfikator numeryczny i jednolity sposób, niezależnie od platformy komputera lub oprogramowania .

Unicode i standard ISO / IEC 10646 nadają każdemu znakowi oficjalną nazwę w ramach wspólnego, ujednoliconego repertuaru obejmującego wszystkie języki i zastosowania. Gdy tylko wspólny repertuar zostanie zatwierdzony, znaki są grupowane w bloki zgodnie z ich użyciem i akceptowanymi skryptami, i otrzymują unikalną numeryczną identyfikację zwaną punktem kodowym , zwykle identyfikowaną jako „U + ....” (gdzie „... . ”oznacza liczbę szesnastkową składającą się z 4 do 6 cyfr, od U + 0000 do U + 10FFFF). Zdefiniowany zakres umożliwia przypisanie do 1 114 112 punktów kodowych.

Lokalizacja znaków według samolotu i bloku

Cała przestrzeń kodowa jest podzielona na 17 płaszczyzn, z których każda zawiera 65 536 punktów kodowych. W każdej z 17 płaszczyzn ostatnie dwa punkty kodowe są przydzielone i zarezerwowane dla wewnętrznych funkcji specjalnych, a nie dla znaków, i nie powinny być używane do kodowania tekstu.

Każdy plan jest podzielony na bloki. Bloki grupują znaki według kryteriów przynależności logicznej do grupy znaków i dlatego nie mają ustalonego rozmiaru. Ich wielkość może wahać się od kilku punktów kodowych do kilku tysięcy. W obrębie bloku nie wszystkie dostępne punkty kodowe są koniecznie przydzielane.

Tabele płaszczyzn punktów kodu Unicode

W poniższej tabeli wymieniono 7 planów punktów kodowych przydzielonych w standardach ISO / IEC 10646 i Unicode .

Uwaga: Aby ograniczyć rozmiar strony i ułatwić nawigację, każda strona ma zakres 4096 punktów kodowych. możesz użyć palety nawigacyjnej u góry każdej strony, aby przejść z jednego zakresu 4096 punktów kodowych do innego lub z jednego planu do drugiego lub wyświetlić mapę alokacji każdego planu w celu zlokalizowania różnych pism. Kliknięcie na nazwę bloku powoduje wyświetlenie bardziej szczegółowych informacji o bloku, zawierającego łącza odsyłające do innych bloków zawierających podobne znaki.

Niektóre z tych tabel mogą źle wyświetlać się na ekranie, jeśli nie używasz tych czcionek na swoim komputerze. W takim przypadku można zapoznać się z tymi tabelami w formacie PDF (na przykład), korzystając z łączy proponowanych w nagłówku każdej wyświetlanej tabeli.

Podstawowy plan wielojęzyczny (PMB / BMP )

Punkty kodowe od U + 0000 do U + FFFF.

Podstawowy wielojęzyczny zarys (pierwszy, oznaczony numerem 0) jest najczęściej używany, ponieważ zawiera większość znaków używanych w najpopularniejszych współczesnych językach świata.

Uzupełniający plan wielojęzyczny (PMC / SMP )

Punkty kodowe U + 10000 do U + 1FFFF.

Ta płaszczyzna uzupełniająca (numer 1) jest używana dla starych znaków pisma i zestawów symboli.

Uzupełniający plan sinograficzny (PSC / SIP )

Punkty kodowe U + 20000 do U + 2FFFF.

Ten plan uzupełniający (numer 2) jest używany do niezbędnych rozszerzeń mniej powszechnych sinogramów pisma ideograficznego w języku chińskim, japońskim i koreańskim (CJC) oraz wietnamskiego pisma sinograficznego Chữ Nôm .

Trójskładnikowy plan sinograficzny (PST / TIP )

Punkty kodowe U + 30000 do U + 3FFFF.

Ten plan uzupełniający (numer 3) jest używany do nowszych rozszerzeń niezbędnych do mniej powszechnych sinogramów pisma ideograficznego w języku chińskim, japońskim i koreańskim (CJC) oraz do wietnamskiego pisma sinograficznego Chữ Nôm .

Dodatkowe plany zarezerwowane

Punkty kodowe U + 40000 do U + DFFFF.

Te dziesięć planów uzupełniających (numery od 4 do 13) nie jest jeszcze wykorzystywanych.

Specjalistyczny plan uzupełniający (PCS / SSP )

Punkty kodowe od U + E0000 do U + EFFFF.

Ten rzadko używany plan uzupełniający (numer 14) zawiera specjalne znaki kontrolne.

Dodatkowe plany do użytku prywatnego

Te dwa uzupełniające się plany (numery 15 i 16) są w całości przypisane do użytku prywatnego według uznania użytkownika (teksty zawierające te punkty kodowe są ważne, ale nie mogą być interoperacyjne bez uprzedniej wzajemnej zgody prywatnej) i rozszerzają prywatne punkty kodowe podstawowego planu wielojęzycznego .

Dodatkowa strefa A do użytku prywatnego

Punkty kodowe U + F0000 do U + FFFFF.

Dodatkowa strefa B do użytku prywatnego

Punkty kodowe U + 100000 do U + 10FFFF.

Zobacz też

Powiązane artykuły

Unicode , ISO / IEC 10646
Znaki sterujące Unicode
UTF-8 , UTF-16 , UTF-32
Pomoc: znaki specjalne
Pomoc: Unicode
Wikipedia: Unicode / Test

Linki zewnętrzne

Na oficjalnej stronie Unicode:
- (pl) Tablice znaków Unicode przez pisanie (najnowsza znormalizowana wersja 5.0).
- (en) Wykresy kodów znaków Unicode według skryptu (najnowsza standardowa wersja 6.0).
- (pl) Wykresy Unicode 6.1 BETA (publiczna wersja beta ).
- (pl) Mapy drogowe do Unicode (pisma obsługiwane lub w trakcie standaryzacji).
(fr) Unicode i ISO / IEC 10646 .
Standardy do bezpłatnego pobrania ze strony ISO (standards.iso.org) - wymaga uprzedniej akceptacji proponowanej licencji:
- (fr) ISO / CEI 10646: 2003 (wersja francuska w formacie zip, zawierająca HTML i pliki tekstowe)
- (en) ISO / IEC 10646: 2003 (wersja angielska w formacie zip, zawierająca pliki HTML i pliki tekstowe)