Unicode to standard komputerowy opracowany przez Unicode Consortium , które ma na celu dać każdy znak jakiegokolwiek systemu piśmie z języka unikalny identyfikator numeryczny i jednolity sposób, niezależnie od platformy komputera lub oprogramowania .
Unicode i standard ISO / IEC 10646 nadają każdemu znakowi oficjalną nazwę w ramach wspólnego, ujednoliconego repertuaru obejmującego wszystkie języki i zastosowania. Gdy tylko wspólny repertuar zostanie zatwierdzony, znaki są grupowane w bloki zgodnie z ich użyciem i akceptowanymi skryptami, i otrzymują unikalną numeryczną identyfikację zwaną punktem kodowym , zwykle identyfikowaną jako „U + ....” (gdzie „... . ”oznacza liczbę szesnastkową składającą się z 4 do 6 cyfr, od U + 0000 do U + 10FFFF). Zdefiniowany zakres umożliwia przypisanie do 1 114 112 punktów kodowych.
Cała przestrzeń kodowa jest podzielona na 17 płaszczyzn, z których każda zawiera 65 536 punktów kodowych. W każdej z 17 płaszczyzn ostatnie dwa punkty kodowe są przydzielone i zarezerwowane dla wewnętrznych funkcji specjalnych, a nie dla znaków, i nie powinny być używane do kodowania tekstu.
Każdy plan jest podzielony na bloki. Bloki grupują znaki według kryteriów przynależności logicznej do grupy znaków i dlatego nie mają ustalonego rozmiaru. Ich wielkość może wahać się od kilku punktów kodowych do kilku tysięcy. W obrębie bloku nie wszystkie dostępne punkty kodowe są koniecznie przydzielane.
W poniższej tabeli wymieniono 7 planów punktów kodowych przydzielonych w standardach ISO / IEC 10646 i Unicode .
Uwaga: Aby ograniczyć rozmiar strony i ułatwić nawigację, każda strona ma zakres 4096 punktów kodowych. możesz użyć palety nawigacyjnej u góry każdej strony, aby przejść z jednego zakresu 4096 punktów kodowych do innego lub z jednego planu do drugiego lub wyświetlić mapę alokacji każdego planu w celu zlokalizowania różnych pism. Kliknięcie na nazwę bloku powoduje wyświetlenie bardziej szczegółowych informacji o bloku, zawierającego łącza odsyłające do innych bloków zawierających podobne znaki.Niektóre z tych tabel mogą źle wyświetlać się na ekranie, jeśli nie używasz tych czcionek na swoim komputerze. W takim przypadku można zapoznać się z tymi tabelami w formacie PDF (na przykład), korzystając z łączy proponowanych w nagłówku każdej wyświetlanej tabeli.
Punkty kodowe od U + 0000 do U + FFFF.
Podstawowy wielojęzyczny zarys (pierwszy, oznaczony numerem 0) jest najczęściej używany, ponieważ zawiera większość znaków używanych w najpopularniejszych współczesnych językach świata.
Punkty kodowe U + 10000 do U + 1FFFF.
Ta płaszczyzna uzupełniająca (numer 1) jest używana dla starych znaków pisma i zestawów symboli.
Punkty kodowe U + 20000 do U + 2FFFF.
Ten plan uzupełniający (numer 2) jest używany do niezbędnych rozszerzeń mniej powszechnych sinogramów pisma ideograficznego w języku chińskim, japońskim i koreańskim (CJC) oraz wietnamskiego pisma sinograficznego Chữ Nôm .
Punkty kodowe U + 30000 do U + 3FFFF.
Ten plan uzupełniający (numer 3) jest używany do nowszych rozszerzeń niezbędnych do mniej powszechnych sinogramów pisma ideograficznego w języku chińskim, japońskim i koreańskim (CJC) oraz do wietnamskiego pisma sinograficznego Chữ Nôm .
Punkty kodowe U + 40000 do U + DFFFF.
Te dziesięć planów uzupełniających (numery od 4 do 13) nie jest jeszcze wykorzystywanych.
Punkty kodowe od U + E0000 do U + EFFFF.
Ten rzadko używany plan uzupełniający (numer 14) zawiera specjalne znaki kontrolne.
Te dwa uzupełniające się plany (numery 15 i 16) są w całości przypisane do użytku prywatnego według uznania użytkownika (teksty zawierające te punkty kodowe są ważne, ale nie mogą być interoperacyjne bez uprzedniej wzajemnej zgody prywatnej) i rozszerzają prywatne punkty kodowe podstawowego planu wielojęzycznego .
Dodatkowa strefa A do użytku prywatnegoPunkty kodowe U + F0000 do U + FFFFF.
Dodatkowa strefa B do użytku prywatnegoPunkty kodowe U + 100000 do U + 10FFFF.