Unicode Utilities: Character Property Index

help | character | properties | confusables | unicode-set | compare-sets | regex | bnf-regex | breaks | transform | bidi | bidi-c | idna | languageid

CategoryDatatypeSourcePropertyValues
BidirectionalBinaryUCDBidi_ControlNo (N),
Yes (Y)
Bidi_MirroredNo (N),
Yes (Y)
EnumeratedBidi_ClassShow Values
Bidi_Paired_Bracket_TypeClose (C),
None (N),
Open (O)
StringBidi_Mirroring_GlyphShow Values
Bidi_Paired_BracketShow Values
CaseBinaryUCDCase_IgnorableNo (N),
Yes (Y)
CasedNo (N),
Yes (Y)
Changes_When_CasefoldedNo (N),
Yes (Y)
Changes_When_CasemappedNo (N),
Yes (Y)
Changes_When_LowercasedNo (N),
Yes (Y)
Changes_When_TitlecasedNo (N),
Yes (Y)
Changes_When_UppercasedNo (N),
Yes (Y)
LowercaseNo (N),
Yes (Y)
Soft_DottedNo (N),
Yes (Y)
UppercaseNo (N),
Yes (Y)
UnicodeisCasedNo (N),
Yes (Y)
isCasefoldedNo (N),
Yes (Y)
isLowercaseNo (N),
Yes (Y)
isTitlecaseNo (N),
Yes (Y)
isUppercaseNo (N),
Yes (Y)
X-ICUCase_SensitiveNo (N),
Yes (Y)
StringUCDCase_FoldingShow Values
Lowercase_MappingShow Values
Simple_Case_FoldingShow Values
Simple_Lowercase_MappingShow Values
Simple_Titlecase_MappingShow Values
Simple_Uppercase_MappingShow Values
Titlecase_MappingShow Values
Uppercase_MappingShow Values
UnicodetoCasefoldShow Values
toLowercaseShow Values
toTitlecaseShow Values
toUppercaseShow Values
CJKBinaryUCDIDS_Binary_OperatorNo (N),
Yes (Y)
IDS_Trinary_OperatorNo (N),
Yes (Y)
IdeographicNo (N),
Yes (Y)
RadicalNo (N),
Yes (Y)
Unified_IdeographNo (N),
Yes (Y)
EnumeratedX-DemoHanTypeHan, Hans, Hant,
na
StringUCDCJK_RadicalShow Values
Equivalent_Unified_IdeographShow Values
kSimplifiedVariantShow Values
kTraditionalVariantShow Values
EmojiBinaryUCDExtended_PictographicNo (N),
Yes (Y)
UTSBasic_EmojiNo (N),
Yes (Y)
EmojiNo (N),
Yes (Y)
Emoji_ComponentNo (N),
Yes (Y)
Emoji_ModifierNo (N),
Yes (Y)
Emoji_Modifier_BaseNo (N),
Yes (Y)
Emoji_PresentationNo (N),
Yes (Y)
RGI_EmojiNo,
Yes
RGI_Emoji_Flag_SequenceNo (N),
Yes (Y)
RGI_Emoji_Keycap_SequenceNo (No),
Yes (Yes)
RGI_Emoji_Modifier_SequenceNo (N),
Yes (Y)
RGI_Emoji_Tag_SequenceNo (N),
Yes (Y)
RGI_Emoji_Zwj_SequenceNo (N),
Yes (Y)
EnumeratedUCDRegional_IndicatorNo (N),
Yes (Y)
GeneralBinaryUCDAlphabeticNo (N),
Yes (Y)
Default_Ignorable_Code_PointNo (N),
Yes (Y)
DeprecatedNo (N),
Yes (Y)
Logical_Order_ExceptionNo (N),
Yes (Y)
Noncharacter_Code_PointNo (N),
Yes (Y)
Variation_SelectorNo (N),
Yes (Y)
White_SpaceNo (N),
Yes (Y)
CatalogAgeShow Values
BlockShow Values
ScriptShow Values
EnumeratedGeneral_CategoryShow Values
Hangul_Syllable_TypeLeading_Jamo (L), LV_Syllable (LV), LVT_Syllable (LVT),
Not_Applicable (NA),
Trailing_Jamo (T),
Vowel_Jamo (V)
Name_AliasShow Values
Named_SequencesShow Values
Named_Sequences_Prov
StringNameslistsubheadShow Values
UCDNameShow Values
Script_ExtensionsShow Values
IdentifiersBinaryUCDID_ContinueNo (N),
Yes (Y)
ID_StartNo (N),
Yes (Y)
Pattern_SyntaxNo (N),
Yes (Y)
Pattern_White_SpaceNo (N),
Yes (Y)
XID_ContinueNo (N),
Yes (Y)
XID_StartNo (N),
Yes (Y)
IDNAEnumeratedUTSIdn_2008na (na),
NV8 (nv8),
XV8 (xv8)
Idn_Statusdeviation (dv), disallowed (da), disallowed_STD3_mapped (ds3m), disallowed_STD3_valid (ds3v),
ignored (i),
mapped (m),
valid (v)
idna2003deviation, disallowed,
ignored,
mapped,
valid
idna2008CONTEXTJ, CONTEXTO,
DISALLOWED,
PVALID,
UNASSIGNED
idna2008cdeviation, disallowed,
ignored,
mapped,
valid
uts46deviation, disallowed,
ignored,
mapped,
valid
StringIdn_MappingShow Values
toIdna2003Show Values
toUts46nShow Values
toUts46tShow Values
MiscellaneousBinaryUCDDashNo (N),
Yes (Y)
DiacriticNo (N),
Yes (Y)
ExtenderNo (N),
Yes (Y)
Grapheme_BaseNo (N),
Yes (Y)
Grapheme_ExtendNo (N),
Yes (Y)
Grapheme_LinkNo (N),
Yes (Y)
HyphenNo (N),
Yes (Y)
MathNo (N),
Yes (Y)
Quotation_MarkNo (N),
Yes (Y)
STermNo (N),
Yes (Y)
Terminal_PunctuationNo (N),
Yes (Y)
EnumeratedIndic_Positional_CategoryShow Values
Indic_Syllabic_CategoryShow Values
MiscellaneousISO_CommentShow Values
Unicode_1_NameShow Values
NormalizationBinaryICUNFC_InertNo (N),
Yes (Y)
NFD_InertNo (N),
Yes (Y)
NFKC_InertNo (N),
Yes (Y)
NFKD_InertNo (N),
Yes (Y)
isNFMNo,
Yes
UCDChanges_When_NFKC_CasefoldedNo (N),
Yes (Y)
Full_Composition_ExclusionNo (N),
Yes (Y)
UnicodeisNFCNo,
Yes
isNFDNo,
Yes
isNFKCNo,
Yes
isNFKDNo,
Yes
EnumeratedICULead_Canonical_Combining_ClassShow Values
Trail_Canonical_Combining_ClassShow Values
UCDCanonical_Combining_ClassShow Values
Decomposition_TypeShow Values
NFC_Quick_CheckMaybe (M),
No (N),
Yes (Y)
NFD_Quick_CheckNo (N),
Yes (Y)
NFKC_Quick_CheckMaybe (M),
No (N),
Yes (Y)
NFKD_Quick_CheckNo (N),
Yes (Y)
StringICUtoNFMShow Values
UCDNFKC_CasefoldShow Values
UnicodetoNFCShow Values
toNFDShow Values
toNFKCShow Values
toNFKDShow Values
NumericBinaryUCDASCII_Hex_DigitNo (N),
Yes (Y)
Hex_DigitNo (N),
Yes (Y)
EnumeratedNumeric_TypeDecimal (De), Digit (Di),
None (None), Numeric (Nu)
kAccountingNumericShow Values
kOtherNumericShow Values
kPrimaryNumericShow Values
NumericNumeric_ValueShow Values
RegexBinaryUTSANYNo,
Yes
ASCIINo,
Yes
alnumNo (N),
Yes (Y)
blankNo (N),
Yes (Y)
bmpNo,
Yes
graphNo (N),
Yes (Y)
printNo (N),
Yes (Y)
xdigitNo (N),
Yes (Y)
SecurityEnumeratedUTSConfusable_MA֖ (֖),
֘ (֘),
֙ (֙),
֚ (֚),
ۛ (ۛ),
̓ (̓),
̔ (̔),
́ (́),
̀ (̀),
̆ (̆), ̆̇ (̆̇),
̂ (̂),
̊ (̊),
̈ (̈),
̋ (̋),
̃ (̃),
̇ (̇),
̸ (̸),
̨ (̨),
̄ (̄),
̎ (̎),
̒ (̒),
͐ (͐),
͒ (͒),
̖ (̖),
̩ (̩),
̫ (̫),
̳ (̳),
͔ (͔),
͕ (͕),
 (),
 (),
̵ (̵),
̉ (̉),
̣ (̣),
̤ (̤),
̥ (̥),
̦ (̦),
̭ (̭),
̮ (̮),
̱ (̱),
ٌ (ٌ),
ﹲّ (ﹲّ),
ٍ (ٍ),
ﹴّ (ﹴّ),
ﹷّ (ﹷّ),
ﹶّ (ﹶّ),
ﹹّ (ﹹّ),
ﹸّ (ﹸّ),
ِ (ِ),
ﹻّ (ﹻّ),
ﹺّ (ﹺّ),
ﹼٰ (ﹼٰ),
ٕ (ٕ),
ٰ (ٰ),
ܼ (ܼ),
 (),
 (),
 (),
 (),
 (),
 (),
 ( ),
_ (_),
- (-),  (),  (),  (),  (), -. (-.),
 (),
, (,),
، (،),
; (;),
؛ (؛),
: (:), ::= (::=), :→ (:→),
! (!), !! (!!), !? (!?),
? (?), ?! (?!), ?? (??),
؟ (؟),
. (.), ., (.,), .. (..), ... (...),
꛳꛳ (꛳꛳),
· (·), ··· (···), ·< (·<), ·> (·>), ·4 (·4), ·b (·b), ·ḃ (·ḃ), ·d (·d), ·J (·J), ·L (·L), ·P (·P), ·U (·U), ·V (·V), ·Ʌ (·Ʌ), ·Γ (·Γ), ·Δ (·Δ), ·Ո (·Ո), ·ᐁ (·ᐁ), ·ᐄ (·ᐄ), ·ᐅ (·ᐅ), ·ᐆ (·ᐆ), ·ᐊ (·ᐊ), ·ᐋ (·ᐋ), ·ᐲ (·ᐲ), ·ᐴ (·ᐴ), ·ᐹ (·ᐹ), ·ᑏ (·ᑏ), ·ᑐ (·ᑐ), ·ᑑ (·ᑑ), ·ᑕ (·ᑕ), ·ᑖ (·ᑖ), ·ᑫ (·ᑫ), ·ᑮ (·ᑮ), ·ᑰ (·ᑰ), ·ᒉ (·ᒉ), ·ᒋ (·ᒋ), ·ᒌ (·ᒌ), ·ᒎ (·ᒎ), ·ᒐ (·ᒐ), ·ᒑ (·ᒑ), ·ᒣ (·ᒣ), ·ᒦ (·ᒦ), ·ᒧ (·ᒧ), ·ᒨ (·ᒨ), ·ᒫ (·ᒫ), ·ᓀ (·ᓀ), ·ᓂ (·ᓂ), ·ᓃ (·ᓃ), ·ᓄ (·ᓄ), ·ᓅ (·ᓅ), ·ᓇ (·ᓇ), ·ᓈ (·ᓈ), ·ᓓ (·ᓓ), ·ᓕ (·ᓕ), ·ᓖ (·ᓖ), ·ᓗ (·ᓗ), ·ᓘ (·ᓘ), ·ᓚ (·ᓚ), ·ᓛ (·ᓛ), ·ᓭ (·ᓭ), ·ᓯ (·ᓯ), ·ᓰ (·ᓰ), ·ᓱ (·ᓱ), ·ᓲ (·ᓲ), ·ᓴ (·ᓴ), ·ᓵ (·ᓵ), ·ᔐ (·ᔐ), ·ᔑ (·ᔑ), ·ᔒ (·ᔒ), ·ᔓ (·ᔓ), ·ᔔ (·ᔔ), ·ᔕ (·ᔕ), ·ᔖ (·ᔖ), ·ᔨ (·ᔨ), ·ᔩ (·ᔩ), ·ᔪ (·ᔪ), ·ᔫ (·ᔫ), ·ᔭ (·ᔭ), ·ᔮ (·ᔮ), ·ᕃ (·ᕃ), ·ᕆ (·ᕆ), ·ᕇ (·ᕇ), ·ᕈ (·ᕈ), ·ᕉ (·ᕉ), ·ᕋ (·ᕋ), ·ᕌ (·ᕌ), ·ᕚ (·ᕚ), ·ᕧ (·ᕧ), ·ᢱ (·ᢱ), ·ᢴ (·ᢴ), ·ᢸ (·ᢸ), ·ᣀ (·ᣀ),
 (), ।। (।।),
᰻᰻ (᰻᰻),
၊၊ (၊၊),
᪨᪨ (᪨᪨),
᪪᪨ (᪪᪨),
᭞᭞ (᭞᭞),
𐩖𐩖 (𐩖𐩖),
𑑋𑑋 (𑑋𑑋),
𑙁𑙁 (𑙁𑙁),
𑱁𑱁 (𑱁𑱁),
᱾᱾ (᱾᱾),
' ('), '' (''), ''' ('''), '''' (''''), 'B ('B), 'D ('D), 'n ('n), 'P ('P), 'T ('T), 'Y ('Y),
( ((), (( (((), (ー) ((ー)), (2) ((2)), (2O) ((2O)), (3) ((3)), (4) ((4)), (5) ((5)), (6) ((6)), (7) ((7)), (8) ((8)), (9) ((9)), (a) ((a)), (A) ((A)), (b) ((b)), (B) ((B)), (c) ((c)), (C) ((C)), (d) ((d)), (D) ((D)), (e) ((e)), (E) ((E)), (f) ((f)), (F) ((F)), (g) ((g)), (G) ((G)), (h) ((h)), (H) ((H)), (i) ((i)), (j) ((j)), (J) ((J)), (k) ((k)), (K) ((K)), (l) ((l)), (L) ((L)), (l2) ((l2)), (l3) ((l3)), (l4) ((l4)), (l5) ((l5)), (l6) ((l6)), (l7) ((l7)), (l8) ((l8)), (l9) ((l9)), (ll) ((ll)), (lO) ((lO)), (M) ((M)), (n) ((n)), (N) ((N)), (o) ((o)), (O) ((O)), (p) ((p)) too many values to show
Identifier_StatusAllowed (a),
Restricted (r)
Identifier_TypeShow Values
Shaping and RenderingBinaryICUSegment_StarterNo (N),
Yes (Y)
UCDJoin_ControlNo (N),
Yes (Y)
EnumeratedEast_Asian_WidthAmbiguous (A),
Fullwidth (F),
Halfwidth (H),
Narrow (Na), Neutral (N),
Wide (W)
Grapheme_Cluster_BreakShow Values
Joining_GroupShow Values
Joining_TypeDual_Joining (D),
Join_Causing (C),
Left_Joining (L),
Non_Joining (U),
Right_Joining (R),
Transparent (T)
Line_BreakShow Values
Prepended_Concatenation_MarkNo (N),
Yes (Y)
Sentence_BreakShow Values
Standardized_VariantShow Values
Vertical_OrientationRotated (R),
Transformed_Rotated (Tr), Transformed_Upright (Tu),
Upright (U)
Word_BreakShow Values
UCABinaryUTSucaShow Values
uca2Show Values
uca2.5Show Values
uca3Show Values
Z-OtherOtherOtherEmoji_Keycap_SequenceOther

Key

The Categories are from UCD Table 8. Property Summary Table, with some extended categories: Emoji, IDNA, Regex, Security, and UCA.

The Datatypes are from UCD Table 5. Property Type Key.

The Sources are:


Fonts and Display. If you don't have a good set of Unicode fonts (and modern browser), you may not be able to read some of the characters. Some suggested fonts that you can add for coverage are: Noto Fonts site, Unicode Fonts for Ancient Scripts, Large, multi-script Unicode fonts. See also: Unicode Display Problems.

Version 3.9; ICU version: 72.0; Unicode/Emoji version: 15.0;