Разное

Символы unicode таблица: Таблица символов Юникода (Unicode) — Хитрые инструменты

Содержание

Таблица символов в Юникод.

Реально работает!

Построй сам себе прикольный статус или надпись на стену в контакте=)

alt + 1 = ☺ alt + 2 = ☻ alt + 3 = ♥ alt + 4 = ♦ alt + 5 = ♣

alt + 6 = ♠ alt + 7 = • alt + 8 = ◘ alt + 9 = ○ alt + 10 = ◙

Слева указаны десятки, а сверху – единицы. Что бы набрать символ, при активной лампочке Num Lock зажмите кнопку Alt и, не отжимая её, наберите код символа, набрав его, отожмите клавишу, и в строке появится то, что вам было нужно☺

Есть вещи, о которых узнаёшь так поздно, что порой даже стыдно в этом признаться. Кто-то до сих пор не знает, как вынимают косточки из маслин или где зимуют минские бомжи, а я только на днях нашел ответ на вопрос: где русские кавычки на клавиатуре.

Для начинающих копипейстеров замечу – кавычки бывают:

  • «ёлочки»
  • „лапки“
  • “английские двойные”
  • ‘английские одиночные’

Есть еще т.н. «программистские» кавычки (”“), назвать которые кавычками – уже жаргонизм. Восточные народы изобрели еще дюжину видов этого знака препинания, но не будем смеятся над их культурой…

В русском и белорусском языках используются именно «ёлочки», которые, кстати, являются искомо французскими (как в анекдоте про красное яблоко, которое желтое, потому что зеленое).

Итак, ради уважения к нормам русского языка и совсем чуть-чуть – из уважения к культуре Франции – нужно вспоминать десятеричный код и кнопку alt. Важно помнить, что для набора специальных символов используется цифровая клавиатура (та, что под клавишей Num Lock). Для ноутбуков и устройств, похожих на дорогой сотовый телефон нужно нажать еще и кнопку Fn:

alt+0171 — « (кавычки открываются)

alt+0187 — » (кавычки закрываются)

Вот так, привыкнуть легко, если сразу не испугаться.

В принципе, использование обычных «программистских» кавычек допускается в большинстве случаев онлайн-общения, хотя есть варианты, где “градусы” вместо «ёлочек» – это уже моветон.

Ну и для любознательных – полная таблица alt-кодов:


































Символ

alt-код

еще код

Символ

alt-код

еще код

Символ

alt-код

еще код

Символ

alt-код

еще код

Символ

alt-код

Символ

alt-код

Символ

alt-код

Символ

alt-код

Alt+1

Alt+257

A

Alt+65

Alt+321

Б

Alt+129

Alt+385

Alt+193

Alt+449

!

Alt+0033

a

Alt+0097

Ў

Alt+0161

а

Alt+0224

Alt+2

Alt+258

B

Alt+66

Alt+322

В

Alt+130

Alt+386

Alt+194

Alt+450

«

Alt+0034

b

Alt+0098

ў

Alt+0162

б

Alt+0225

Alt+3

Alt+259

C

Alt+67

Alt+323

Г

Alt+131

Alt+387

Alt+195

Alt+451

#

Alt+0035

c

Alt+0099

Ј

Alt+0163

в

Alt+0226

Alt+4

Alt+260

D

Alt+68

Alt+324

Д

Alt+132

Alt+388

Alt+196

Alt+452

$

Alt+0036

d

Alt+0100

¤

Alt+0164

г

Alt+0227

Alt+5

Alt+261

E

Alt+69

Alt+325

Е

Alt+133

Alt+389

Alt+197

Alt+453

%

Alt+0037

e

Alt+0101

Ґ

Alt+0165

д

Alt+0228

Alt+6

Alt+262

F

Alt+70

Alt+326

Ж

Alt+134

Alt+390

Alt+198

Alt+454

&

Alt+0038

f

Alt+0102

¦

Alt+0166

е

Alt+0229

Alt+7

Alt+263

G

Alt+71

Alt+327

З

Alt+135

Alt+391

Alt+199

Alt+455

 

Alt+0039

g

Alt+0103

§

Alt+0167

ж

Alt+0230

Alt+8

Alt+264

H

Alt+72

Alt+328

И

Alt+136

Alt+392

Alt+200

Alt+456

(

Alt+0040

h

Alt+0104

Ё

Alt+0168

з

Alt+0231

Alt+9

Alt+265

I

Alt+73

Alt+329

Й

Alt+137

Alt+393

Alt+201

Alt+457

)

Alt+0041

a

Alt+0105

©

Alt+0169

и

Alt+0232

Alt+10

Alt+266

J

Alt+74

Alt+330

К

Alt+138

Alt+394

Alt+202

Alt+458

*

Alt+0042

j

Alt+0106

Є

Alt+0170

й

Alt+0233

Alt+11

Alt+267

K

Alt+75

Alt+331

Л

Alt+139

Alt+395

Alt+203

Alt+459

+

Alt+0043

k

Alt+0107

«

Alt+0171

к

Alt+0234

Alt+12

Alt+268

L

Alt+76

Alt+332

М

Alt+140

Alt+396

Alt+204

Alt+460

,

Alt+0044

l

Alt+0108

¬

Alt+0172

л

Alt+0235

Alt+13

Alt+269

M

Alt+77

Alt+333

Н

Alt+141

Alt+397

Alt+205

Alt+461

Alt+0045

m

Alt+0109

­

Alt+0173

м

Alt+0236

Alt+14

Alt+270

N

Alt+78

Alt+334

О

Alt+142

Alt+398

Alt+206

Alt+462

.

Alt+0046

n

Alt+0110

®

Alt+0174

н

Alt+0237

Alt+15

Alt+271

O

Alt+79

Alt+335

П

Alt+143

Alt+399

Alt+207

Alt+463

 

Alt+0047

o

Alt+0111

Ї

Alt+0175

о

Alt+0238

Alt+16

Alt+272

P

Alt+80

Alt+336

Р

Alt+144

Alt+400

Alt+208

Alt+464

0

Alt+0048

p

Alt+0112

°

Alt+0176

п

Alt+0239

Alt+17

Alt+273

Q

Alt+81

Alt+337

С

Alt+145

Alt+401

Alt+209

Alt+465

1

Alt+0049

q

Alt+0113

±

Alt+0177

р

Alt+0240

Alt+18

Alt+274

R

Alt+82

Alt+338

Т

Alt+146

Alt+402

Alt+210

Alt+466

2

Alt+0050

r

Alt+0114

І

Alt+0178

с

Alt+0241

Alt+19

Alt+275

S

Alt+83

Alt+339

У

Alt+147

Alt+403

Alt+211

Alt+467

3

Alt+0051

s

Alt+0115

і

Alt+0179

т

Alt+0242

Alt+20

Alt+276

T

Alt+84

Alt+340

Ф

Alt+148

Alt+404

Alt+212

Alt+468

4

Alt+0052

t

Alt+0116

ґ

Alt+0180

у

Alt+0243

§

Alt+21

Alt+277

U

Alt+85

Alt+341

Х

Alt+149

Alt+405

Alt+213

Alt+469

5

Alt+0053

u

Alt+0117

µ

Alt+0181

ф

Alt+0244

Alt+22

Alt+278

V

Alt+86

Alt+342

Ц

Alt+150

Alt+406

Alt+214

Alt+470

6

Alt+0054

v

Alt+0118

Alt+0182

х

Alt+0245

Alt+23

Alt+279

W

Alt+87

Alt+343

Ч

Alt+151

Alt+407

Alt+215

Alt+471

7

Alt+0055

w

Alt+0119

·

Alt+0183

ц

Alt+0246

Alt+24

Alt+280

X

Alt+88

Alt+344

Ш

Alt+152

Alt+408

Alt+216

Alt+472

8

Alt+0056

x

Alt+0120

ё

Alt+0184

ч

Alt+0247

Alt+25

Alt+281

Y

Alt+89

Alt+345

Щ

Alt+153

Alt+409

Alt+217

Alt+473

9

Alt+0057

y

Alt+0121

Alt+0185

ш

Alt+0248

Alt+26

Alt+282

Z

Alt+90

Alt+346

Ь

Alt+154

Alt+410

Alt+218

Alt+474

:

Alt+0058

z

Alt+0122

є

Alt+0186

щ

Alt+0249

Alt+27

Alt+283

[

Alt+91

Alt+347

Ы

Alt+155

Alt+411

Alt+219

Alt+475

;

Alt+0059

{

Alt+0123

»

Alt+0187

ь

Alt+0250

Alt+28

Alt+284

\

Alt+92

Alt+348

Ъ

Alt+156

Alt+412

Alt+220

Alt+476


Alt+0060

|

Alt+0124

ј

Alt+0188

ы

Alt+0251

Alt+29

Alt+285

]

Alt+93

Alt+349

Э

Alt+157

Alt+413

Alt+221

Alt+477

=

Alt+0061

}

Alt+0125

Ѕ

Alt+0189

ъ

Alt+0252

Alt+30

Alt+286

^

Alt+94

Alt+350

Ю

Alt+158

Alt+414

Alt+222

Alt+478

Alt+0062

~

Alt+0126

ѕ

Alt+0190

э

Alt+0253

Alt+31

Alt+287

_

Alt+95

Alt+351

Я

Alt+159

Alt+415

Alt+223

Alt+479

?

Alt+0063

 

Alt+0127

ї

Alt+0191

ю

Alt+0254

 

Alt+32

Alt+288

`

Alt+96

Alt+352

а

Alt+160

Alt+416

р

Alt+224

Alt+480

@

Alt+0064

Ђ

Alt+0128

А

Alt+0192

я

Alt+0255

!

Alt+33

Alt+289

a

Alt+97

Alt+353

б

Alt+161

Alt+417

с

Alt+225

Alt+481

A

Alt+0065

Ѓ

Alt+0129

Б

Alt+0193


«

Alt+34

Alt+290

b

Alt+98

Alt+354

в

Alt+162

Alt+418

т

Alt+226

Alt+482

B

Alt+0066

Alt+0130

В

Alt+0194


#

Alt+35

Alt+291

c

Alt+99

Alt+355

г

Alt+163

Alt+419

у

Alt+227

Alt+483

C

Alt+0067

ѓ

Alt+0131

Г

Alt+0195


$

Alt+36

Alt+292

d

Alt+100

Alt+356

д

Alt+164

Alt+420

ф

Alt+228

Alt+484

D

Alt+0068

Alt+0132

Д

Alt+0196


%

Alt+37

Alt+293

e

Alt+101

Alt+357

е

Alt+165

Alt+421

х

Alt+229

Alt+485

E

Alt+0069

Alt+0133

Е

Alt+0197


&

Alt+38

Alt+294

f

Alt+102

Alt+358

ж

Alt+166

Alt+422

ц

Alt+230

Alt+486

F

Alt+0070

Alt+0134

Ж

Alt+0198


 

Alt+39

Alt+295

g

Alt+103

Alt+359

з

Alt+167

Alt+423

ч

Alt+231

Alt+487

G

Alt+0071

Alt+0135

З

Alt+0199


(

Alt+40

Alt+296

h

Alt+104

Alt+360

и

Alt+168

Alt+424

ш

Alt+232

Alt+488

H

Alt+0072

Alt+0136

И

Alt+0200


)

Alt+41

Alt+297

i

Alt+105

Alt+361

й

Alt+169

Alt+425

щ

Alt+233

Alt+489

I

Alt+0073

Alt+0137

Й

Alt+0201


*

Alt+42

Alt+298

j

Alt+106

Alt+362

к

Alt+170

Alt+426

ь

Alt+234

Alt+490

J

Alt+0074

Љ

Alt+0138

К

Alt+0202


+

Alt+43

Alt+299

k

Alt+107

Alt+363

л

Alt+171

Alt+427

ы

Alt+235

Alt+491

K

Alt+0075

Alt+0139

Л

Alt+0203


,

Alt+44

Alt+300

l

Alt+108

Alt+364

м

Alt+172

Alt+428

ъ

Alt+236

Alt+492

L

Alt+0076

Њ

Alt+0140

М

Alt+0204


Alt+45

Alt+301

m

Alt+109

Alt+365

н

Alt+173

Alt+429

э

Alt+237

Alt+493

M

Alt+0077

Ќ

Alt+0141

Н

Alt+0205


.

Alt+46

Alt+302

n

Alt+110

Alt+366

о

Alt+174

Alt+430

ю

Alt+238

Alt+494

N

Alt+0078

Ћ

Alt+0142

О

Alt+0206


/

Alt+47

Alt+303

o

Alt+111

Alt+367

п

Alt+175

Alt+431

я

Alt+239

Alt+495

O

Alt+0079

Џ

Alt+0143

П

Alt+0207


0

Alt+48

Alt+304

p

Alt+112

Alt+368

Alt+176

Alt+432

Ё

Alt+240

Alt+496

P

Alt+0080

ђ

Alt+0144

Р

Alt+0208


1

Alt+49

Alt+305

q

Alt+113

Alt+369

Alt+177

Alt+433

ё

Alt+241

Alt+497

Q

Alt+0081

Alt+0145

С

Alt+0209


2

Alt+50

Alt+306

r

Alt+114

Alt+370

Alt+178

Alt+434

Є

Alt+242

Alt+498

R

Alt+0082

Alt+0146

Т

Alt+0210


3

Alt+51

Alt+307

s

Alt+115

Alt+371

Alt+179

Alt+435

є

Alt+243

Alt+499

S

Alt+0083

Alt+0147

У

Alt+0211


4

Alt+52

Alt+308

t

Alt+116

Alt+372

Alt+180

Alt+436

Ї

Alt+244

Alt+500

T

Alt+0084

Alt+0148

Ф

Alt+0212


5

Alt+53

Alt+309

u

Alt+117

Alt+373

Alt+181

Alt+437

ї

Alt+245

Alt+501

U

Alt+0085

Alt+0149

Х

Alt+0213


6

Alt+54

Alt+310

v

Alt+118

Alt+374

Alt+182

Alt+438

Ў

Alt+246

Alt+502

V

Alt+0086

Alt+0150

Ц

Alt+0214


7

Alt+55

Alt+311

w

Alt+119

Alt+375

Alt+183

Alt+439

ў

Alt+247

Alt+503

W

Alt+0087

Alt+0151

Ч

Alt+0215


8

Alt+56

Alt+312

x

Alt+120

Alt+376

Alt+184

Alt+440

°

Alt+248

Alt+504

X

Alt+0088

˜

Alt+0152

Ш

Alt+0216


9

Alt+57

Alt+313

y

Alt+121

Alt+377

Alt+185

Alt+441

Alt+249

Alt+505

Y

Alt+0089

Alt+0153

Щ

Alt+0217


:

Alt+58

Alt+314

z

Alt+122

Alt+378

Alt+186

Alt+442

·

Юникод — Википедия

Юнико́д[1] (чаще всего) или Унико́д[2] (англ.  Unicode) — стандарт кодирования символов, включающий в себя знаки почти всех письменных языков мира[3]. В настоящее время стандарт является преобладающим в Интернете.

Логотип Консорциума Юникода

Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium, Unicode Inc.)[4][5]. Применение этого стандарта позволяет закодировать очень большое число символов из разных систем письменности: в документах, закодированных по стандарту Юникод, могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, символы музыкальной нотной нотации, при этом становится ненужным переключение кодовых страниц[6].

Стандарт состоит из двух основных частей: универсального набора символов (англ. Universal character set, UCS) и семейства кодировок (англ. Unicode transformation format, UTF). Универсальный набор символов перечисляет допустимые по стандарту Юникод символы и присваивает каждому символу код в виде неотрицательного целого числа, записываемого обычно в шестнадцатеричной форме с префиксом U+, например, U+040F. Семейство кодировок определяет способы преобразования кодов символов для передачи в потоке или в файле.

Коды в стандарте Юникод разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII, и коды этих символов совпадают с их кодами в ASCII. Далее расположены области символов других систем письменности, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем[7]. Под символы кириллицы выделены области знаков с кодами от U+0400 до U+052F, от U+2DE0 до U+2DFF, от U+A640 до U+A69F (см. Кириллица в Юникоде)[8].

 Unicode — это уникальный код для любого символа, независимо от платформы, независимо от программы, независимо от языка.Консорциум Юникода[9] 

К концу 1980-х годов стандартом стали 8-битные кодировки, их существовало уже большое множество, и постоянно появлялись новые. Это объяснялось как расширением круга поддерживаемых языков, так и стремлением создавать кодировки, частично совместимые между собой (характерный пример — появление альтернативной кодировки для русского языка, обусловленное эксплуатацией западных программ, созданных для кодировки CP437). В результате появилось несколько проблем:

  1. проблема неправильной раскодировки;
  2. проблема ограниченности набора символов;
  3. проблема преобразования одной кодировки в другую;
  4. проблема дублирования шрифтов.

Проблема неправильной раскодировки вызывала появление в документе символов иностранных языков, не предполагавшихся в документе, или появление не предполагавшихся псевдографических символов, прозванных русскоязычными пользователями «кракозябрами». Проблема во многом была вызвана отсутствием стандартизированной формы указания кодировки для файла или потока. Проблему можно было решить либо последовательным внедрением стандарта указания кодировки, либо внедрением общей для всех языков кодировки.[6]

Проблема ограниченности набора символов[6]. Проблему можно было решить либо переключением шрифтов внутри документа, либо внедрением «широкой» кодировки. Переключение шрифтов издавна практиковалось в текстовых процессорах, причём часто использовались шрифты с нестандартной кодировкой, т.  н. «dingbat fonts». В итоге при попытке переноса документа в другую систему все нестандартные символы превращались в «кракозябры».

Проблема преобразования одной кодировки в другую. Проблему можно было решить либо составлением таблиц перекодировки для каждой пары кодировок, либо использованием промежуточного преобразования в третью кодировку, включающую все символы всех кодировок[10].

Проблема дублирования шрифтов. Для каждой кодировки создавался свой шрифт, даже если наборы символов в кодировках совпадали частично или полностью. Проблему можно было решить путём создания «больших» шрифтов, из которых впоследствии выбирались бы нужные для данной кодировки символы. Однако это требовало создания единого реестра символов, чтобы определять, чему что соответствует.

Была признана необходимость создания единой «широкой» кодировки. Кодировки с переменной длиной символа, широко использующиеся в Восточной Азии, были признаны слишком сложными в использовании, поэтому было решено использовать символы фиксированной ширины. Использование 32-битных символов казалось слишком расточительным, поэтому было решено использовать 16-битные.

Первая версия Юникода представляла собой кодировку с фиксированным размером символа в 16 бит, то есть общее число кодов было 216 (65 536). С тех пор символы стали обозначать четырьмя шестнадцатеричными цифрами (например, U+04F0). При этом в Юникоде планировалось кодировать не все существующие символы, а только те, которые необходимы в повседневном обиходе. Редко используемые символы должны были размещаться в «области пользовательских символов» (private use area), которая первоначально занимала коды U+D800…U+F8FF. Чтобы использовать Юникод также и в качестве промежуточного звена при преобразовании разных кодировок друг в друга, в него включили все символы, представленные во всех наиболее известных кодировках.

В дальнейшем, однако, было принято решение кодировать все символы и в связи с этим значительно расширить кодовую область. Одновременно с этим, коды символов стали рассматриваться не как 16-битные значения, а как абстрактные числа, которые в компьютере могут представляться множеством разных способов (см. способы представления).

Поскольку в ряде компьютерных систем (например, Windows NT[11]) фиксированные 16-битные символы уже использовались в качестве кодировки по умолчанию, было решено все наиболее важные знаки кодировать только в пределах первых 65 536 позиций (так называемая англ. Basic Multilingual Plane, BMP). Остальное пространство используется для «дополнительных символов» (англ. supplementary characters): систем письма вымерших языков или очень редко используемых китайских иероглифов, математических и музыкальных символов.

Для совместимости со старыми 16-битными системами была изобретена система UTF-16, где первые 65 536 позиций, за исключением позиций из интервала U+D800…U+DFFF, отображаются непосредственно как 16-битные числа, а остальные представляются в виде «суррогатных пар» (первый элемент пары из области U+D800…U+DBFF, второй элемент пары из области U+DC00…U+DFFF). Для суррогатных пар была использована часть кодового пространства (2048 позиций), отведённого «для частного использования».

Поскольку в UTF-16 можно отобразить только 220+216−2048 (1 112 064) символов, то это число и было выбрано в качестве окончательной величины кодового пространства Юникода (диапазон кодов: 0x000000-0x10FFFF).

Хотя кодовая область Юникода была расширена за пределы 216 уже в версии 2.0, первые символы в «верхней» области были размещены только в версии 3.1.

Роль этой кодировки в веб-секторе постоянно растёт. На начало 2010 доля веб-сайтов, использующих Юникод, составила около 50 %[12].

плюсы и минусы использования в html

 

Таблица символов юникода

 

Раньше я считала что Юникод ( Unicode) и UTF-8 разные форматы кодирования символов. Но я очень ошибалась. Юникод — стандарт кодирования всех символов, уникальный код для любого символа не зависит от платформы, программы и языка. UTF-8 это восьми битный формат преобразования юникода, который используется при верстке HTML сайтов.

 

 

Информацию о кодировке можно увидеть как только откроем исходный код сайта Ctrl + U. Запись кода выглядит так:

 

<meta charset="utf-8" />

 

Кодировка utf-8 в исходном коде сайта

 

Использование специальных символов Html (символы юникода)

 

Существуют символы, которые нельзя набрать на клавиатуре разнообразными сочетаниями клавиш, потому и пользуются веб дизайнеры удивительными символами юникода. Графические символы UTF-8, специальные значки, звездочки, красивые цифры и другие символы можно использовать для статусов вк вконтакте, одноклассниках и в других соц сетях.

 

Копируем символ и вставляем в текст, или конвертируем символ в код и вставляем в любое место сайта. В сообщениях коды символов добавляются только в редакторе Html. Редактируем символы как текст: размер, шрифт, цвет текста.

 

Для наглядности привела примеры ниже:

 

✓ — Зеленая галочка, популярный символ в веб дизайне.

 

» » » » Символ кавычки «Ёлочка» для оформления текста.

 

►►► Символ юникода треугольник незаменимый атрибут веб дизайнеров.

 

Таблица символов юникода

 

Таблица символов юникода
§
°±×÷
²³αβγ
π½¼¾
>Ⅰ>Ⅱ>Ⅲ
>Ⅳ
¢£
¥©®
<
«»

 

Конвертер символов юникода

 

Символ  

Юникод

 

Плюсы и минусы применения специальных символов юникода

 

Плюсы: Многие элементы веб дизайна используются без применения изображений.

 

Минусы: Не все браузеры обрабатывают юникод правильно, многие символы не видно на веб страничках. Обратите внимание у всех в таблицах в интернете есть пустые квадратики.

 

Самая лучшая таблица символов юникода на этом сайте 

 

Читайте также:

Будь вместе с Я Блоггер

 

Будь в тренде!

Получай материалы прямиком в свою почту

*

ПОДПИШИСЬ!

Я даю согласие на сбор и обработку своих персональных и не
персональных данных согласно действующей на сайте — политике конфиденциальности.

Поделиться в соцсетях

Каков полный диапазон китайских символов в Юникоде?

Unicode версия 11.0.0

В Unicode сценарии на китайском, японском и корейском (CJK) имеют общую основу, известную как символы CJK.

Эти диапазоны часто содержат неназначенные или зарезервированные кодовые точки (сосут как U + 2E9A , U + 2EF4 — 2EFF),

Китайские символы

bottom  top     reference(also have a look at wiki page)    block name
4E00    9FEF    http://www. unicode.org/charts/PDF/U4E00.pdf CJK Unified Ideographs
3400    4DBF    http://www.unicode.org/charts/PDF/U3400.pdf CJK Unified Ideographs Extension A
20000   2A6DF   http://www.unicode.org/charts/PDF/U20000.pdf    CJK Unified Ideographs Extension B
2A700   2B73F   http://www.unicode.org/charts/PDF/U2A700.pdf    CJK Unified Ideographs Extension C
2B740   2B81F   http://www.unicode.org/charts/PDF/U2B740.pdf    CJK Unified Ideographs Extension D
2B820   2CEAF   http://www.unicode.org/charts/PDF/U2B820.pdf    CJK Unified Ideographs Extension E
2CEB0   2EBEF   https://www.unicode.org/charts/PDF/U2CEB0.pdf   CJK Unified Ideographs Extension F
3007    3007    https://zh.wiktionary.org/wiki/%E3%80%87    in block CJK Symbols and Punctuation
  • В блоке CJK Unified Ideographs я заметил, что во многих ответах используется верхняя граница 9FCC, но U + 9FCD (鿍) действительно является китайским символом. И все символы в этом блоке являются китайскими (также используются на японском, корейском и т. Д.).
  • Большинство символов в CJK Unified Ideograohs Ext (кроме Ext F, только 17% в Ext F являются китайскими иероглифами), являются традиционными китайскими иероглифами, которые редко используются в Китае.
  • Form — это китайская иероглифическая форма нуля, которая все еще используется сегодня

Поэтому диапазон

[0x3007,0x3007], [0x3400,0x4DBF], [0x4E00,0x9FEF], [0x20000,0x2EBFF]

Символы CJK, но никогда не используются на китайском языке

Они обыкновенные ханы используются только для совместимости.

Их практически невозможно увидеть в любой китайской книге, статье, письме и т. Д.

все символы здесь имеют один соответствующий глиф-идентичный китайский символ. Такие как 金 (U + F90A) и 金 (U + 91D1), они одинаковы в Glyph.

 F900    FAFF   https://www.unicode.org/charts/PDF/UF900.pdf  CJK Compatibility Ideographs
2F800   2FA1F   https://www.unicode.org/charts/PDF/U2F800.pdf CJK Compatibility Ideographs Supplement

CJK связанные символы

2E80    2EFF    http://www. unicode.org/charts/PDF/U2E80.pdf CJK Radicals Supplement

2F00    2FDF    http://www.unicode.org/charts/PDF/U2F00.pdf Kangxi Radicals 
2FF0    2FFF    https://unicode.org/charts/PDF/U2FF0.pdf    Ideographic Description Character
3000    303F    https://www.unicode.org/charts/PDF/U3000.pdf    CJK Symbols and Punctuation
3100    312f    https://unicode.org/charts/PDF/U3100.pdf    Bopomofo
31A0    31BF    https://unicode.org/charts/PDF/U31A0.pdf    Bopomofo Extended
31C0    31EF    http://www.unicode.org/charts/PDF/U31C0.pdf CJK Strokes
3200    32FF    https://unicode.org/charts/PDF/U3200.pdf    Enclosed CJK Letters and Months
3300    33FF    https://unicode.org/charts/PDF/U3300.pdf    CJK Compatibility
FE30    FE4F    https://www.unicode.org/charts/PDF/UFE30.pdf    CJK Compatibility Forms
FF00    FFEF    https://www.unicode.org/charts/PDF/UFF00.pdf    Halfwidth and Fullwidth Forms
1F200   1F2FF   https://www.unicode.org/charts/PDF/U1F200.pdf   Enclosed Ideographic Supplement
  • некоторые блоки, такие как Hangul Compatibility Jamo , оставлены из-за отсутствия отношения к китайскому языку.
  • Kangxi Radicals — это не китайские иероглифы, это графический компонент китайских символов, они используются специально для выражения радикалов .eg e (U + 2F3B) и 彳 (U + 5F73), ⻜ (U + 2EDC) и 飞 (U +) 98DE)

Другая распространенная пунктуация появляется на китайском

Это широкий диапазон, некоторые знаки препинания, возможно, никогда не используются, некоторые знаки препинания, ……”“которые так часто используются в китайском языке.

0000    007F    https://unicode.org/charts/PDF/U0000.pdf    C0 Controls and Basic Latin 
2000    206F    https://unicode.org/charts/PDF/U2000.pdf    General Punctuation
……

Есть также много связанных с китайцами символов, таких как символы гексаграммы Ицзин или Канбун , но это в любом случае не по теме. Я пишу не китайские иероглифы в CJK, чтобы лучше объяснить, что такое китайские иероглифы. И диапазоны выше уже охватывают почти все символы в китайской письменности, кроме математики и других специальных обозначений.

дополнительный

CJK Символы и Пунктуация

 、。〃〄々〆〇〈〉《》「」『』【】〒〓〔〕〖〗〘〙〚〛〜〝〞〟〠〡〢〣〤〥〦〧〨〩〪〭〮〯〫〬〰〱〲〳〴〵〶〷〸〹〺〻〼〽 〾 〿

Полуширина и Полноширинные формы

!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~⦅⦆。「」、・ヲァィゥェォャュョッーアイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワン゙゚ᄀᄁᆪᄂᆬᆭᄃᄄᄅᆰᆱᆲᆳᆴᆵᄚᄆᄇᄈᄡᄉᄊᄋᄌᄍᄎᄏᄐᄑ하ᅢᅣᅤᅥᅦᅧᅨᅩᅪᅫᅬᅭᅮᅯᅰᅱᅲᅳᅴᅵ¢£¬ ̄¦¥₩│←↑→↓■○

обращаться

  1. https://zh.wikipedia.org/wiki/%E6%B1%89%E5%AD%97 (на китайском языке обратите внимание на правую боковую панель)
  2. https://zh.wikipedia.org/wiki/%E4%B8%AD%E6%97%A5%E9%9F%93%E7%9B%B8%E5%AE%B9%E8%A1%A8%E6 % 84% 8F% E6% 96% 87% E5% AD% 97
    (обратите внимание на нижнюю таблицу)
  3. http://www.unicode.org

Автор: Voyager
Размещён: 18.02.2019 12:40

О кодировках символов. Часть 2. Стандарт Unicode

История стандарта

Стандарт Unicode или ISO/IEC 10646 явился результатом сотрудничества Международной организации по стандартизации (ISO) с ведущими производителями компьютеров и программного обеспечения. Причины, изложенные на предыдущей странице, привели их к принципиально новой постановке вопроса: зачем тратить усилия на развитие отдельных кодовых таблиц, если можно создать единую таблицу для всех национальных языков? Такая задача кажется излишне амбициозной, но только на первый взгляд. Дело в том, что из 6700 живых языков официальными языками государств являются около полусотни, причем пользуются они примерно 25 различными письменностями: числа для нашего компьютерного века вполне обозримые.

Предварительная прикидка показала, что для кодирования всех этих письменностей достаточно 16-битового диапазона, т. е. диапазона от 0000 до FFFF. Каждой письменности был выделен свой блок в этом диапазоне, который постепенно заполнялся кодами символов этой письменности. На сегодня кодирование всех живых официальных письменностей можно считать завершенным.

Отработанная методика анализа и описания систем письма позволила консорциуму Unicode перейти в последнее время к кодированию остальных письменностей Земли, которые представляют какой-либо интерес: это письменности мертвых языков, выпавшие из современного обихода китайские иероглифы, искуственно созданные алфавиты и т. п. Для представления всего этого богатства 16-битового кодирования уже недостаточно, и сегодня Unicode использует 21-битовое пространство кодов (000000 — 10FFFF), которое разбито на 16 зон, названных плоскостями. Пока что в планах Unicode предусмотрено использование следующих плоскостей:

  • Плоскость 0 (коды 000000 — 00FFFF) — БМП, базовая многоязыковая плоскость (BMP, Basic Multilingual Plane), соответствует исходному диапазону Unicode.

  • Плоскость 1 (коды 010000 — 01FFFF) — ДМП, дополнительная многоязыковая плоскость (SMP, Supplementary Multilingual Plane), предназначена для мертвых письменностей.

  • Плоскость 2 (коды 020000 — 02FFFF) — ДИП, дополнительная иероглифическая плоскость (SIP, Supplementary Ideographic Plane), предназначена для иероглифов, не попавших в БМП.

  • Плоскость 14 (коды 0E0000 — 0EFFFF) — ДСП, дополнительная специальная плоскость (SSP, Supplementary Special-purpose Plane), предназначена для символов специального назначения.

  • Плоскость 15 (коды 0F0000 — 0FFFFF) — плоскость частного пользования (Private-Use Plane), предназначена для символов искусственных письменностей.

  • Плоскость 16 (коды 100000 — 10FFFF) — плоскость частного пользования (Private-Use Plane), предназначена для символов искусственных письменностей.

Разбивка БМП на блоки приведена в WDH: Стандарт Unicode. Здесь отметим только, что первые 128 кодов (00000 — 0007F) соответствуют кодам ASCII и кодируют блок базовой латиницы. Подробно раскладка письменностей по диапазону Unicode будет описана в моей статье «Unicode и письменности мира». Поскольку нас в дальнейшем будут интересовать только символы БМП, я использую их 16-битовые коды вида XXXX (старшие биты равны нулю и не указываются).

Действующей версией стандарта является Unicode 3.1, принятый в мае 2001 г. Все подробности можно найти на официальном сайте www.unicode.org.

Общее описание

В основе Unicode лежит понятие символа (character). Символ — это абстрактное понятие, которое существует в конкретной письменности и реализуется через свои изображения (графемы). Это означает, что каждый символ задается уникальным кодом и принадлежит к конкретному блоку Unicode. Например, графема А есть и в английском, и в русском, и в греческом алфавитах. Однако, в Unicode ей соответствуют три разных символа «латинская прописная буква А» (код 0041), «кириллическая прописная буква А» (код 0410) и «греческая прописная буква АЛЬФА» (код 0391). Если мы теперь применим к этим символам преобразование в строчную букву, то соответсвенно получим «латинскую строчную букву А» (код 0061, графема a), «кириллическую строчную букву А» (код 0430, графема а) и «греческую строчную букву АЛЬФА» (код 03B1, графема α), т. е. разные графемы.

Может возникнуть вопрос: что такое преобразование в строчную букву? Здесь мы подходим к самому интересному и важному моменту в стандарте. Дело в том, что Unicode — это не просто кодовая таблица. Концепция абстрактного символа позволила создателям Unicode построить базу данных символов, в которой каждый символ описывается своим уникальным кодом (ключом базы данных), полным названием и набором свойств. Например, символ с кодом 0410 описан в этой базе так:

0410;CYRILLIC CAPITAL LETTER A;Lu;0;L;;;;;N;;;;0430;

Расшифруем эту запись. Она означает, что код 0410 присвоен «кириллической прописной букве А» (полное название символа), которая имеет следующие свойства:

Общая категориястрочная буква (Lu = Letter, uppercase)
Класс сочетаний0
Направление выводаслева направо (L)
Декомпозиция символанет
Десятичная цифранет
Цифранет
Числовое значениенет
Зеркальный символотсутствует (N)
Полное название в Unicode 1.0то же
Комментарийнет
Отображение в прописную буквунет
Отображение в строчную букву0430
Отображение в титульную буквунет

Перечисленные свойства определены для каждого символа Unicode. Это позволило его разработчикам создать стандартные алгоритмы, которые определяют на основе свойств символов правила их визуализации, сортировки и преобразования в прописные/строчные буквы.

В итоге можно сказать, что стандарт Unicode состоит из трех взаимосвязанных частей:

  • базы данных символов;

  • базы графем (glyphs), определяющих визуальное представление этих символов;

  • набора алгоритмов, определяющих правила работы с символами.

В заключение этого раздела приведем графемы блока кириллицы (коды 0400 — 04FF). Обратите внимание, что он включает в себя не только буквы современных кириллических алфавитов (русского, украинского, белорусского, болгарского, сербского, македонского и пр.), но и все буквы первоначальной кириллицы, использовавшиеся в церковнославянской письменности.

Трансформационные форматы

Как мы видели, каждый символ Unicode имеет уникальный 21-битовый код (code point). Однако, для практической реализации такая кодировка символов неудобна. Дело в том, что операционные системы и сетевые протоколы традиционно работают с данными как с потоками байтов. Это приводит, как минимум, к двум проблемам:

  • Порядок байтов в слове у разных процессоров различен. Процессоры Intel, DEC и др. хранят в первом байте машинного слова его старший байт, а процессоры Motorola, Sparc и др. — младший байт. Их соответственно называют little-endian и big-endian (эти термины происходят от «остроконечников» и «тупоконечников» у Свифта, споривших о том, с какого конца нужно разбивать яйца).

  • Многие байт-ориентированные системы и протоколы допускают использование в качестве данных только байтов из определенного диапазона. Остальные байты рассматриваются как служебные; в частности, нулевой байт принято использовать как символ конца строки. Поскольку Unicode кодирует символы подряд, прямая передача его кодов как цепочки байтов может войти в противоречие с правилами протокола передачи данных.

Для преодоления этих проблем стандарт включает в себя три трансформационных формата UTF-8, UTF-16 и UTF-32, которые определяют соответственно правила кодирования символов Unicode цепочками байтов, парами 16-битовых слов и 32-битовыми словами. Выбор используемого формата зависит от архитектуры вычислительной системы и стандартов хранения и передачи данных. Краткое описание трансформационных форматов можно найти в WDH: Стандарт Unicode.

Проблемы реализации

Думаю, что даже из приведенного выше краткого описания стандарта Unicode ясно, что его полная поддержка основными операционными системами будет означать революцию в области обработки текстов. Пользователь, сидящий за любым терминалом Сети, сможет выбрать любую раскладку клавиатуры, набрать текст на любом языке и передать его на любой компьютер, который правильно этот текст отобразит. Базы данных смогут хранить, правильно сортировать и выводить в отчеты текстовую информацию опять-таки на любом языке. Для того, чтобы этот рай наступил, необходимы пять вещей:

  1. Операционные системы должны поддерживать трансформационные форматы Unicode на уровне ввода, хранения и отображения текстовых строк.

  2. Необходимы «умные» драйверы клавиатур, позволяющие нам вводить символы любого блока Unicode и передающие их коды операционной системе.

  3. Текстовые редакторы должны поддерживать отображение всех символов Unicode и выполнять над ними общепринятый набор символьных операций.

  4. То же самое должно правильно выполняться СУБД в отношении текстовых и memo-полей.

  5. Поскольку национальные кодировки еще долгое время будут сосуществовать с Unicode, необходима поддержка преобразований текста между ними.

С сожалением приходится признать, что за десять лет (Unicode 1.0 появился в 1991 г.) в этом направлении сделано гораздо меньше, чем хотелось бы. Даже Windows, содержащая на системном уровне наиболее последовательную поддержку Unicode, полна абсолютно иррациональных ограничений, объясняемых только ее историческим развитием. В Unix ситуация еще хуже, поскольку здесь поддержка Unicode перенесена из ядра на конкретные приложения. Можно утверждать, что на сегодня наиболее серьезно Unicode поддерживается в двух средах: веб-браузерах и виртуальных Java-машинах. Это не удивительно, поскольку обе среды изначально создавались как системно-независимые.

Следует отметить и объективные трудности поддержки Unicode. Для примера остановимся только на отображении графем, для которого нужно установить в системе соответствующие шрифты. Проблема в том, что шрифт, содержащий все графемы Unicode будет иметь совершенно несуразный размер. Например, TrueType-шрифт Arial Unicode MS, содержащий большую порцию символов Unicode, «весит» 24Мб. По мере наполнения Unicode новыми блоками размер таких шрифтов приблизится к 100Мб. Выходом из положения может послужить предложенная Microsoft загрузка символов по требованию, принятая в их браузере Internet Explorer. Однако, пока стандарты о правилах формирования Unicode-шрифтов молчат.

Способы работы с символами Unicode и национальных кодировок в важнейших средах и системах программирования будут рассмотрены в следующих статьях.

Юрий Лукач

Разное

info/stati/o_kodirovkax_simvolov_2.txt · Последние изменения: 2015/10/20 07:40 (внешнее изменение)

☆ Спец — символы HTML, таблица кодов ☆ ASCII-таблица символов ☆

Подробности
Просмотров: 11645

Можно сказать что здесь собраны все символы HTML  сколько нибудь интересные в реальном применении на сайте.

Специальные символы — оживляют как текст так и тайтл сайта. Но их применение сопряжено с некоторыми неудобствами.

Так как большинство движков фильтрует вводимую информацию и попасть в тайтл такому спецсиволу достаточно проблематично. 

Т.е в html-коде нужно вставлять спецсимволы в виде мнемоники или кода, а в окне визуального редакторе движка непосредственно уже картинку спец символа  представленного слева в таблице.

☞ Таблица символов Юникода:

































































































СимволСводная таблица специальных HTML — кодовМнемоникаКод
 Пробел &nbsp; &nbsp;
ǀвертикальная черта &#448;
ǁдвойная вертикальная черта &#449;
©copyright&copy;&#169;
®знак регистрации товарного знака&reg;&#174;
товарный знак&trade;&#153;
¤валюта&curren;&#164;
евро&euro;&#128;
$доллар &#36;
¢цент&cent;&#162;
¥иена&yen;&#165;
£фунт&pound&#163;
+плюс&plus;&#43;
минус&minus;&#45;
=равно &#61;
±плюс-минус&plusmn;&#177;
×знак умножения&times;&#215;
÷знак деления&divide;&#247;
середина строки&sdot;&#183; &#8901;
оператор звёздочка&lowast;&#8727;
оператор тильда&sim;&#8764;
маркер списка &bull;&#149;
¹верхний индекс 1&sup1;&#185;
²верхний индекс 2&sup2;&#178;
³верхний индекс 3&sup3;&#179;
¼дробь одна четвёртая&frac14;&#188;
½дробь одна вторая&frac12;&#189;
¾дробь три четверти&frac34;&#190;
знак номера &#8470;
%процент &#37;
промилле&permil;&#137;
°градусы&deg;&#176;
минуты, футы&prime;&#8242;
секунды, дюймы 
 
&Prime;&#8243;
µмикро&micro;&#181;
πПи&pi;&#960;
ƒзнак функции &fnof;&#131; &#402;
интеграл&int;&#8747;
пустое множество&empty;&#8709;
диаметр &#8960
знак произведения&prod;&#8719;
знак суммирования&sum;&#8721;
квадратный корень &radic;&#8730;
пропорционально&prop;&#8733;
бесконечность&infin;&#8734;
угол&ang;&#8736;
перпендикулярно&perp;&#8869;
знак cледовательно&there4;&#8756;
приблизительно равно&cong;&#8773;
почти равно&asymp;&#8776;
не равно&ne;&#8800;
идентично&equiv;&#8801;
меньше или равно&le;&#8804;
больше или равно&ge;&#8805;
логическое И&and;&#8743;
логическое ИЛИ&or;&#8744;
прямая сумма&oplus;&#8853;
векторное произведение&otimes;&#8855;
ʘточка в круге  &#664;
← &larr; &#8592;↑ &uarr; &#8593;→ &rarr; &#8594;↓ &darr; &#8595;↔ &harr; &#8596;⇆   &#8646;
⇐ &lArr; &#8656;⇑ &uArr; &#8657;⇒ &rArr; &#8658;⇓ &dArr; &#8659;⇔ &hArr; &#8660; 
↵ &crarr; &#8629;↯   &#8623;☇   &#9735;✎   &#9998;✏   &#9999;✐   &#10000;
▲ &#9650;► &#9658;▼ &#9660;◄ &#9668;✑ &#10001;✒ &#10002;
☚ &#9754;☛ &#9755;☞ &#9758;☟ &#9759;  ☝ &#9757;

 

☜ &#9756;  

˂ &#706;˃ &#707;˄ &#708;˅ &#709;  
 † &dagger; &#134;‡ &Dagger; &#450;☦   &#9766;☨   &#9768;♰   &#9840;♱   &#9841;
✙ &#10009;✚ &#10010;✛ &#10011;✜ &#10012;✝ &#10013;✞ &#10014;
✟ &#10015;✠ &#10016;✢ &#10018;✣ &#10019;✤ &#10020;✥ &#10021;
✦ &#10022;✧ &#10023;❖ &#10070;✡ &#10017;    
☀ &#9728;☼ &#9788;☽ &#9789;☾ &#9790;✌ &#9996;    ✍ &#9997;
♨ &#9832;☁ &#9729;☂ &#9730;☃ &#9731;☄ &#9732;✈ &#9992;  
☎ &#9742;☏ &#9743;✆ &#9990;✄ &#9988;✃ &#9987;✉ &#9993;
★ &#9733;☆ &#9734;✩ &#10025;✪ &#10026;✫ &#10027;✬ &#10028;
✭ &#10029;✮ &#10030;✯ &#10031;✰ &#10032;  ❉ &#10057;    ❋ &#10059;  
✱ &#10033;✲ &#10034;✳ &#10035;✴ &#10036;✵&#10037;❊ &#10058;  
✷ &#10039;✸ &#10040✹ &#10041;✺ &#10042;✻ &#10043;✼ &#10044;
✽ &#10045;✾ &#10046;✿ &#10047;❀ &#10048;❁ &#10049;❂ &#10050;
❃ &#10051;❄ &#10052;❅ &#10053;❆ &#10054;❇ &#10055;❈ &#10056;
❍ &#10061;❏ &#10063;❐ &#10064;❑ &#10065;❒ &#10066; 
☠ &#9760;☢ &#9762;☣ &#9763;✇ &#9991;  
✓ &#10003;✔ &#10004;✕ &#10005;✖ &#10006;✗ &#10007;✘ &#10008;
☑ &#9745;☒ &#9746;☓ &#9747;☡ &#9761;  
☤ &#9764;☥ &#9765;☧ &#9767;☩ &#9769;☪ &#9770;☫ &#9771;
☬ &#9772;☭ &#9773;☮ &#9774;☯ &#9775;☸ &#9784;☺ &#9786;  
☿ &#9791;♀ &#9792;♁ &#9793;♂ &#9794;☹ &#9785;  ☻ &#9787;  
♃ &#9795;♄ &#9796;♅ &#9797;♆ &#9798;♇ &#9799;♈ &#9800;
♉ &#9801;♊ &#9802;♋ &#9803;♌ &#9804;♍ &#9805;♎ &#9806;
♏ &#9807;♐ &#9808;♑ &#9809;♒ &#9810;♓ &#9811; 
♲ &#9842;♳ &#9843;♴ &#9844;♵ &#9845;♶ &#9846;♷ &#9847;
♸ &#9848;♹ &#9849;♺ &#9850;♻ &#9851;♼ &#9852;♽ &#9853;
♠ &spades; &#9824;♣ &clubs; &#9827;♥ &hearts; &#9829;♦ &diams; &#9830;  
♤ &#9828;♧ &#9831;♡ &#9825;♢ &#9826;  
♔ &#9812;♕ &#9813;♖ &#9814;♗ &#9815;♘ &#9816;♙ &#9817;
♚ &#9818;♛ &#9819;♜ &#9820;♝ &#9821;♞ &#9822;♟ &#9823;
♯ &#9839;♭ &#9837;♮ &#9838;  ♪ &#9834;  ♫ &#9835;♬ &#9836;  
Добавить комментарий

символы Юникода Emoji для использования в Интернете

😁 😁 😁 U + 1F601 \ xF0 \ x9F \ x98 \ x81 УЛЫБАЮЩЕЕ ЛИЦО С УЛЫБАЮЩИМИСЯ ГЛАЗАМИ
😂 😂 😂 U + 1F602 \ xF0 \ x9F \ x98 \ x82 ЛИЦО СО СЛЕЗАМИ РАДОСТИ
😃 😃 😃 U + 1F603 \ xF0 \ x9F \ x98 \ x83 УЛЫБКА С ОТКРЫТЫМ РТОМ
😄 😄 😄 U + 1F604 \ xF0 \ x9F \ x98 \ x84 УЛЫБНОЕ ЛИЦО С ОТКРЫТЫМ РТОМ И УЛЫБАЮЩИМИ ГЛАЗАМИ
😅 😅 😅 U + 1F605 \ xF0 \ x9F \ x98 \ x85 Улыбающееся лицо с открытым ртом и холодным потом
😆 😆 😆 U + 1F606 \ xF0 \ x9F \ x98 \ x86 УЛЫБНОЕ ЛИЦО С ОТКРЫТЫМ РТОМ И ПЛОТНО ЗАКРЫТЫМИ ГЛАЗАМИ
😉 😉 😉 U + 1F609 \ xF0 \ x9F \ x98 \ x89 подмигивающее лицо
😊 😊 😊 U + 1F60A \ xF0 \ x9F \ x98 \ x8A УЛЫБКА НА ЛИЦЕ
😋 😋 😋 U + 1F60B \ xF0 \ x9F \ x98 \ x8B ВКУСНЫЕ ПРОДУКТЫ ДЛЯ ЛИЦА
😌 😌 😌 U + 1F60C \ xF0 \ x9F \ x98 \ x8C ОБРАБОТАННОЕ ЛИЦО
😍 😍 😍 U + 1F60D \ xF0 \ x9F \ x98 \ x8D УЛЫБНОЕ ЛИЦО С ГЛАЗАМИ СЕРДЦА
😏 😏 😏 U + 1F60F \ xF0 \ x9F \ x98 \ x8F УЛЫБКА
😒 😒 😒 U + 1F612 \ xF0 \ x9F \ x98 \ x92 НЕИЗБРАННОЕ ЛИЦО
😓 😓 😓 U + 1F613 \ xF0 \ x9F \ x98 \ x93 ЛИЦО С ХОЛОДНЫМ ТОПОМ
😔 😔 😔 U + 1F614 \ xF0 \ x9F \ x98 \ x94 ПЕНСОРНАЯ ЛИЦА
😖 😖 😖 U + 1F616 \ xF0 \ x9F \ x98 \ x96 ОБНОВЛЕННОЕ ЛИЦО
😘 😘 😘 U + 1F618 \ xF0 \ x9F \ x98 \ x98 ПОЦЕЛУЙ В ЛИЦУ
😚 😚 😚 U + 1F61A \ xF0 \ x9F \ x98 \ x9A ЦЕЛОВУЮЩЕЕ ЛИЦО С ЗАКРЫТЫМИ ГЛАЗАМИ
😜 😜 😜 U + 1F61C \ xF0 \ x9F \ x98 \ x9C ЛИЦО С ВЫЛЕТАННЫМ ЯЗЫКОМ И МОРЯЩИМ ГЛАЗОМ
😝 😝 😝 U + 1F61D \ xF0 \ x9F \ x98 \ x9D ЛИЦО С ВЫКЛЮЧЕННЫМ ЯЗЫКОМ И ПЛОТНО ЗАКРЫТЫМИ ГЛАЗАМИ
😞 😞 😞 U + 1F61E \ xF0 \ x9F \ x98 \ x9E РАЗОЧАРОВАНИЕ ЛИЦА
😠 😠 😠 U + 1F620 \ xF0 \ x9F \ x98 \ xA0 ЗЛОЕ ЛИЦО
😡 😡 😡 U + 1F621 \ xF0 \ x9F \ x98 \ xA1 ВЫПУСКНАЯ ПАНЕЛЬ
😢 😢 😢 U + 1F622 \ xF0 \ x9F \ x98 \ xA2 ПЛАЧУЩИЙ ЛИЦ
😣 😣 😣 U + 1F623 \ xF0 \ x9F \ x98 \ xA3 ПОСТОЯННОЕ ЛИЦО
😤 😤 😤 U + 1F624 \ xF0 \ x9F \ x98 \ xA4 ЛИЦО С ВИДОМ ТРИУМФА
😥 😥 😥 U + 1F625 \ xF0 \ x9F \ x98 \ xA5 Разочарованное, но облегченное лицо
😨 😨 😨 U + 1F628 \ xF0 \ x9F \ x98 \ xA8 СТРАЖНОЕ ЛИЦО
😩 😩 😩 U + 1F629 \ xF0 \ x9F \ x98 \ xA9 усталое лицо
😪 😪 😪 U + 1F62A \ xF0 \ x9F \ x98 \ xAA СОННОЕ ЛИЦО
😫 😫 😫 U + 1F62B \ xF0 \ x9F \ x98 \ xAB УСТАРЕЛ ЛИЦО
😭 😭 😭 U + 1F62D \ xF0 \ x9F \ x98 \ xAD ГРОМКО ПЛАЧНОЕ ЛИЦО
😰 😰 😰 U + 1F630 \ xF0 \ x9F \ x98 \ xB0 ЛИЦО С ОТКРЫТЫМ РТОМ И ХОЛОДНЫМ ТОПОМ
😱 😱 😱 U + 1F631 \ xF0 \ x9F \ x98 \ xB1 КРИК ЛИЦА В СТРАХЕ
😲 😲 😲 U + 1F632 \ xF0 \ x9F \ x98 \ xB2 УДИВЛЕННОЕ ЛИЦО
😳 😳 😳 U + 1F633 \ xF0 \ x9F \ x98 \ xB3 ПРОМЫВЛЕННОЕ ЛИЦО
😵 😵 😵 U + 1F635 \ xF0 \ x9F \ x98 \ xB5 ДИЗЗИ ЛИЦО
😷 😷 😷 U + 1F637 \ xF0 \ x9F \ x98 \ xB7 ЛИЦО С МЕДИЦИНСКОЙ МАСКОЙ
😸 😸 😸 U + 1F638 \ xF0 \ x9F \ x98 \ xB8 УЛЫБАЮЩАЯСЯ КОШКА С УЛЫБКИМИ ГЛАЗАМИ
😹 😹 😹 U + 1F639 \ xF0 \ x9F \ x98 \ xB9 Кошачья морда со слезами радости
😺 😺 😺 U + 1F63A \ xF0 \ x9F \ x98 \ xBA УЛЫБАЮЩАЯСЯ КОШКА С ОТКРЫТЫМ РТОМ
😻 😻 😻 U + 1F63B \ xF0 \ x9F \ x98 \ xBB УЛЫБАЮЩАЯСЯ КОШКА С ГЛАЗАМИ СЕРДЦА
😼 😼 😼 U + 1F63C \ xF0 \ x9F \ x98 \ xBC Кошачье лицо с кривой улыбкой
😽 😽 😽 U + 1F63D \ xF0 \ x9F \ x98 \ xBD Целующаяся кошачья морда с закрытыми глазами
😾 😾 😾 U + 1F63E \ xF0 \ x9F \ x98 \ xBE ЛИЦО КОШКИ
😿 😿 😿 U + 1F63F \ xF0 \ x9F \ x98 \ xBF ПЛАЧУЩАЯ КОШКА ЛИЦА
🙀 🙀 🙀 U + 1F640 \ xF0 \ x9F \ x99 \ x80 УТАЛЕННАЯ ЛИЦА КОШКИ
🙅 🙅 🙅 U + 1F645 \ xF0 \ x9F \ x99 \ x85 ЛИЦО БЕЗ ХОРОШЕГО ЖЕСТА
🙆 🙆 🙆 U + 1F646 \ xF0 \ x9F \ x99 \ x86 ЛИЦО С ЖЕСТОМ ОК
🙇 🙇 🙇 U + 1F647 \ xF0 \ x9F \ x99 \ x87 ЧЕЛОВЕК ГЛУБОКО КУШАЕТ
🙈 🙈 🙈 U + 1F648 \ xF0 \ x9F \ x99 \ x88 ОБЕЗЬЯНА НЕ ЗЛОЙ
🙉 🙉 🙉 U + 1F649 \ xF0 \ x9F \ x99 \ x89 СЛУШАТЬ-НЕ ЗЛОУ ОБЕЗЬЯНА
🙊 🙊 🙊 U + 1F64A \ xF0 \ x9F \ x99 \ x8A ОБЕЗЬЯНА ГОВОРИТ-НЕ ЗЛО
🙋 🙋 🙋 U + 1F64B \ xF0 \ x9F \ x99 \ x8B СЧАСТЛИВЫЙ ЧЕЛОВЕК, ПОДНИМАЮЩИЙ РУКУ
🙌 🙌 🙌 U + 1F64C \ xF0 \ x9F \ x99 \ x8C ПОДНИМАЮЩИЕ ОБЕИ РУКИ НА ПРАЗДНИК
🙍 🙍 🙍 U + 1F64D \ xF0 \ x9F \ x99 \ x8D ПЕРСОНАЖ
🙎 🙎 🙎 U + 1F64E \ xF0 \ x9F \ x99 \ x8E ЧЕЛОВЕК С ВЫСТУПАЮЩИМ ЛИЦОМ
🙏 🙏 🙏 U + 1F64F \ xF0 \ x9F \ x99 \ x8F ЧЕЛОВЕК СО СЛОЖЕННЫМИ РУКАМИ

Набор символов ANSI и эквивалентные символы Unicode и HTML

Набор символов ANSI из 217 символов, также известный как Windows-1252, был стандартом для основных шрифтов, поставляемых с американскими версиями Microsoft Windows вплоть до Windows 95 и Windows NT 4. За время существования этих двух продуктов Microsoft добавила символ валюты евро, доведя количество символов до 218, и представила новый базовый набор панъевропейских шрифтов, содержащих набор символов WGL4 (Windows Glyph List 4) с 652 символами.

Если вы используете старую версию Windows без Unicode, которая была разработана для нелатинского алфавита, такого как арабский, кириллица, греческий, иврит или тайский язык, для просмотра документа, набранного с использованием набора символов ANSI, то символы из этих языков может заменить некоторые из 128–255; эта проблема в основном решена теперь, когда Unicode широко используется, потому что он предоставляет уникальный числовой идентификатор для каждого символа.Подобные проблемы возникали при передаче документов ANSI на компьютеры DOS или Macintosh, потому что DOS и MacRoman по-разному размещают символы в диапазоне 128–255.

символов ANSI от 32 до 127 соответствуют символам в 7-битном наборе символов ASCII, который формирует диапазон символов Basic Latin Unicode. Символы 160–255 соответствуют символам в диапазоне символов Unicode Дополнения Latin-1. Позиции 128–159 в Дополнении Latin-1 зарезервированы для элементов управления, но большинство из них используется для печатаемых символов в ANSI; эквиваленты Unicode указаны в таблице ниже.Записи в столбце «Сущность» представляют собой ссылки на символьные сущности, которые могут использоваться в HTML и должны правильно интерпретироваться веб-браузерами, поддерживающими HTML 4.0.

Символы, которые появляются в первом столбце следующей таблицы, генерируются из ссылок на числовые символы Unicode, поэтому они должны правильно отображаться в любом веб-браузере, который поддерживает Unicode и в котором доступны подходящие шрифты, независимо от операционной системы.

000

4!

mark

слева родительский Базовая латиница

плюс

9000

Базовая латиница

9120 1 52

7575

2

000 9004 Basic

0004 D

U буква I

9 0004 Заглавная латинская буква J

9120 + 004F

9120 1 0x50

3

3

2 U

91

85

9 0004 V

91 0057 9205

Базовая латиница

900 Latin

_

04 91

9120 0x63

Латинская буква

91 +

91

000 9004 i

9000

Строчная латинская

левая

Базовая латиница

9120 правый кронштейн +

D

381

1

4

382

9120 и Y5000

Символ ANSI
Номер
Unicode
Номер
ANSI
Hex
Unicode
Hex
HTML 4. 0
Сущность
Имя Unicode Диапазон Unicode
» 32 32 0x20 U + 0020 пробел Basic Latin
33 33 0x21 U + 0021 восклицательный знак Basic Latin
« 34 34 9000 & quot; Basic Latin
# 35 35 0x23 U + 0023 Цифровой знак Basic Latin
$ 3600

$ 36 U + 0024 знак доллара базовая латиница
% 37 37 0x25 U + 0025 знак процента 38 0x26 U + 0026 и амперсанд Basic Latin
39 39 0x27 U + 0027 апостроф Базовая латиница
( 40 40 0x28 40 0x28
) 41 41 0x29 U + 0029 правая скобка Базовая латиница
* 42 42

A

42 звездочка базовая латиница
+ 43 43 0x2B U + 002B плюс знак 0x2C U + 002C запятая Basic Latin
45 9 0005

45 0x2D U + 002D дефис-минус Basic Latin
. 46 46 0x2E U + 002E полная остановка Basic Latin
/ 47 47 0x201000
0 48 48 0x30 U + 0030 нулевая цифра Базовая латиница
1 49
цифра один базовая латиница
2 50 50 0x32 U + 0032 цифра два базовая латиница4 91 51

базовая латиница4 911 0x33 U + 0033 три цифры Basic Latin
4 52 0x34 U + 0034 цифра четыре базовая латиница
5 53 53 0x35 U + 0035 9000 пять цифр
6 54 54 0x36 U + 0036 цифра шесть Basic Latin
7 55 55

55 55

цифра семь базовая латиница
8 56 56 0x38 U + 0038 цифра восемь базовая латиница
9 57 U + 0039 цифра девять Basic Latin
: 58 58 0x3 A U + 003A двоеточие Basic Latin
; 59 59 0x3B U + 003B точка с запятой Basic Latin
< 60 60 020×3000 U знак меньше Basic Latin
= 61 61 0x3D U + 003D знак равенства Basic Latin
5 0x3E U + 003E & gt; знак «больше» Basic Latin
? 63 63 0x3F U + 003F вопросительный знак Basic Latin
@ 64 64 0x40

для коммерческих

Базовая латиница
A 65 65 0x41 U + 0041 Заглавная латинская буква A Базовая латиница
B 665 91 U + 0042 Заглавная латинская буква B Basic Latin
C 67 67 0x43 U + 0043 Заглавная латинская буква C Latin 68 68 0x44 U + 0044 Заглавная латинская буква D Базовая латиница в
E 69 69 0x45 U + 0045 Заглавная латинская буква E Basic Latin
F 70 70 0046 Заглавная латинская буква F Базовая латиница
G 71 71 0x47 U + 0047 Заглавная латинская буква G
72 72 0x48 U + 0048 Заглавная латинская буква H Основная латиница
I 73 73 0x49

Basic Latin
J 74 74 0x4A U + 004A Заглавная латинская буква
K 75 75 0x4B U + 004B Заглавная латинская буква K Заглавная латинская буква
05

01 76 L 76

0x4C U + 004C Заглавная латинская буква L Базовая латиница
M 77 77 0x4D U + 004D Базовая латиница
N 78 78 0x4E U + 004E Заглавная латинская буква N Базовая латиница
O 79 79 Заглавная латинская буква O Basic Latin
P 80 80 U + 0050 Заглавная латинская буква P Basic Latin
Q 81 81 0x51 U + 0051 Q

Latin5
R 82 82 0x52 U + 0052 Заглавная латинская буква R Базовая латиница
S 83 83 83 83 Заглавная латинская буква S Основная латиница
T 84 84 0x54 U + 0054 Заглавная латинская буква T 85 0x55 U + 0055 Заглавная латинская буква U Базовая латиница
86 86 0x56 U + 0056 Заглавная латинская буква V Базовая латиница
W 87 87 Заглавная латинская буква W Заглавная латинская буква
X 88 88 0x58 U + 0058 Заглавная латинская буква X Основная латиница
05

Y 89 0x59 U + 0059 Заглавная латинская буква Y Заглавная латинская буква
Z 90 90 0x5A U + 004A
[ 91 91 0x5B U + 005B левая квадратная скобка Basic Latin
\ 92 92 0x5C U + 005C обратный солидус Basic Latin
]
] + 005D правая квадратная скобка Basic Latin
^ 94 94 0x5E U + 005E с циркумфлексом с диакритическими знаками 95 0x5F U + 005F low line Basic Latin
` 96 96 0x605 accent 9000 004 9000 Grave 9000 004
a 97 97 0x61 U + 0061 Строчная латиница буква a Basic Latin
b 98 98 0x62 U + 0062 Строчная латинская буква b Basic Latin
c U + 0063 Строчная латинская буква c Базовая латиница
d 100 100 0x64 U + 0064 Строчная латиница
e101101 0x65 U + 0065 Строчная латинская буква e Basic Latin
f 102 102 102 102 Строчная латинская буква f Базовая латиница
g103103 0x67 U + 0067 Строчная латинская буква g Базовая латиница
h 104 104 0x68 U + 0068 Строчная латинская буква h Латинская105105 0x69 U + 0069 Строчная латинская буква i Базовая латиница
j 106 106 0x206A 9000 9000 9000 9000 Латинская строчная буква j Базовая латиница
k 107 107 0x6B U + 006B Латинская строчная буква k Базовая латиница
05

01 91

05

01

0x6C U + 006C Строчная латинская буква l Базовая латиница
m 10 9109 0x6D U + 006D Строчная латинская буква m Базовая латиница
n 110 110 0x6E U n Basic Latin
o 111 111 0x6F U + 006F Строчные латинские буквы o Basic Latin
p U + 0070 Строчная латинская буква p Базовая латиница
q 113 113 0x71 U + 0071 латинская

r 114 114 0x72 U + 0072 Строчная латинская буква r Основной Latin
s 115 115 0x73 U + 0073 Строчная латинская буква s Basic Latin
t 116 91 116 0074 Строчная латинская буква t Базовая латиница
u 117 117 0x75 U + 0075 Строчная латинская буква u 22 Базовая латиница v

118 118 0x76 U + 0076 Строчная латинская буква v Базовая латиница
w 119 119 0x77

U буква w Basic Latin
x120 120 0x78 U + 0078 900 05

Строчная латинская буква x Базовая латиница
y 121 121 0x79 U + 0079 Строчная латинская буква y Базовая латиница
5

122 0x7A U + 007A Строчная латинская буква z Базовая латиница
{ 123 123 0x7B U +
| 124 124 0x7C U + 007C вертикальная линия Basic Latin
} 125 125 0x7000 9120 Basic Latin
~ 126 126 0x7E U + 007E тильда Basic Latin
127 127

127 (не используется)
128 8364 0x80 U + 20AC и евро; Знак евро Символы валюты
129 129 0x81 U + 0081 (не используется)
1 U + 201A & sbquo; одинарная кавычка с низким числом 9 Общая пунктуация
ƒ 131 402 0x83 U + 0192 & fnof; Строчная латинская буква f с крючком Расширенная латиница-B
132 8222 0x84 U + 201E & bdquo; двойная кавычка low-9 Общая пунктуация
133 8230 0x85 U + 2026 & hellip; многоточие по горизонтали Знаки пунктуации
134 8224 0x86 U + 2020 & dagger; кинжал Общая пунктуация
135 8225 0x87 U + 2021 & кинжал; двойной кинжал Общая пунктуация
ˆ 136 710 0x88 U + 02C6 & circ; буква-модификатор циркумфлекс с ударением Буквы-модификаторы интервалов
137 8240 0x89 U + 2030 & permil; знак промилле Общая пунктуация
Š 138 352 0x8A U + 0160 & Scaron; Заглавная латинская буква S с кароном Расширенная латиница-A
139 8249 0x8B U + 2039 & lsaquo; одинарная кавычка, указывающая влево Общая пунктуация
Œ140 338 0x8C U + 0152 & OElig; Заглавная латинская лигатура OE Расширенная латиница-A
141 141 0x8D U + 008D (не используется)
0x8E U + 017D Заглавная латинская буква Z с кароном Расширенная латиница-A
143 143 0x8F U не используется + U )
144 144 0x90 U + 0090 (не используется)
20 82165

2020 91 & lsquo; левая одинарная кавычка Общая пунктуация
146 8217 0x92 U + 2019 & rsquo; правая одинарная кавычка Общая пунктуация
147 8220 0x93 U + 201C & ldquo; левая двойная кавычка Общая пунктуация
148 8221 0x94 U + 201D & rdquo; правая двойная кавычка Общая пунктуация
149 8226 0x95 U + 2022 & bull; пуля Общая пунктуация
150 8211 0x96 U + 2013 & ndash; en тире Общая пунктуация
151 8212 0x97 U + 2014 & mdash; длинное тире Общая пунктуация
˜ 152 732 0x98 U + 02DC & тильда; маленькая тильда Буквы-модификаторы интервала
153 8482 0x99 U + 2122 & trade; знак товарного знака Буквенные символы
š 154 353 0x9A U + 0161 & scaron; Строчная латинская буква s с кароном Расширенная латиница-A
155 8250 0x9B U + 203A & rsaquo; одинарная кавычка с прямым углом Общая пунктуация
œ 156 339 0x9C U + 0153 & oelig; Строчная латинская лигатура oe Расширенная латиница-A
157 157 0x9D U + 009D (не используется) 0x9E U + 017E Строчная латинская буква z с кароном Расширенная латиница-A
Ÿ 159 376 0x9000 Заглавная латинская буква Y с диэрезисом Расширенная латиница-A
160 160 0xA0 U + 00A0 & nbsp; непрерывный пробел Дополнение Latin-1
¡ 161 161 0xA1 U + 00A1 & iexcl; перевернутый восклицательный знак Дополнение Latin-1
¢ 162 162 0xA2 U + 00A2 & cent; cent sign Latin-1 Supplement
£ 163 163 0xA3 U + 00A3 & pound; знак фунта Приложение Latin-1
¤ 164 164 0xA4 U + 00A4 & curren; знак валюты Приложение Latin-1
¥ 165 165 0xA5 U + 00A5 и йен; знак йены Дополнение к Latin-1
¦ 166 166 0xA6 U + 00A6 & brvbar; сломанный стержень Дополнение Latin-1
§ 167 167 0xA7 U + 00A7 & sect; знак раздела Приложение Latin-1
¨ 168 168 0xA8 U + 00A8 & uml; диэрезис Приложение Latin-1
© 169 169 0xA9 U + 00A9 & copy; знак авторского права Приложение Latin-1
ª170170 0xAA U + 00AA & ordf; женский порядковый указатель Приложение Latin-1
« 171 171 0xAB U + 00AB & laquo; двойные угловые кавычки, указывающие влево Дополнение к Latin-1
¬ 172 172 0xAC U + 00AC & not; без подписи Дополнение к Latin-1
173 173 0xAD U + 00AD & shy; мягкий дефис Дополнение к Latin-1
® 174 174 0xAE U + 00AE & reg; зарегистрированный знак Приложение Latin-1
¯ 175 175 0xAF U + 00AF & macr; macron Дополнение к Latin-1
° 176 176 0xB0 U + 00B0 & deg; знак градуса Дополнение к Latin-1
± 177 177 0xB1 U + 00B1 & plusmn; знак плюс-минус Дополнение к Latin-1
² 178 178 0xB2 U + 00B2 & sup2; надстрочный знак два Дополнение Latin-1
³ 179 179 0xB3 U + 00B3 & sup3; тройной верхний индекс Дополнение к Latin-1
´ 180 180 0xB4 U + 00B4 и острый; острый ударение Дополнение Latin-1
µ 181 181 0xB5 U + 00B5 & micro; микро-знак Дополнение к Latin-1
182 182 0xB6 U + 00B6 & para; pilcrow sign Latin-1 Supplement
· 183 183 0xB7 U + 00B7 & middot; средняя точка Приложение Latin-1
¸ 184 184 0xB8 U + 00B8 & cedil; седилла Приложение Latin-1
¹ 185 185 0xB9 U + 00B9 & sup1; верхний индекс один Дополнение Latin-1
º 186 186 0xBA U + 00BA & ordm; мужской порядковый номер Приложение Latin-1
» 187 187 0xBB U + 00BB & raquo; двойные угловые кавычки, указывающие вправо Дополнение к Latin-1
¼ 188 188 0xBC U + 00BC & frac14; вульгарная фракция одна четверть Дополнение Latin-1
½ 189 189 0xBD U + 00BD & frac12; вульгарная дробь одна половина Latin-1 Дополнение
¾ 190 190 0xBE U + 00BE & frac34; вульгарная фракция три четверти Дополнение Latin-1
¿ 191 191 0xBF U + 00BF & iquest; перевернутый знак вопроса Дополнение Latin-1
À 192 192 0xC0 U + 00C0 & Agrave; Заглавная латинская буква A с могилой Приложение Latin-1
Á 193 193 0xC1 U + 00C1 & Aacute; Заглавная латинская буква A с острым ударением Дополнение к Latin-1
 194 194 0xC2 U + 00C2 & Acirc; Заглавная латинская буква A с циркумфлексом Приложение Latin-1
à 195 195 0xC3 U + 00C3 & Atilde; Заглавная латинская буква A с тильдой Приложение Latin-1
Ä 196 196 0xC4 U + 00C4 & Auml; Заглавная латинская буква A с диэрезисом Приложение Latin-1
Å 197 197 0xC5 U + 00C5 & Aring; Заглавная латинская буква A с кольцом сверху Дополнение Latin-1
Æ 198 198 0xC6 U + 00C6 & AElig; Заглавная латинская буква AE Дополнение к Latin-1
Ç 199 199 0xC7 U + 00C7 & Ccedil; Заглавная латинская буква C с седилем Дополнение Latin-1
È 200 200 0xC8 U + 00C8 & Egrave; Заглавная латинская буква E с могилой Приложение Latin-1
É 201 201 0xC9 U + 00C9 & Eacute; Заглавная латинская буква E с острым ударением Дополнение к Latin-1
Ê 202 202 0xCA U + 00CA & Ecirc; Заглавная латинская буква E с циркумфлексом Дополнение к Latin-1
Ë 203 203 0xCB U + 00CB & Euml; Заглавная латинская буква E с диэрезисом Дополнение Latin-1
Ì 204 204 0xCC U + 00CC & Igrave; Заглавная латинская буква I с могилой Приложение Latin-1
Í 205 205 0xCD U + 00CD & Iacute; Заглавная латинская буква I с острым ударением Дополнение к Latin-1
Î 206 206 0xCE U + 00CE & Icirc; Заглавная латинская буква I с циркумфлексом Дополнение к Latin-1
Ï 207 207 0xCF U + 00CF & Iuml; Заглавная латинская буква I с диэрезисом Приложение Latin-1
Ð 208 208 0xD0 U + 00D0 & ETH; Заглавная латинская буква Eth Дополнение к Latin-1
Ñ 209 209 0xD1 U + 00D1 & Ntilde; Заглавная латинская буква N с тильдой Дополнение к Latin-1
Ò210 210 0xD2 U + 00D2 & Ograve; Латинская заглавная буква O с могилой Latin-1 Приложение
Ó 211 211 0xD3 U + 00D3 & Oacute; Заглавная латинская буква O с острым ударением Дополнение к Latin-1
Ô 212 212 0xD4 U + 00D4 & Ocirc; Заглавная латинская буква O с циркумфлексом Дополнение к Latin-1
Õ 213 213 0xD5 U + 00D5 & Otilde; Заглавная латинская буква O с тильдой Дополнение к Latin-1
Ö214 214 0xD6 U + 00D6 & Ouml; Заглавная латинская буква O с диэрезисом Дополнение Latin-1
×215 215 0xD7 U + 00D7 & times;Например:

Это происходит потому, что символы для этих нелатинских шрифтов кодируются теми же числами, что и латинские символы с диакритическими знаками в наборе символов ANSI; эта проблема в значительной степени решена теперь, когда Unicode получил широкое распространение, поскольку он обеспечивает уникальный числовой идентификатор для каждого символа.

Вставить символы и символы на основе латиницы ASCII или Unicode

Вставить символ ASCII или Unicode в документ

Если вам нужно ввести только несколько специальных символов или символов, вы можете использовать карту символов или вводить сочетания клавиш.См. Таблицы ниже или см. Сочетания клавиш для международных символов для получения списка символов ASCII.

Примечания:

  • Многие языки содержат символы, которые нельзя сжать до 256-значного расширенного набора ACSII. Таким образом, существуют варианты ASCII и Unicode для охвата региональных символов и символов, см. Таблицы кодов символов Unicode по сценариям.

  • Если у вас возникли проблемы с вводом кодов символов для нужных символов, попробуйте использовать карту символов.

Вставка символов ASCII

Чтобы вставить символ ASCII, нажмите и удерживайте ALT при вводе кода символа. Например, чтобы вставить символ градуса (º), нажмите и удерживайте ALT при вводе 0176 на цифровой клавиатуре.

Для ввода чисел необходимо использовать цифровую клавиатуру, а не клавиатуру. Убедитесь, что клавиша NUM LOCK включена, если ваша клавиатура требует, чтобы она вводила числа на цифровой клавиатуре.

Вставка символов Юникода

Чтобы вставить символ Unicode, введите код символа, нажмите ALT, а затем нажмите X. Например, чтобы ввести символ доллара ($), введите 0024, нажмите ALT, а затем нажмите X. Дополнительные коды символов Unicode см. Таблицы кодов символов Unicode по сценариям.

Важно: Некоторые программы Microsoft Office, такие как PowerPoint и InfoPath, не могут преобразовывать коды Unicode в символы.Если вам нужен символ Unicode и вы используете одну из программ, не поддерживающих символы Unicode, используйте карту символов для ввода нужного символа (ов).

Примечания:

  • Если ALT + X преобразует неправильный код символа в Unicode, выберите правильный код символа перед нажатием ALT + X.

  • Либо перед правильным кодом символа поставьте текст «U +».Например, ввод «1U + B5» и нажатие ALT + X всегда будет возвращать текст «1µ», а ввод «1B5» и нажатие ALT + X вернет текст «Ƶ».

Использование карты персонажей

Таблица символов — это программа, встроенная в Microsoft Windows, которая позволяет просматривать символы, доступные в выбранном шрифте.

Используя карту символов, вы можете копировать отдельные символы или группу символов в буфер обмена и вставлять их в любую программу, которая может их отображать.Чтобы открыть карту персонажей:

  • В Windows 10: Введите «символ» в поле поиска на панели задач и выберите «Карта символов» из результатов.

  • В Windows 8: Найдите слово «персонаж» на начальном экране и выберите в результатах «Карта символов».

  • В Windows 7: Щелкните Пуск , укажите Все программы , укажите Стандартные , укажите Системные инструменты , а затем щелкните Таблица символов .

Символы сгруппированы по шрифту. Щелкните список шрифтов, чтобы выбрать набор символов. Чтобы выбрать символ, щелкните символ, щелкните Выберите , щелкните правой кнопкой мыши в документе, где вы хотите символ, а затем щелкните Вставить .

Верх страницы

Коды общих символов

Для получения дополнительных символов см. Карту символов, установленную на вашем компьютере, коды символов ASCII или таблицы кодов символов Unicode по сценариям.

Символ

Код

Символ

Код

Символы валюты

£

ALT + 0163

¥

ALT + 0165

¢

ALT + 0162

$

0024 + ALT + X

ALT + 0128

¤

ALT + 0164

Юридические символы

©

ALT + 0169

®

ALT + 0174

§

ALT + 0167

ALT + 0153

Математические символы

°

ALT + 0176

º

ALT + 0186

221A + ALT + X

+

ALT + 43

#

ALT + 35

µ

ALT + 0181

<

ALT + 60

>

ALT + 62

%

ALT + 37

(

ALT + 40

[

ALT + 91

)

ALT + 41

]

ALT + 93

2206 + ALT + X

Дроби

¼

ALT + 0188

½

ALT + 0189

¾

ALT + 0190

Знаки препинания и диалектические символы

?

ALT + 63

¿

ALT + 0191

!

ALT + 33

203 + ALT + X

ALT + 45

ALT + 39

«

ALT + 34

,

ALT + 44

.

ALT + 94

«

ALT + 0171

»

ALT + 0187

«

ALT + 174

»

ALT + 175

~

ALT + 126

и

ALT + 38

:

ALT + 58

{

ALT + 123

;

ALT + 59

}

ALT + 125

Символы формы

25A1 + ALT + X

221A + ALT + X

Верх страницы

Общие коды диакритических знаков

Полный список глифов и их кодов символов см. В таблице символов.

Символ

Код

Символ

Код

Ã

ALT + 0195

å

ALT + 0229

Å

ALT + 143

å

ALT + 134

Ä

ALT + 142

ä

ALT + 132

À

ALT + 0192

ALT + 133

Á

ALT + 0193

á

ALT + 160

Â

ALT + 0194

ALT + 131

Ç

ALT + 128

ç

ALT + 135

Č

010C + ALT + X

č

010D + ALT + X

É

ALT + 144

é

ALT + 130

È

ALT + 0200

и

ALT + 138

Ê

ALT + 202

ê

ALT + 136

Ë

ALT + 203

ALT + 137

Ĕ

0114 + ALT + X

ĕ

0115 + ALT + X

Ğ

011E + ALT + X

ğ

011F + ALT + X

Ģ

0122 + ALT + X

ģ

0123 + ALT + X

Ï

ALT + 0207

или

ALT + 139

Î

ALT + 0206

ALT + 140

Í

ALT + 0205

ALT + 161

Ì

ALT + 0204

ì

ALT + 141

Ñ

ALT + 165

ALT + 164

Ö

ALT + 153

ö

ALT + 148

Ô

ALT + 212

ô

ALT + 147

Ō

014C + ALT + X

ō

014D + ALT + X

Ò

ALT + 0210

ò

ALT + 149

Ó

ALT + 0211

ALT + 162

Ø

ALT + 0216

ø

00F8 + ALT + X

Ŝ

015C + ALT + X

ŝ

015D + ALT + X

Ş

015E + ALT + X

ş

015F + ALT + X

Ü

ALT + 154

ü

ALT + 129

Ū

ALT + 016A

ū

016B + ALT + X

Û

ALT + 0219

û

ALT + 150

Ù

ALT + 0217

ù

ALT + 151

Ú

00DA + ALT + X

ú

ALT + 163

Ÿ

0159 + ALT + X

ÿ

ALT + 152

Верх страницы

Коды символов для лигатурных символов

Для получения дополнительных сведений о типографских лигатурах см. Типографские лигатуры.Полный список лигатур и их кодов символов см. В таблице символов.

Символ

Код

Символ

Код

Æ

ALT + 0198

æ

ALT + 0230

ß

ALT + 0223

ß

ALT + 225

Œ

ALT + 0140

ALT + 0156

ʩ

02A9 + ALT + X

ʣ

02A3 + ALT + X

ʥ

02A5 + ALT + X

ʪ

02AA + ALT + X

ʫ

02AB + ALT + X

ʦ

0246 + ALT + X

ʧ

02A7 + ALT + X

Љ

0409 + ALT + X

Ю

042E + ALT + X

Њ

040A + ALT + X

Ѿ

047E + ALT + x

Ы

042B + ALT + X

Ѩ

0468 + ALT + X

Ѭ

049C + ALT + X

FDF2 + ALT + X

Верх страницы

.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *