Связанные понятия
Си́мвол-джо́кер (си́мвол подстано́вки) — символ, используемый для замены других символов или их последовательностей, приводя таким образом к символьным шаблонам. Развитием символов-джокеров являются регулярные выражения.
В программировании,
строковый тип (англ. string «нить, вереница») — тип данных, значениями которого является произвольная последовательность (строка) символов алфавита. Каждая переменная такого типа (строковая переменная) может быть представлена фиксированным количеством байтов либо иметь произвольную длину.
Управля́ющие си́мволы — символы в кодировке, которым не приписано графическое представление, но которые используются для управления устройствами, организации передачи данных и других целей.
Юнико́д (чаще всего) или Унико́д (англ. Unicode) — стандарт кодирования символов, включающий в себя знаки почти всех письменных языков мира. В настоящее время стандарт является доминирующим в Интернете.
Заменяющий символ — символ, который используется, когда значение символа неизвестно или не может быть выражено в Юникоде.
Упоминания в литературе
Белая строка в оформлении выглядит как увеличенное расстояние между абзацами, равное одной или нескольким
пустым строкам (рис. 5.23, слева). Не используется не только текст, но и графические средства выделения, – пустое пространство на странице.
Файл robots.txt – это обычный текстовый документ, содержащий одну или несколько записей, разделенных
пустыми строками , как показано в следующем примере:
После таблицы оставляют одну
пустую строку , после чего продолжают печать основного текста статьи. Текст внутри таблицы, включая заголовки столбцов и строк, чаще всего печатают шрифтом 12 пунктов (при необходимости это значение можно уменьшать до 8). Заголовки столбцов центрируют по ширине столбца, а заголовки строк выравнивают по левому краю.
Каждая таблица должна иметь нумерационный и тематический заголовок. Нумерационный заголовок (запись вида «Таблица номер») используют, чтобы упростить связь таблицы с текстом; при ссылке в тексте достаточно указать «табл. 3». Номер таблицы должен состоять из номера раздела и порядкового номера таблицы, разделенных точкой, например: «Таблица 15.8». Слово «Таблица » (с прописной буквы) и ее номер вводятся обычным шрифтом и выравниваются по правому краю. Между словом «Таблица » и предшествующим абзацем оставляют одну
пустую строку . После номера таблицы точку не ставят.
Возвращает подстроку строки. S – выражение типа String. Index и Count – выражения целого типа. Функция возвращает строку, содержащую Count символов, начинающихся с позиции Index. Если Index больше, чем длина S, функция возвращает
пустую строку .
Обратите внимание, что имя пользователя, полученное от клиента, проверяется на наличие в этой
строке пустого значения (строки 10-12). Если в переменной содержится какое-то значение, оно используется для инициализации переменной filter (строка 18). Полученное значение используется для построения запроса к службе LDAP (строка 27), который исполняется в строке 29. В приведенном примере атакующий имеет полный контроль над запросом и получает его результаты от сервера (строки 32-40).
Примечание. При создании таблицы данные в ячейки следует вводить подряд, чтобы не было
пустых строк и столбцов.
Представленная в листинге 2.28 функция ShowChooseFolder возвращает полный путь указанной папки, если она выбрана, и
пустую строку в противном случае. Само окно Обзор папок показано на рис. 2.5.
10. Вставьте две
пустые строки перед первым абзацем. Для этого установите курсор в начало первой строки документа и два раза нажмите клавишу Enter.
Связанные понятия (продолжение)
Нуль-терминированная строка или C-строка (от названия языка Си) или ASCIIZ-строка — способ представления строк в языках программирования, при котором вместо введения специального строкового типа используется массив символов, а концом строки считается первый встретившийся специальный нуль-символ (NUL из кода ASCII, со значением 0).
Шестиби́тные кодиро́вки применялись в компьютерах, производившихся в США в 1950-х — 1960-х годах. Соответственно размер машинного слова на этих компьютерах был кратен 6 бит (например, 12, 18, 24, 36, 48, 60 бит). Такой размер символа позволял кодировать заглавные латинские буквы, арабские цифры, несколько знаков пунктуации и иногда управляющих символов (в те времена можно было обходиться без управляющих символов, так как текстовые файлы представляли собой последовательность записей фиксированной...
Каретная нотация — способ записи управляющих символов в кодировке ASCII. Запись состоит из символа карета (^) и заглавной буквы; эта диграмма обозначает ASCII-код символа в соответствии с позицией буквы в английском алфавите. Например, символ конца передачи имеет номер 4 и представляется как ^D, поскольку D — четвертая буква алфавита. Нулевой символ записывается как ^@ (@ идет в таблице ASCII до A). Символ DEL имеет значение 127 и обычно записывается как ^?, потому что ASCII-символ ? идет до @ и...
Перевод строки , или разрыв строки, — продолжение печати текста с новой строки, то есть с левого края на строку ниже, или уже на следующей странице. На компьютерах это осуществляется клавишей ввода Enter.
Вертика́льная черта ́ — символ ASCII, имеющий код 0x7C (hex), 124 (dec). Этот символ пользователи UNIX называют «пайп», от англ. pipeline — конвейер. В первых, ещё советских, изданиях книг В. Э. Фигурнова название «pipe» было переведено как «символ трубопровода».
Кодирование длин серий (англ. run-length encoding, RLE) или кодирование повторов — алгоритм сжатия данных, заменяющий повторяющиеся символы (серии) на один символ и число его повторов. Серией называется последовательность, состоящая из нескольких одинаковых символов. При кодировании (упаковке, сжатии) строка одинаковых символов, составляющих серию, заменяется строкой, содержащей сам повторяющийся символ и количество его повторов.
Шрифт Брайля (фр. Braille) — рельефно-точечный тактильный шрифт, предназначенный для письма и чтения незрячими и плохо видящим людям. Разработан в 1824 году французом Луи Брайлем (фр. Louis Braille), сыном сапожника. Луи в возрасте трёх лет поранился в мастерской отца шорным ножом; из-за начавшегося воспаления глаза мальчик потерял зрение. В возрасте 15 лет Луи создал свой рельефно-точечный шрифт как альтернативу рельефно-линейному шрифту Валентина Гаюи, вдохновившись простотой «ночного шрифта» капитана...
Шаблон поиска (англ. wildcard pattern, glob pattern) — метод описания поискового запроса с использованием метасимволов (символов-джокеров).
Регуля́рные выраже́ния (англ. regular expressions) — формальный язык поиска и осуществления манипуляций с подстроками в тексте, основанный на использовании метасимволов (символов-джокеров, англ. wildcard characters). Для поиска используется строка-образец (англ. pattern, по-русски её часто называют «шаблоном», «маской»), состоящая из символов и метасимволов и задающая правило поиска. Для манипуляций с текстом дополнительно задаётся строка замены, которая также может содержать в себе специальные символы...
Те́кстовый файл — компьютерный файл, содержащий текстовые данные. Текстовым файлам противопоставляются двоичные (бинарные) файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текстовых (например, файлы, хранящие текст в закодированном или сжатом виде, или хранящие не текст, а звук, изображение или иные данные).
Набор символов (англ. character set) — таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита (точек и тире в коде Mорзе, сигнальных флагов на флоте, нулей и единиц (битов) в компьютере).
Чувствительность к регистру символов (англ. case sensitivity) — особенность некоторых файловых систем, программ и языков программирования, состоящая в том, что если одинаковые имена отличаются регистром хотя бы одного символа (то есть заглавными или строчными буквами), то эти имена считаются разными. Например, слово «TEXT» и слово «Text» в программе, чувствительной к регистру символов — абсолютно разные слова. Файлы «Photo.jpg», «photo.jpg» и «photo.JPG» в файловой системе, чувствительной к регистру...
И́мя фа́йла — строка символов, однозначно определяющая файл в некотором пространстве имён файловой системы (ФС), обычно называемом каталогом, директорией или папкой. Имена файлов строятся по правилам, принятым в той или иной файловой и операционной системах (ОС). Многие системы позволяют назначать имена как обычным файлам, так и каталогам и специальным объектам (символическим ссылкам, блочным устройствам и т. п.).
Суффиксное дерево — бор, содержащий все суффиксы некоторой строки (и только их). Позволяет выяснять, входит ли строка w в исходную строку t, за время O( w ), где w — длина строки w.
Ниббл (англ. nibble, nybble), полубайт, тетрада или гексадецит (hexadecit - hexadecimal digit) — единица измерения информации, равная четырём двоичным разрядам (битам), удобна тем, что представима одной шестнадцатеричной цифрой, то есть является одним шестнадцатеричным разрядом. Переменная размера «ниббл» может принимать 24=16 различных значений. В русском языке используется синоним «тетрада».
Форма Бэкуса — Наура (сокр. БНФ, Бэкуса — Наура форма) — формальная система описания синтаксиса, в которой одни синтаксические категории последовательно определяются через другие категории. БНФ используется для описания контекстно-свободных формальных грамматик. Существует расширенная форма Бэкуса — Наура, отличающаяся лишь более ёмкими конструкциями.
Суффиксный массив — лексикографически отсортированный массив всех суффиксов строки. Эта структура данных была разработана Джином Майерсом и Уди Манбером как более экономная альтернатива суффиксному дереву с точки зрения необходимой памяти. Она часто применяется там, где необходим быстрый поиск подстрок, например в преобразовании Барроуза — Уилера (BWT), а также в качестве структуры данных в поисковом индексе.
Символ или знак валюты (¤) — типографский символ, который входит в группу «Управляющие символы C1 и дополнение 1 к латинице» (англ. C1 Controls and Latin-1 Supplement) стандарта Юникод: оригинальное название — Currency sign (англ.); код — U+00A4. Мнемоника HTML — ¤. Используется, когда в том или ином компьютерном шрифте недоступен или отсутствует знак конкретной валюты.
Язык программирования Си поддерживает множество функций стандартных библиотек для файлового ввода и вывода. Эти функции составляют основу заголовочного файла стандартной библиотеки языка Си
.Подробнее: Файловый ввод-вывод в языке Си
Обра́тная коса́я черта ́, или обратная косая (на компьютерном жаргоне — обратный слеш или бекслеш от англ. backslash), — специальный символ (\), с написанием, обратным по отношению к обычному символу косой черты (/) (иногда, также, называемого «прямой косой»).
Многото́чие (…) — знак препинания в виде нескольких (в русском языке трёх) поставленных рядом точек. Служит для обозначения прерванности речи, незаконченности высказывания или пропуска в тексте.
Книжный шифр — вид шифра, в котором каждый элемент открытого текста (каждая буква или слово) заменяется на указатель (например, номер страницы, строки и столбца) аналогичного элемента в дополнительном тексте-ключе.
Префиксное дерево (также бор, луч, нагруженное дерево, англ. trie) — структура данных, позволяющая хранить ассоциативный массив, ключами которого являются строки. Представляет собой корневое дерево, каждое ребро которого помечено каким-то символом так, что для любого узла все рёбра, соединяющие этот узел с его сыновьями, помечены разными символами. Некоторые узлы префиксного дерева выделены (на рисунке они подписаны цифрами) и считается, что префиксное дерево содержит данную строку-ключ тогда и только...
Перено́с в типографике — разрыв части текста (слова, формулы и т. п.), при котором её начало оказывается на одной строке, а конец — на другой.
Кодовая страница (англ. code page) — таблица, сопоставляющая каждому значению байта некоторый символ (или его отсутствие). Обычно код символа имеет размер 8 бит, так что кодовая страница может содержать максимум 256 символов, из чего вытекает резкая недостаточность всякой 8-битной кодовой страницы для представления многоязычных текстов. К тому же часть символов используется как управляющие, из-за чего число печатных символов редко превышает 223.
Черта́ све́рху — типографический знак горизонтальной линии, нарисованной сразу над текстом. В математической нотации черта сверху долгое время используется для vinculum, объединения определённых символов. Также знак используется с римскими цифрами, показывая умножение цифры на тысячу, а также в средневековых аббревиатурах (sigla). Обозначение одного и более слов сплошной линией над буквами называется надчёркивание.
В логике обычно используется много символов для выражения логических сущностей. Поскольку логики знакомы с этими символами, они не объясняют их каждый раз при использовании. Для студентов, изучающих логику, следующая таблица перечисляет большинство общеупотребимых символов вместе с их именами и связанными областями математики. Кроме того, третий столбец содержит неформальное определение, пятый и шестой дают код Unicode и имя для использования в HTML документах.
Подробнее: Список логических символов
Микроформат (англ. microformat; иногда сокращённо μF или uF) — способ семантической разметки сведений о разнообразных сущностях (событиях, организациях, людях, товарах и так далее) на веб-страницах с использованием стандартных элементов языка HTML (или XHTML). Пользователь-человек может воспринимать страницу с микроформатом как обычную веб-страницу (через браузер), тогда как программы-обработчики способны извлечь из такой страницы структурированную информацию, следуя определённым соглашениям.
Тег , те́ги (иногда тэг, англ. tag — именованная метка, читается /tæg/; более правильное название — дескриптор). В SGML (HTML, WML, AmigaGuide, языках семейства XML) — элемент языка разметки гипертекста. Текст, содержащийся между начальным и конечным тегом, отображается и размещается в соответствии со свойствами, указанными в начальном теге.
Знак деления — математический символ в виде двоеточия (∶), обелюса (÷) или косой черты (∕), используемый для обозначения оператора деления.
Шифр Гронсфельда — полиалфавитный подстановочный шифр создан графом Гронсвельдом (руководителем первой дешифровальной службы Германии) в XVII веке. Шифр можно считать усовершенствованием шифра Цезаря (надежность) и Виженера / Бофора (скорость).
Те́кстовые да́нные (также те́кстовый форма́т) — представление информации строкового типа (то есть, последовательности печатных символов) в вычислительной системе. В MIME закодированным таким образом данным соответствует тип text/plain.
Двоичный (бинарный) файл — в широком смысле: последовательность произвольных байтов. Название связано с тем, что байты состоят из бит, то есть двоичных (англ. binary) цифр.
Таблица — это совокупность связанных данных, хранящихся в структурированном виде в базе данных. Она состоит из столбцов и строк.
Математические обозначения («язык математики») — сложная графическая система обозначений, служащая для изложения абстрактных математических идей и суждений в человеко-читаемой форме. Составляет (по своей сложности и разнообразию) значительную долю неречевых знаковых систем, применяемых человечеством. В данной статье описывается общепринятая международная система обозначений, хотя различные культуры прошлого имели свои собственные, и некоторые из них даже имеют ограниченное применение до сих пор...
Автоформати́рование текста — изменение знаков препинания, отступов, капитализации символов текста в зависимости от его лексического значения.
Символьный тип (Сhar) — тип данных, предназначенный для хранения одного символа (управляющего или печатного) в определённой кодировке. Может являться как однобайтовым (для стандартной таблицы символов), так и многобайтовым (к примеру, для Юникода). Основным применением является обращение к отдельным знакам строки.
Управляющая последовательность (исключённая последовательность, экранированная последовательность, от англ. escape sequence) — совокупность идущих подряд значащих элементов, в группе теряющих для обрабатывающего механизма своё индивидуальное значение, одновременно с приобретением этой группой нового значения.
Визуа́льно неоднозна́чные си́мволы (англ. Visually Confusable Characters, или VCC) — термин, используемый для обозначения проблемы компьютерной безопасности, когда две различные строки символов выглядят на экране монитора очень похоже.
Герша́им (герша́йим; ивр. גֵּרְשַׁיִם; без огласовок: ивр. גרשיים), иногда граша́им (ивр. גְּרָשַׁיִם) или шней гриши́н — название двух различных типографских знаков в еврейском языке. Название является формой двойственного числа слова «ге́реш» (גֵּרֵשׁ) и буквально означает «два гереша» или «двойной гереш».
Расширенная форма Бэкуса — Наура (расширенная Бэкус — Наурова форма (РБНФ)) (англ. Extended Backus–Naur Form (EBNF)) — формальная система определения синтаксиса, в которой одни синтаксические категории последовательно определяются через другие. Используется для описания контекстно-свободных формальных грамматик. Предложена Никлаусом Виртом. Является расширенной переработкой форм Бэкуса — Наура, отличается от БНФ более «ёмкими» конструкциями, позволяющими при той же выразительной способности упростить...
Ри́мские ци́фры — цифры, использовавшиеся древними римлянами в их непозиционной системе счисления.
Пробе́л — интервал между буквами, обозначающий границы слов во многих системах письменности. Функционально пробел принадлежит к знакам препинания.
Звёздочка , или астери́ск (греч. ἀστέρισκος) — типографский знак в виде небольшой, обычно пяти- или шестиконечной звёздочки (*), расположенной в строке или поднятой над строкой.