Logo Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware
Скидка до 20% на услуги дата-центра. Аренда серверной стойки. Colocation от 1U!

Миграция в облако #SotelCloud. Виртуальный сервер в облаке. Выбрать конфигурацию на сайте!

Виртуальная АТС для вашего бизнеса. Приветственные бонусы для новых клиентов!

Виртуальные VPS серверы в РФ и ЕС

Dedicated серверы в РФ и ЕС

По промокоду CITFORUM скидка 30% на заказ VPS\VDS

VPS/VDS серверы. 30 локаций на выбор

Серверы VPS/VDS с большим диском

Хорошие условия для реселлеров

4VPS.SU - VPS в 17-ти странах

2Gbit/s безлимит

Современное железо!

LEX(1)

НАЗВАНИЕ
lex - генератор программ простого лексического анализа

СИНТАКСИС


   lex  [-r] [-c] [-t] [-v] [-n] [файл ...]

ОПИСАНИЕ
Команда lex генерирует программы, которые можно использовать для простого лексического анализа текста.

Входные файлы (по умолчанию - стандартный ввод) содержат цепочки символов и выражения, подлежащие распознаванию, и операторы на языке C, которые выполняются в случае успеха распознавания.

Генерируется программа lex.yy.c. Будучи загруженной вместе с библиотекой, она для каждой распознанной цепочки выполняет соответствующие C-операторы, а остальные фрагменты входного файла копирует в выходной файл без изменений. Распознанная цепочка помещается во внешний символьный массив yytext. Сопоставление цепочек выполняется в том порядке, в котором они указаны в файле. Цепочки символов могут содержать квадратные скобки, которые указывают классы символов (например, [abx-z] означает a, b, x, y и z), и операторы *, + и ?, обозначающие повторение предыдущего символа или класса символов, соответственно, любое неотрицательное число раз, любое положительное число, 0 или один раз. Символ . - это класс всех символов ASCII, кроме перевода строки. В дополнение, поддерживаются скобки (группировка символов) и вертикальная черта (альтернация). Запись r{d,e} в правиле обозначает вхождения регулярного выражения r между d и e. Она имеет больший приоритет, чем |, но меньший, чем *, ?, + и конкатенация. Символ ^ в начале выражения означает, что сопоставление должно начинаться с начала строки, символ $ в конце выражения требует, чтобы следующим символом в сопоставляемой цепочке был символ перевода строки. Символ / в выражении обозначает, что только часть выражения вплоть до наклонной черты помещается в yytext, но оставшаяся часть должна успешно сопоставляться. Символ оператора может использоваться как обычный символ, если он взят в кавычки или если ему предшествует \. Пример: выражение [a-zA-Z]+ успешно сопоставляется с цепочкой букв.

Три подпрограммы определены как макросы: input( ) - прочитать символ; unput(c) - заменить прочитанный символ; output(c) - поместить выходной символ. Все они определены в терминах стандартных потоков, но их описание можно изменить. Генерируемая программа-анализатор называется yylex( ), библиотека содержит программу main( ), которая вызывает анализатор. Действие REJECT в правой части правила обозначает отказ от текущего сопоставления и переход к поиску следующего сопоставления; функция yymore( ) накапливает дополнительные символы в том же массиве yytext; функция yyless(p) выталкивает порцию сопоставленной цепочки символов, начиная с позиции p, которая должна быть между yytext и yytext+yyleng. Макросы input и output используют файлы yyin и yyout для чтения и записи (по умолчанию это файлы stdin и stdout соответственно).

Строки, начинающиеся с пробела, считаются текстом на языке C и копируются в файл lex.yy.c; если они предшествуют строке %%, копирование выполняется в область внешних определений файла lex.yy.c. Все правила, как и в YACC, должны стоять после %%. Строки, стоящие до %% и начинающиеся не с пробела, определяют стоящую слева цепочку символов как остаток строки; данное определение затем можно использовать, указав эту цепочку в фигурных скобках { }. Отметим, что после подстановки скобки исчезнут.

ПРИМЕР


     D       [0-9]

     %%

     if      printf("IF statement\n");

     [a-z]+  printf("tag, value %s\n",yytext);

     0{D}+   printf("octal number %s\n",yytext);

     {D}+    printf("decimal number %s\n",yytext);

     "++"    printf("unary op\n");

     "+"     printf("binary op\n");

     "/*"     skipcommnts();

     %%

      skipcommnts()

      {

        for(;;) {

          while (input() != '*')

            ;

          if (input() != '/')

            unput(yytext[yyleng-1]);

          else

            return;

        }

      }

Внешние имена, сгенерированные программой lex, всегда начинаются с префикса yy или YY.

ОПЦИИ
-r Выполняемые действия написаны на языке ratfor [см. ratfor(1)].
-c Выполняемые действия написаны на языке C (данная опция считается использованной по умолчанию).
-t Поместить результат на стандартный вывод вместо файла lex.yy.c.
-v Выдать статистическую сводку о построенном автомате.
-n Отменить выдачу статистики.

Если указано несколько файлов, они рассматриваются как один общий файл. Если файлы не указаны, обрабатывается стандартный ввод.

Размеры некоторых таблиц для генерируемого конечного автомата могут быть установлены в разделе определений:
%p n число позиций равно n (по умолчанию - 2500)
%n n число состояний (500)
%e n число узлов в дереве разбора (1000)
%a n число переходов (2000)
%k n число классов упакованных символов (1000)
%o n размер выходного массива (3000)

Использование одного или большего числа таких определений автоматически подразумевает задание опции -v, если не используется опция -n.

СМ. ТАКЖЕ
yacc(1).

СЮРПРИЗЫ
Опция -r еще не полностью работоспособна.

Бесплатный конструктор сайтов и Landing Page

Хостинг с DDoS защитой от 2.5$ + Бесплатный SSL и Домен

SSD VPS в Нидерландах под различные задачи от 2.6$

✅ Дешевый VPS-хостинг на AMD EPYC: 1vCore, 3GB DDR4, 15GB NVMe всего за €3,50!

🔥 Anti-DDoS защита 12 Тбит/с!

VPS в 21 локации

От 104 рублей в месяц

Безлимитный трафик. Защита от ДДоС.

🔥 VPS до 5.7 ГГц под любые задачи с AntiDDoS в 7 локациях

💸 Гифткод CITFORUM (250р на баланс) и попробуйте уже сейчас!

🛒 Скидка 15% на первый платеж (в течение 24ч)

Новости мира IT:

Архив новостей

IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей PR-акции, размещение рекламы — adv@citforum.ru,
тел. +7 495 7861149
Пресс-релизы — pr@citforum.ru
Обратная связь
Информация для авторов
Rambler's Top100 TopList liveinternet.ru: показано число просмотров за 24 часа, посетителей за 24 часа и за сегодня This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2019 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...