Ideone.com

fork download

copy

#include <ctype.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <stdbool.h>
 
#define TAG_MAX_LEN 32  // Максимальная длина имени тега
 
// Виды лексем
typedef enum {
    T_TAG_BEG,      // Открывающий тег
    T_TAG_END,      // Закрывающий тег
    T_TAG_SINGLE,   // Одиночный тег
    T_DATA,         // "Данные" (то есть, не тег)
    T_END           // Конец потока лексем
} token_type;
 
// Структура для токена
struct {
    token_type type;                // Вид лексемы
 
    // Дополнительные данные лексемы
    // Выбирается одно из двух
    union {
        char tag_name[TAG_MAX_LEN]; // Имя тега
        size_t data_length;         // Длина данных
    } value;
} Token;
 
// Здесь хранится текущий символ
struct {
    int val;        // Сам символ
    size_t pos;     // Позиция в строке
    size_t line;    // Номер строки
} Character;
 
size_t tabulation;
const size_t TAB_STEP = 4;
 
static void init();
static void token_next();
 
//----------------------------------------------------------------------------
 
int main() {
    init();
    for (token_next(); Token.type != T_END; token_next()) {
        switch (Token.type) {
        case T_TAG_BEG:
            printf("%*c%s\n", tabulation, '{', Token.value.tag_name);
            tabulation += TAB_STEP;
            break;
        case T_TAG_END:
            tabulation -= TAB_STEP;
            printf("%*c\n", tabulation, '}');
            break;
        case T_TAG_SINGLE:
            printf("%*c%s}\n", tabulation, '{', Token.value.tag_name);
            break;
        case T_DATA:
            printf("%*cdata length: %u]\n", tabulation, '[', Token.value.data_length);
            break;
        default:
            fprintf(stderr, "%s\n", "Runtime error");
            exit(EXIT_FAILURE);
        }
    }
    if (tabulation) {
        fprintf(stderr, "Warning! %s\n", "Unmatched tag");
    }
}
 
//----------------------------------------------------------------------------
 
static void error(const char *message) {
    fprintf(
        stderr,
        "Error[%u:%u] %s\n",
        Character.line + 1,
        Character.pos,
        message);
    exit(EXIT_FAILURE);
}
 
//----------------------------------------------------------------------------
 
static void char_next() {
    Character.val = getchar();
    if (Character.val == '\n') {
        Character.pos = 0;
        Character.line += 1;
    } else {
        Character.pos += 1;
    }
}
 
//----------------------------------------------------------------------------
 
static void init() {
    char_next();
}
 
//----------------------------------------------------------------------------
 
static void scan_tag();
static void scan_data();
 
static void token_next() {
    while (isspace(Character.val))
        char_next();
 
    switch (Character.val) {
    case EOF:
        Token.type = T_END;
        break;
    case '<':
        scan_tag();
        break;
    default:
        scan_data();
    }
}
 
//----------------------------------------------------------------------------
 
static void skip_comment() {
    char_next();
    if (Character.val != '-') error("Unexpected symbol");
    char_next();
    if (Character.val != '-') error("Unexpected symbol");
 
    _Bool comment_flag = true;
    while ((Character.val != EOF) && comment_flag) {
        char_next();
        if (Character.val == '-') {
            char_next();
            if (Character.val == '-') {
                char_next();
                if (Character.val == '>') comment_flag = false;
            }
        }
    }
    char_next();
}
 
//----------------------------------------------------------------------------
 
static void tag_get_name() {
    int i = 0;
    while ((i < (TAG_MAX_LEN - 1)) && isalnum(Character.val)) {
        Token.value.tag_name[i] = Character.val;
        char_next();
        i += 1;
    }
 
    // Завершающий ноль для строки
    Token.value.tag_name[i] = 0;
}
 
//----------------------------------------------------------------------------
 
static void scan_tag() {
    char_next();
 
    if (Character.val == '!') {
        skip_comment();
        token_next();
        return;
    }
    else if (Character.val == '/') {
        Token.type = T_TAG_END;
        char_next();
    }
    else Token.type = T_TAG_BEG;
 
    // Запоминаем имя тега
    tag_get_name();
    // Детектим пустые теги
    if (!strlen(Token.value.tag_name)) error("Empty tag");
 
    // Ищем конец тега
    while (Character.val != '>') {
        if (Character.val == EOF) error("`>' expected");
        if (Character.val == '/') {
            char_next();
            if (Character.val == '>') {
                if (Token.type == T_TAG_BEG) {
                    Token.type = T_TAG_SINGLE;
                    break;
                } else error("Unexpected symbol");
            } else error("`/>' expected");
        }
        char_next();
    }
 
    char_next();
}
 
//----------------------------------------------------------------------------
 
static void scan_data() {
 
    Token.type = T_DATA;
    Token.value.data_length = 0;
    do {
        Token.value.data_length += 1;
        char_next();
    } while ((Character.val != EOF) && (Character.val != '<'));
}

I2luY2x1ZGUgPGN0eXBlLmg+CiNpbmNsdWRlIDxzdGRpby5oPgojaW5jbHVkZSA8c3RkbGliLmg+CiNpbmNsdWRlIDxzdHJpbmcuaD4KI2luY2x1ZGUgPHN0ZGJvb2wuaD4KCiNkZWZpbmUgVEFHX01BWF9MRU4gMzIgIC8vINCc0LDQutGB0LjQvNCw0LvRjNC90LDRjyDQtNC70LjQvdCwINC40LzQtdC90Lgg0YLQtdCz0LAKCi8vINCS0LjQtNGLINC70LXQutGB0LXQvAp0eXBlZGVmIGVudW0gewogICAgVF9UQUdfQkVHLCAgICAgIC8vINCe0YLQutGA0YvQstCw0Y7RidC40Lkg0YLQtdCzCiAgICBUX1RBR19FTkQsICAgICAgLy8g0JfQsNC60YDRi9Cy0LDRjtGJ0LjQuSDRgtC10LMKICAgIFRfVEFHX1NJTkdMRSwgICAvLyDQntC00LjQvdC+0YfQvdGL0Lkg0YLQtdCzCiAgICBUX0RBVEEsICAgICAgICAgLy8gItCU0LDQvdC90YvQtSIgKNGC0L4g0LXRgdGC0YwsINC90LUg0YLQtdCzKQogICAgVF9FTkQgICAgICAgICAgIC8vINCa0L7QvdC10YYg0L/QvtGC0L7QutCwINC70LXQutGB0LXQvAp9IHRva2VuX3R5cGU7CgovLyDQodGC0YDRg9C60YLRg9GA0LAg0LTQu9GPINGC0L7QutC10L3QsApzdHJ1Y3QgewogICAgdG9rZW5fdHlwZSB0eXBlOyAgICAgICAgICAgICAgICAvLyDQktC40LQg0LvQtdC60YHQtdC80YsKCiAgICAvLyDQlNC+0L/QvtC70L3QuNGC0LXQu9GM0L3Ri9C1INC00LDQvdC90YvQtSDQu9C10LrRgdC10LzRiwogICAgLy8g0JLRi9Cx0LjRgNCw0LXRgtGB0Y8g0L7QtNC90L4g0LjQtyDQtNCy0YPRhQogICAgdW5pb24gewogICAgICAgIGNoYXIgdGFnX25hbWVbVEFHX01BWF9MRU5dOyAvLyDQmNC80Y8g0YLQtdCz0LAKICAgICAgICBzaXplX3QgZGF0YV9sZW5ndGg7ICAgICAgICAgLy8g0JTQu9C40L3QsCDQtNCw0L3QvdGL0YUKICAgIH0gdmFsdWU7Cn0gVG9rZW47CgovLyDQl9C00LXRgdGMINGF0YDQsNC90LjRgtGB0Y8g0YLQtdC60YPRidC40Lkg0YHQuNC80LLQvtC7CnN0cnVjdCB7CiAgICBpbnQgdmFsOyAgICAgICAgLy8g0KHQsNC8INGB0LjQvNCy0L7QuwogICAgc2l6ZV90IHBvczsgICAgIC8vINCf0L7Qt9C40YbQuNGPINCyINGB0YLRgNC+0LrQtQogICAgc2l6ZV90IGxpbmU7ICAgIC8vINCd0L7QvNC10YAg0YHRgtGA0L7QutC4Cn0gQ2hhcmFjdGVyOwoKc2l6ZV90IHRhYnVsYXRpb247CmNvbnN0IHNpemVfdCBUQUJfU1RFUCA9IDQ7CgpzdGF0aWMgdm9pZCBpbml0KCk7CnN0YXRpYyB2b2lkIHRva2VuX25leHQoKTsKCi8vLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQoKaW50IG1haW4oKSB7CiAgICBpbml0KCk7CiAgICBmb3IgKHRva2VuX25leHQoKTsgVG9rZW4udHlwZSAhPSBUX0VORDsgdG9rZW5fbmV4dCgpKSB7CiAgICAgICAgc3dpdGNoIChUb2tlbi50eXBlKSB7CiAgICAgICAgY2FzZSBUX1RBR19CRUc6CiAgICAgICAgICAgIHByaW50ZigiJSpjJXNcbiIsIHRhYnVsYXRpb24sICd7JywgVG9rZW4udmFsdWUudGFnX25hbWUpOwogICAgICAgICAgICB0YWJ1bGF0aW9uICs9IFRBQl9TVEVQOwogICAgICAgICAgICBicmVhazsKICAgICAgICBjYXNlIFRfVEFHX0VORDoKICAgICAgICAgICAgdGFidWxhdGlvbiAtPSBUQUJfU1RFUDsKICAgICAgICAgICAgcHJpbnRmKCIlKmNcbiIsIHRhYnVsYXRpb24sICd9Jyk7CiAgICAgICAgICAgIGJyZWFrOwogICAgICAgIGNhc2UgVF9UQUdfU0lOR0xFOgogICAgICAgICAgICBwcmludGYoIiUqYyVzfVxuIiwgdGFidWxhdGlvbiwgJ3snLCBUb2tlbi52YWx1ZS50YWdfbmFtZSk7CiAgICAgICAgICAgIGJyZWFrOwogICAgICAgIGNhc2UgVF9EQVRBOgogICAgICAgICAgICBwcmludGYoIiUqY2RhdGEgbGVuZ3RoOiAldV1cbiIsIHRhYnVsYXRpb24sICdbJywgVG9rZW4udmFsdWUuZGF0YV9sZW5ndGgpOwogICAgICAgICAgICBicmVhazsKICAgICAgICBkZWZhdWx0OgogICAgICAgICAgICBmcHJpbnRmKHN0ZGVyciwgIiVzXG4iLCAiUnVudGltZSBlcnJvciIpOwogICAgICAgICAgICBleGl0KEVYSVRfRkFJTFVSRSk7CiAgICAgICAgfQogICAgfQogICAgaWYgKHRhYnVsYXRpb24pIHsKICAgICAgICBmcHJpbnRmKHN0ZGVyciwgIldhcm5pbmchICVzXG4iLCAiVW5tYXRjaGVkIHRhZyIpOwogICAgfQp9CgovLy0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0KCnN0YXRpYyB2b2lkIGVycm9yKGNvbnN0IGNoYXIgKm1lc3NhZ2UpIHsKICAgIGZwcmludGYoCiAgICAgICAgc3RkZXJyLAogICAgICAgICJFcnJvclsldToldV0gJXNcbiIsCiAgICAgICAgQ2hhcmFjdGVyLmxpbmUgKyAxLAogICAgICAgIENoYXJhY3Rlci5wb3MsCiAgICAgICAgbWVzc2FnZSk7CiAgICBleGl0KEVYSVRfRkFJTFVSRSk7Cn0KCi8vLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQoKc3RhdGljIHZvaWQgY2hhcl9uZXh0KCkgewogICAgQ2hhcmFjdGVyLnZhbCA9IGdldGNoYXIoKTsKICAgIGlmIChDaGFyYWN0ZXIudmFsID09ICdcbicpIHsKICAgICAgICBDaGFyYWN0ZXIucG9zID0gMDsKICAgICAgICBDaGFyYWN0ZXIubGluZSArPSAxOwogICAgfSBlbHNlIHsKICAgICAgICBDaGFyYWN0ZXIucG9zICs9IDE7CiAgICB9Cn0KCi8vLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQoKc3RhdGljIHZvaWQgaW5pdCgpIHsKICAgIGNoYXJfbmV4dCgpOwp9CgovLy0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0KCnN0YXRpYyB2b2lkIHNjYW5fdGFnKCk7CnN0YXRpYyB2b2lkIHNjYW5fZGF0YSgpOwoKc3RhdGljIHZvaWQgdG9rZW5fbmV4dCgpIHsKICAgIHdoaWxlIChpc3NwYWNlKENoYXJhY3Rlci52YWwpKQogICAgICAgIGNoYXJfbmV4dCgpOwoKICAgIHN3aXRjaCAoQ2hhcmFjdGVyLnZhbCkgewogICAgY2FzZSBFT0Y6CiAgICAgICAgVG9rZW4udHlwZSA9IFRfRU5EOwogICAgICAgIGJyZWFrOwogICAgY2FzZSAnPCc6CiAgICAgICAgc2Nhbl90YWcoKTsKICAgICAgICBicmVhazsKICAgIGRlZmF1bHQ6CiAgICAgICAgc2Nhbl9kYXRhKCk7CiAgICB9Cn0KCi8vLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQoKc3RhdGljIHZvaWQgc2tpcF9jb21tZW50KCkgewogICAgY2hhcl9uZXh0KCk7CiAgICBpZiAoQ2hhcmFjdGVyLnZhbCAhPSAnLScpIGVycm9yKCJVbmV4cGVjdGVkIHN5bWJvbCIpOwogICAgY2hhcl9uZXh0KCk7CiAgICBpZiAoQ2hhcmFjdGVyLnZhbCAhPSAnLScpIGVycm9yKCJVbmV4cGVjdGVkIHN5bWJvbCIpOwoKICAgIF9Cb29sIGNvbW1lbnRfZmxhZyA9IHRydWU7CiAgICB3aGlsZSAoKENoYXJhY3Rlci52YWwgIT0gRU9GKSAmJiBjb21tZW50X2ZsYWcpIHsKICAgICAgICBjaGFyX25leHQoKTsKICAgICAgICBpZiAoQ2hhcmFjdGVyLnZhbCA9PSAnLScpIHsKICAgICAgICAgICAgY2hhcl9uZXh0KCk7CiAgICAgICAgICAgIGlmIChDaGFyYWN0ZXIudmFsID09ICctJykgewogICAgICAgICAgICAgICAgY2hhcl9uZXh0KCk7CiAgICAgICAgICAgICAgICBpZiAoQ2hhcmFjdGVyLnZhbCA9PSAnPicpIGNvbW1lbnRfZmxhZyA9IGZhbHNlOwogICAgICAgICAgICB9CiAgICAgICAgfQogICAgfQogICAgY2hhcl9uZXh0KCk7Cn0KCi8vLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQoKc3RhdGljIHZvaWQgdGFnX2dldF9uYW1lKCkgewogICAgaW50IGkgPSAwOwogICAgd2hpbGUgKChpIDwgKFRBR19NQVhfTEVOIC0gMSkpICYmIGlzYWxudW0oQ2hhcmFjdGVyLnZhbCkpIHsKICAgICAgICBUb2tlbi52YWx1ZS50YWdfbmFtZVtpXSA9IENoYXJhY3Rlci52YWw7CiAgICAgICAgY2hhcl9uZXh0KCk7CiAgICAgICAgaSArPSAxOwogICAgfQoKICAgIC8vINCX0LDQstC10YDRiNCw0Y7RidC40Lkg0L3QvtC70Ywg0LTQu9GPINGB0YLRgNC+0LrQuAogICAgVG9rZW4udmFsdWUudGFnX25hbWVbaV0gPSAwOwp9CgovLy0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0KCnN0YXRpYyB2b2lkIHNjYW5fdGFnKCkgewogICAgY2hhcl9uZXh0KCk7CgogICAgaWYgKENoYXJhY3Rlci52YWwgPT0gJyEnKSB7CiAgICAgICAgc2tpcF9jb21tZW50KCk7CiAgICAgICAgdG9rZW5fbmV4dCgpOwogICAgICAgIHJldHVybjsKICAgIH0KICAgIGVsc2UgaWYgKENoYXJhY3Rlci52YWwgPT0gJy8nKSB7CiAgICAgICAgVG9rZW4udHlwZSA9IFRfVEFHX0VORDsKICAgICAgICBjaGFyX25leHQoKTsKICAgIH0KICAgIGVsc2UgVG9rZW4udHlwZSA9IFRfVEFHX0JFRzsKCiAgICAvLyDQl9Cw0L/QvtC80LjQvdCw0LXQvCDQuNC80Y8g0YLQtdCz0LAKICAgIHRhZ19nZXRfbmFtZSgpOwogICAgLy8g0JTQtdGC0LXQutGC0LjQvCDQv9GD0YHRgtGL0LUg0YLQtdCz0LgKICAgIGlmICghc3RybGVuKFRva2VuLnZhbHVlLnRhZ19uYW1lKSkgZXJyb3IoIkVtcHR5IHRhZyIpOwoKICAgIC8vINCY0YnQtdC8INC60L7QvdC10YYg0YLQtdCz0LAKICAgIHdoaWxlIChDaGFyYWN0ZXIudmFsICE9ICc+JykgewogICAgICAgIGlmIChDaGFyYWN0ZXIudmFsID09IEVPRikgZXJyb3IoImA+JyBleHBlY3RlZCIpOwogICAgICAgIGlmIChDaGFyYWN0ZXIudmFsID09ICcvJykgewogICAgICAgICAgICBjaGFyX25leHQoKTsKICAgICAgICAgICAgaWYgKENoYXJhY3Rlci52YWwgPT0gJz4nKSB7CiAgICAgICAgICAgICAgICBpZiAoVG9rZW4udHlwZSA9PSBUX1RBR19CRUcpIHsKICAgICAgICAgICAgICAgICAgICBUb2tlbi50eXBlID0gVF9UQUdfU0lOR0xFOwogICAgICAgICAgICAgICAgICAgIGJyZWFrOwogICAgICAgICAgICAgICAgfSBlbHNlIGVycm9yKCJVbmV4cGVjdGVkIHN5bWJvbCIpOwogICAgICAgICAgICB9IGVsc2UgZXJyb3IoImAvPicgZXhwZWN0ZWQiKTsKICAgICAgICB9CiAgICAgICAgY2hhcl9uZXh0KCk7CiAgICB9CgogICAgY2hhcl9uZXh0KCk7Cn0KCi8vLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQoKc3RhdGljIHZvaWQgc2Nhbl9kYXRhKCkgewoKICAgIFRva2VuLnR5cGUgPSBUX0RBVEE7CiAgICBUb2tlbi52YWx1ZS5kYXRhX2xlbmd0aCA9IDA7CiAgICBkbyB7CiAgICAgICAgVG9rZW4udmFsdWUuZGF0YV9sZW5ndGggKz0gMTsKICAgICAgICBjaGFyX25leHQoKTsKICAgIH0gd2hpbGUgKChDaGFyYWN0ZXIudmFsICE9IEVPRikgJiYgKENoYXJhY3Rlci52YWwgIT0gJzwnKSk7Cn0K

Success #stdin #stdout 0s 2164KB

stdin

copy

<html>
<!-- TEST COMMENT -->
<head><title>Test input</title></head>
<body><h1>Welcome!</h1><hr/>This is a test<br/>End of data</body>
</html>

stdout

copy

{html
   {head
       {title
           [data length: 10]
       }
   }
   {body
       {h1
           [data length: 8]
       }
       {hr}
       [data length: 14]
       {br}
       [data length: 11]
   }
}

https://ideone.com/DtRm21

language:

C (gcc 8.3)

created:

visibility:

public

Share or Embed source code

Discover > Sphere Engine API

The brand new service which powers Ideone!

Discover > IDE Widget

Widget for compiling and running the source code in a web browser!

Discover > Sphere Engine API

Discover > IDE Widget

Choose your language