Ideone.com

fork download

copy

#include <cassert>
#include <cctype>
#include <cstring>
#include <fstream>
#include <functional>
#include <iostream>
#include <map>
#include <set>
#include <string>
#include <unordered_map>
 
static const uint32_t small_rus_io = 0x451;
static const uint32_t capital_rus_io = 0x401;
 
static const uint32_t small_rus_ie = 0x435;
static const uint32_t capital_rus_ie = 0x415;
 
class utf8_iterator final
{
public:
    explicit utf8_iterator(const char* text)
        : text_(text)
        , current_(text)
        , bytes_count_(text ? get_bytes_count(*text) : 0)
        , code_point_(0)
    {
    }
 
    const char* first_byte() const
    {
        return current_;
    }
 
    size_t bytes_count() const
    {
        return bytes_count_;
    }
 
    bool has_char() const
    {
        return current_ && current_[0] != 0;
    }
 
    uint32_t code_point() const
    {
        if (code_point_ != 0)
            return code_point_;
 
        switch (bytes_count_)
        {
        case 1:
            code_point_ = *current_;
            break;
        case 2:
            code_point_ = ((current_[0] & 0x1F) << 6) | (current_[1] & 0x3F);
            break;
        default:
            //TODO: not implemented yet
            ;
        }
 
        return code_point_;
    }
 
    void operator++()
    {
        if (!has_char())
            return;
 
        current_ += bytes_count_;
        bytes_count_ = get_bytes_count(*current_);
        code_point_ = 0;
    }
 
private:
    static size_t get_bytes_count(char first_char)
    {
        auto c = *reinterpret_cast<unsigned char*>(&first_char);
        if (c == 0) return 0;
        if (c <= 0x7F) return 1;
        if ((c & 0xE0) == 0xC0) return 2;
        if ((c & 0xF0) == 0xE0) return 3;
        if ((c & 0xF8) == 0xF0) return 4;
        if ((c & 0xFC) == 0xF8) return 5;
        if ((c & 0xFE) == 0xFC) return 6;
        return 0;
    }
 
private:
    const char* text_;
    const char* current_;
    size_t bytes_count_;
    mutable uint32_t code_point_;
};
 
bool is_english_char(const utf8_iterator& it)
{
    return it.bytes_count() == 1 && std::isalpha(it.first_byte()[0]);
}
 
bool is_russian_char(const utf8_iterator& it)
{
    const auto code = it.code_point();
    return (code >= 0x410 && code <= 0x44F) || (code == capital_rus_io || code == small_rus_io);
}
 
void english_to_lower_and_append(const utf8_iterator& it, std::string& out)
{
    out += std::tolower(it.first_byte()[0]);
}
 
void russian_to_lower_and_append(const utf8_iterator& it, std::string& out)
{
    const auto code = it.code_point();
    auto new_code = code;
 
    if (code >= 0x410 && code <= 0x42F)
        new_code += (0x42F - 0x410 + 1);
    else if (code == 0x401)
        new_code = 0x451;
 
 
    if (new_code != code)
    {
        out += (new_code >> 6) | 0xC0;
        out += (new_code & 0x3F) | 0x80;
    }
    else
    {
        out += it.first_byte()[0];
        out += it.first_byte()[1];
    }
}
 
std::string get_word(utf8_iterator& current)
{
    using char_detector_t = std::function<bool(const utf8_iterator&)>;
    char_detector_t is_allowable_char = nullptr;
 
    using char_converter_t = std::function<void(const utf8_iterator&, std::string&)>;
    char_converter_t to_lower_and_append = nullptr;
 
    while (current.has_char())
    {
        if (is_english_char(current))
        {
            is_allowable_char = is_english_char;
            to_lower_and_append = english_to_lower_and_append;
            break;
        }
        else if (is_russian_char(current))
        {
            is_allowable_char = is_russian_char;
            to_lower_and_append = russian_to_lower_and_append;
            break;
        }
 
        // looking for char
        ++current;
    }
 
    std::string word;
 
    if (!is_allowable_char)
        return word;
 
    do
    {
        to_lower_and_append(current, word);
        ++current;
    }
    while (is_allowable_char(current));
 
    return word;
}
 
struct utf8_comparer final
{
public:
    bool operator()(const char* left, const char* right) const
    {
        utf8_iterator left_iter(left);
        const bool left_is_russian = is_russian_char(left_iter);
 
        utf8_iterator right_iter(right);
        const bool right_is_russian = is_russian_char(right_iter);
 
        if (left_is_russian && right_is_russian)
        {
            while (left_iter.has_char() && right_iter.has_char())
            {
                const auto left_code = left_iter.code_point();
                const auto right_code = right_iter.code_point();
 
                if (left_code == small_rus_io && right_code != left_code)
                    return right_code >= small_rus_ie;
 
                if (left_code == right_code)
                {
                    ++left_iter;
                    ++right_iter;
                }
                else
                {
                    return left_code < right_code;
                }
            }
 
            return !left_iter.has_char() && right_iter.has_char();
        }
 
        return strcmp(left, right) < 0;
    }
};
 
#ifdef TESTING_ENABLED
void test_is_russian()
{
    assert(is_russian_char(utf8_iterator("а")));
    assert(is_russian_char(utf8_iterator("А")));
    assert(is_russian_char(utf8_iterator("ё")));
    assert(is_russian_char(utf8_iterator("Ё")));
    assert(is_russian_char(utf8_iterator("я")));
    assert(is_russian_char(utf8_iterator("Я")));
    assert(!is_russian_char(utf8_iterator("q")));
    assert(!is_russian_char(utf8_iterator("1")));
}
 
bool is_equal_as_lower(const char* left, const char* right)
{
    std::string buf;
    russian_to_lower_and_append(utf8_iterator(left), buf);
    return strcmp(buf.c_str(), right) == 0;
}
 
void test_russian_to_lower()
{
    assert(is_equal_as_lower("А", "а"));
    assert(is_equal_as_lower("Я", "я"));
    assert(is_equal_as_lower("ф", "ф"));
    assert(is_equal_as_lower("Ё", "ё"));
    assert(is_equal_as_lower("ё", "ё"));
}
 
void test_comparer()
{
    assert(utf8_comparer()("a", "b"));
    assert(utf8_comparer()("aa", "ab"));
    assert(!utf8_comparer()("a", "a"));
    assert(utf8_comparer()("б", "в"));
    assert(utf8_comparer()("е", "ё"));
    assert(utf8_comparer()("ё", "ж"));
    assert(utf8_comparer()("b", "б"));
}
#endif
 
int main(int argc, char* argv[])
{
#ifdef TESTING_ENABLED
    test_is_russian();
    test_russian_to_lower();
    test_comparer();
#endif
 
    if (argc != 3)
    {
        std::cerr << "words counter\n";
        std::cerr << "usage:\n";
        std::cerr << "  freqs in_file out_file\n";
        return EXIT_FAILURE;
    }
 
    const auto in_file_name = argv[1];
 
    std::ifstream in(in_file_name, std::ios::binary);
    if (!in)
    {
        std::cerr << "can't open " << in_file_name << '\n';
        return EXIT_FAILURE;
    }
 
    std::unordered_map<std::string, size_t> count_by_word;
 
    std::string line;
    while (std::getline(in, line))
    {
        auto it = utf8_iterator(line.c_str());
        while (it.has_char())
        {
            const auto word = get_word(it);
            if (!word.empty())
                ++count_by_word[word];
        }
    }
 
    const auto out_file_name = argv[2];
 
    std::ofstream out(out_file_name, std::ios::binary);
    if (!out)
    {
        std::cerr << "can't open " << out_file_name << '\n';
        return EXIT_FAILURE;
    }
 
    using sorted_words_t = std::set<const char*, utf8_comparer>;
    std::map<size_t, sorted_words_t> sorted_words_by_count;
 
    for (auto& it : count_by_word)
    {
        const auto count = it.second;
        const auto word = it.first.c_str();
        sorted_words_by_count[count].insert(word);
    }
 
    for (auto it = sorted_words_by_count.rbegin(), end = sorted_words_by_count.rend(); it != end; ++it)
    {
        const auto count = it->first;
        for (auto word : it->second)
            out << count << ' ' << word << '\n';
    }
 
    return EXIT_SUCCESS;
}

I2luY2x1ZGUgPGNhc3NlcnQ+CiNpbmNsdWRlIDxjY3R5cGU+CiNpbmNsdWRlIDxjc3RyaW5nPgojaW5jbHVkZSA8ZnN0cmVhbT4KI2luY2x1ZGUgPGZ1bmN0aW9uYWw+CiNpbmNsdWRlIDxpb3N0cmVhbT4KI2luY2x1ZGUgPG1hcD4KI2luY2x1ZGUgPHNldD4KI2luY2x1ZGUgPHN0cmluZz4KI2luY2x1ZGUgPHVub3JkZXJlZF9tYXA+CgpzdGF0aWMgY29uc3QgdWludDMyX3Qgc21hbGxfcnVzX2lvID0gMHg0NTE7CnN0YXRpYyBjb25zdCB1aW50MzJfdCBjYXBpdGFsX3J1c19pbyA9IDB4NDAxOwoKc3RhdGljIGNvbnN0IHVpbnQzMl90IHNtYWxsX3J1c19pZSA9IDB4NDM1OwpzdGF0aWMgY29uc3QgdWludDMyX3QgY2FwaXRhbF9ydXNfaWUgPSAweDQxNTsKCmNsYXNzIHV0ZjhfaXRlcmF0b3IgZmluYWwKewpwdWJsaWM6CiAgICBleHBsaWNpdCB1dGY4X2l0ZXJhdG9yKGNvbnN0IGNoYXIqIHRleHQpCiAgICAgICAgOiB0ZXh0Xyh0ZXh0KQogICAgICAgICwgY3VycmVudF8odGV4dCkKICAgICAgICAsIGJ5dGVzX2NvdW50Xyh0ZXh0ID8gZ2V0X2J5dGVzX2NvdW50KCp0ZXh0KSA6IDApCiAgICAgICAgLCBjb2RlX3BvaW50XygwKQogICAgewogICAgfQoKICAgIGNvbnN0IGNoYXIqIGZpcnN0X2J5dGUoKSBjb25zdAogICAgewogICAgICAgIHJldHVybiBjdXJyZW50XzsKICAgIH0KCiAgICBzaXplX3QgYnl0ZXNfY291bnQoKSBjb25zdAogICAgewogICAgICAgIHJldHVybiBieXRlc19jb3VudF87CiAgICB9CgogICAgYm9vbCBoYXNfY2hhcigpIGNvbnN0CiAgICB7CiAgICAgICAgcmV0dXJuIGN1cnJlbnRfICYmIGN1cnJlbnRfWzBdICE9IDA7CiAgICB9CgogICAgdWludDMyX3QgY29kZV9wb2ludCgpIGNvbnN0CiAgICB7CiAgICAgICAgaWYgKGNvZGVfcG9pbnRfICE9IDApCiAgICAgICAgICAgIHJldHVybiBjb2RlX3BvaW50XzsKCiAgICAgICAgc3dpdGNoIChieXRlc19jb3VudF8pCiAgICAgICAgewogICAgICAgIGNhc2UgMToKICAgICAgICAgICAgY29kZV9wb2ludF8gPSAqY3VycmVudF87CiAgICAgICAgICAgIGJyZWFrOwogICAgICAgIGNhc2UgMjoKICAgICAgICAgICAgY29kZV9wb2ludF8gPSAoKGN1cnJlbnRfWzBdICYgMHgxRikgPDwgNikgfCAoY3VycmVudF9bMV0gJiAweDNGKTsKICAgICAgICAgICAgYnJlYWs7CiAgICAgICAgZGVmYXVsdDoKICAgICAgICAgICAgLy9UT0RPOiBub3QgaW1wbGVtZW50ZWQgeWV0CiAgICAgICAgICAgIDsKICAgICAgICB9CgogICAgICAgIHJldHVybiBjb2RlX3BvaW50XzsKICAgIH0KCiAgICB2b2lkIG9wZXJhdG9yKysoKQogICAgewogICAgICAgIGlmICghaGFzX2NoYXIoKSkKICAgICAgICAgICAgcmV0dXJuOwoKICAgICAgICBjdXJyZW50XyArPSBieXRlc19jb3VudF87CiAgICAgICAgYnl0ZXNfY291bnRfID0gZ2V0X2J5dGVzX2NvdW50KCpjdXJyZW50Xyk7CiAgICAgICAgY29kZV9wb2ludF8gPSAwOwogICAgfQoKcHJpdmF0ZToKICAgIHN0YXRpYyBzaXplX3QgZ2V0X2J5dGVzX2NvdW50KGNoYXIgZmlyc3RfY2hhcikKICAgIHsKICAgICAgICBhdXRvIGMgPSAqcmVpbnRlcnByZXRfY2FzdDx1bnNpZ25lZCBjaGFyKj4oJmZpcnN0X2NoYXIpOwogICAgICAgIGlmIChjID09IDApIHJldHVybiAwOwogICAgICAgIGlmIChjIDw9IDB4N0YpIHJldHVybiAxOwogICAgICAgIGlmICgoYyAmIDB4RTApID09IDB4QzApIHJldHVybiAyOwogICAgICAgIGlmICgoYyAmIDB4RjApID09IDB4RTApIHJldHVybiAzOwogICAgICAgIGlmICgoYyAmIDB4RjgpID09IDB4RjApIHJldHVybiA0OwogICAgICAgIGlmICgoYyAmIDB4RkMpID09IDB4RjgpIHJldHVybiA1OwogICAgICAgIGlmICgoYyAmIDB4RkUpID09IDB4RkMpIHJldHVybiA2OwogICAgICAgIHJldHVybiAwOwogICAgfQoKcHJpdmF0ZToKICAgIGNvbnN0IGNoYXIqIHRleHRfOwogICAgY29uc3QgY2hhciogY3VycmVudF87CiAgICBzaXplX3QgYnl0ZXNfY291bnRfOwogICAgbXV0YWJsZSB1aW50MzJfdCBjb2RlX3BvaW50XzsKfTsKCmJvb2wgaXNfZW5nbGlzaF9jaGFyKGNvbnN0IHV0ZjhfaXRlcmF0b3ImIGl0KQp7CiAgICByZXR1cm4gaXQuYnl0ZXNfY291bnQoKSA9PSAxICYmIHN0ZDo6aXNhbHBoYShpdC5maXJzdF9ieXRlKClbMF0pOwp9Cgpib29sIGlzX3J1c3NpYW5fY2hhcihjb25zdCB1dGY4X2l0ZXJhdG9yJiBpdCkKewogICAgY29uc3QgYXV0byBjb2RlID0gaXQuY29kZV9wb2ludCgpOwogICAgcmV0dXJuIChjb2RlID49IDB4NDEwICYmIGNvZGUgPD0gMHg0NEYpIHx8IChjb2RlID09IGNhcGl0YWxfcnVzX2lvIHx8IGNvZGUgPT0gc21hbGxfcnVzX2lvKTsKfQoKdm9pZCBlbmdsaXNoX3RvX2xvd2VyX2FuZF9hcHBlbmQoY29uc3QgdXRmOF9pdGVyYXRvciYgaXQsIHN0ZDo6c3RyaW5nJiBvdXQpCnsKICAgIG91dCArPSBzdGQ6OnRvbG93ZXIoaXQuZmlyc3RfYnl0ZSgpWzBdKTsKfQoKdm9pZCBydXNzaWFuX3RvX2xvd2VyX2FuZF9hcHBlbmQoY29uc3QgdXRmOF9pdGVyYXRvciYgaXQsIHN0ZDo6c3RyaW5nJiBvdXQpCnsKICAgIGNvbnN0IGF1dG8gY29kZSA9IGl0LmNvZGVfcG9pbnQoKTsKICAgIGF1dG8gbmV3X2NvZGUgPSBjb2RlOwoKICAgIGlmIChjb2RlID49IDB4NDEwICYmIGNvZGUgPD0gMHg0MkYpCiAgICAgICAgbmV3X2NvZGUgKz0gKDB4NDJGIC0gMHg0MTAgKyAxKTsKICAgIGVsc2UgaWYgKGNvZGUgPT0gMHg0MDEpCiAgICAgICAgbmV3X2NvZGUgPSAweDQ1MTsKCgogICAgaWYgKG5ld19jb2RlICE9IGNvZGUpCiAgICB7CiAgICAgICAgb3V0ICs9IChuZXdfY29kZSA+PiA2KSB8IDB4QzA7CiAgICAgICAgb3V0ICs9IChuZXdfY29kZSAmIDB4M0YpIHwgMHg4MDsKICAgIH0KICAgIGVsc2UKICAgIHsKICAgICAgICBvdXQgKz0gaXQuZmlyc3RfYnl0ZSgpWzBdOwogICAgICAgIG91dCArPSBpdC5maXJzdF9ieXRlKClbMV07CiAgICB9Cn0KCnN0ZDo6c3RyaW5nIGdldF93b3JkKHV0ZjhfaXRlcmF0b3ImIGN1cnJlbnQpCnsKICAgIHVzaW5nIGNoYXJfZGV0ZWN0b3JfdCA9IHN0ZDo6ZnVuY3Rpb248Ym9vbChjb25zdCB1dGY4X2l0ZXJhdG9yJik+OwogICAgY2hhcl9kZXRlY3Rvcl90IGlzX2FsbG93YWJsZV9jaGFyID0gbnVsbHB0cjsKCiAgICB1c2luZyBjaGFyX2NvbnZlcnRlcl90ID0gc3RkOjpmdW5jdGlvbjx2b2lkKGNvbnN0IHV0ZjhfaXRlcmF0b3ImLCBzdGQ6OnN0cmluZyYpPjsKICAgIGNoYXJfY29udmVydGVyX3QgdG9fbG93ZXJfYW5kX2FwcGVuZCA9IG51bGxwdHI7CgogICAgd2hpbGUgKGN1cnJlbnQuaGFzX2NoYXIoKSkKICAgIHsKICAgICAgICBpZiAoaXNfZW5nbGlzaF9jaGFyKGN1cnJlbnQpKQogICAgICAgIHsKICAgICAgICAgICAgaXNfYWxsb3dhYmxlX2NoYXIgPSBpc19lbmdsaXNoX2NoYXI7CiAgICAgICAgICAgIHRvX2xvd2VyX2FuZF9hcHBlbmQgPSBlbmdsaXNoX3RvX2xvd2VyX2FuZF9hcHBlbmQ7CiAgICAgICAgICAgIGJyZWFrOwogICAgICAgIH0KICAgICAgICBlbHNlIGlmIChpc19ydXNzaWFuX2NoYXIoY3VycmVudCkpCiAgICAgICAgewogICAgICAgICAgICBpc19hbGxvd2FibGVfY2hhciA9IGlzX3J1c3NpYW5fY2hhcjsKICAgICAgICAgICAgdG9fbG93ZXJfYW5kX2FwcGVuZCA9IHJ1c3NpYW5fdG9fbG93ZXJfYW5kX2FwcGVuZDsKICAgICAgICAgICAgYnJlYWs7CiAgICAgICAgfQoKICAgICAgICAvLyBsb29raW5nIGZvciBjaGFyCiAgICAgICAgKytjdXJyZW50OwogICAgfQoKICAgIHN0ZDo6c3RyaW5nIHdvcmQ7CgogICAgaWYgKCFpc19hbGxvd2FibGVfY2hhcikKICAgICAgICByZXR1cm4gd29yZDsKCiAgICBkbwogICAgewogICAgICAgIHRvX2xvd2VyX2FuZF9hcHBlbmQoY3VycmVudCwgd29yZCk7CiAgICAgICAgKytjdXJyZW50OwogICAgfQogICAgd2hpbGUgKGlzX2FsbG93YWJsZV9jaGFyKGN1cnJlbnQpKTsKCiAgICByZXR1cm4gd29yZDsKfQoKc3RydWN0IHV0ZjhfY29tcGFyZXIgZmluYWwKewpwdWJsaWM6CiAgICBib29sIG9wZXJhdG9yKCkoY29uc3QgY2hhciogbGVmdCwgY29uc3QgY2hhciogcmlnaHQpIGNvbnN0CiAgICB7CiAgICAgICAgdXRmOF9pdGVyYXRvciBsZWZ0X2l0ZXIobGVmdCk7CiAgICAgICAgY29uc3QgYm9vbCBsZWZ0X2lzX3J1c3NpYW4gPSBpc19ydXNzaWFuX2NoYXIobGVmdF9pdGVyKTsKCiAgICAgICAgdXRmOF9pdGVyYXRvciByaWdodF9pdGVyKHJpZ2h0KTsKICAgICAgICBjb25zdCBib29sIHJpZ2h0X2lzX3J1c3NpYW4gPSBpc19ydXNzaWFuX2NoYXIocmlnaHRfaXRlcik7CgogICAgICAgIGlmIChsZWZ0X2lzX3J1c3NpYW4gJiYgcmlnaHRfaXNfcnVzc2lhbikKICAgICAgICB7CiAgICAgICAgICAgIHdoaWxlIChsZWZ0X2l0ZXIuaGFzX2NoYXIoKSAmJiByaWdodF9pdGVyLmhhc19jaGFyKCkpCiAgICAgICAgICAgIHsKICAgICAgICAgICAgICAgIGNvbnN0IGF1dG8gbGVmdF9jb2RlID0gbGVmdF9pdGVyLmNvZGVfcG9pbnQoKTsKICAgICAgICAgICAgICAgIGNvbnN0IGF1dG8gcmlnaHRfY29kZSA9IHJpZ2h0X2l0ZXIuY29kZV9wb2ludCgpOwoKICAgICAgICAgICAgICAgIGlmIChsZWZ0X2NvZGUgPT0gc21hbGxfcnVzX2lvICYmIHJpZ2h0X2NvZGUgIT0gbGVmdF9jb2RlKQogICAgICAgICAgICAgICAgICAgIHJldHVybiByaWdodF9jb2RlID49IHNtYWxsX3J1c19pZTsKCiAgICAgICAgICAgICAgICBpZiAobGVmdF9jb2RlID09IHJpZ2h0X2NvZGUpCiAgICAgICAgICAgICAgICB7CiAgICAgICAgICAgICAgICAgICAgKytsZWZ0X2l0ZXI7CiAgICAgICAgICAgICAgICAgICAgKytyaWdodF9pdGVyOwogICAgICAgICAgICAgICAgfQogICAgICAgICAgICAgICAgZWxzZQogICAgICAgICAgICAgICAgewogICAgICAgICAgICAgICAgICAgIHJldHVybiBsZWZ0X2NvZGUgPCByaWdodF9jb2RlOwogICAgICAgICAgICAgICAgfQogICAgICAgICAgICB9CgogICAgICAgICAgICByZXR1cm4gIWxlZnRfaXRlci5oYXNfY2hhcigpICYmIHJpZ2h0X2l0ZXIuaGFzX2NoYXIoKTsKICAgICAgICB9CgogICAgICAgIHJldHVybiBzdHJjbXAobGVmdCwgcmlnaHQpIDwgMDsKICAgIH0KfTsKCiNpZmRlZiBURVNUSU5HX0VOQUJMRUQKdm9pZCB0ZXN0X2lzX3J1c3NpYW4oKQp7CiAgICBhc3NlcnQoaXNfcnVzc2lhbl9jaGFyKHV0ZjhfaXRlcmF0b3IoItCwIikpKTsKICAgIGFzc2VydChpc19ydXNzaWFuX2NoYXIodXRmOF9pdGVyYXRvcigi0JAiKSkpOwogICAgYXNzZXJ0KGlzX3J1c3NpYW5fY2hhcih1dGY4X2l0ZXJhdG9yKCLRkSIpKSk7CiAgICBhc3NlcnQoaXNfcnVzc2lhbl9jaGFyKHV0ZjhfaXRlcmF0b3IoItCBIikpKTsKICAgIGFzc2VydChpc19ydXNzaWFuX2NoYXIodXRmOF9pdGVyYXRvcigi0Y8iKSkpOwogICAgYXNzZXJ0KGlzX3J1c3NpYW5fY2hhcih1dGY4X2l0ZXJhdG9yKCLQryIpKSk7CiAgICBhc3NlcnQoIWlzX3J1c3NpYW5fY2hhcih1dGY4X2l0ZXJhdG9yKCJxIikpKTsKICAgIGFzc2VydCghaXNfcnVzc2lhbl9jaGFyKHV0ZjhfaXRlcmF0b3IoIjEiKSkpOwp9Cgpib29sIGlzX2VxdWFsX2FzX2xvd2VyKGNvbnN0IGNoYXIqIGxlZnQsIGNvbnN0IGNoYXIqIHJpZ2h0KQp7CiAgICBzdGQ6OnN0cmluZyBidWY7CiAgICBydXNzaWFuX3RvX2xvd2VyX2FuZF9hcHBlbmQodXRmOF9pdGVyYXRvcihsZWZ0KSwgYnVmKTsKICAgIHJldHVybiBzdHJjbXAoYnVmLmNfc3RyKCksIHJpZ2h0KSA9PSAwOwp9Cgp2b2lkIHRlc3RfcnVzc2lhbl90b19sb3dlcigpCnsKICAgIGFzc2VydChpc19lcXVhbF9hc19sb3dlcigi0JAiLCAi0LAiKSk7CiAgICBhc3NlcnQoaXNfZXF1YWxfYXNfbG93ZXIoItCvIiwgItGPIikpOwogICAgYXNzZXJ0KGlzX2VxdWFsX2FzX2xvd2VyKCLRhCIsICLRhCIpKTsKICAgIGFzc2VydChpc19lcXVhbF9hc19sb3dlcigi0IEiLCAi0ZEiKSk7CiAgICBhc3NlcnQoaXNfZXF1YWxfYXNfbG93ZXIoItGRIiwgItGRIikpOwp9Cgp2b2lkIHRlc3RfY29tcGFyZXIoKQp7CiAgICBhc3NlcnQodXRmOF9jb21wYXJlcigpKCJhIiwgImIiKSk7CiAgICBhc3NlcnQodXRmOF9jb21wYXJlcigpKCJhYSIsICJhYiIpKTsKICAgIGFzc2VydCghdXRmOF9jb21wYXJlcigpKCJhIiwgImEiKSk7CiAgICBhc3NlcnQodXRmOF9jb21wYXJlcigpKCLQsSIsICLQsiIpKTsKICAgIGFzc2VydCh1dGY4X2NvbXBhcmVyKCkoItC1IiwgItGRIikpOwogICAgYXNzZXJ0KHV0ZjhfY29tcGFyZXIoKSgi0ZEiLCAi0LYiKSk7CiAgICBhc3NlcnQodXRmOF9jb21wYXJlcigpKCJiIiwgItCxIikpOwp9CiNlbmRpZgoKaW50IG1haW4oaW50IGFyZ2MsIGNoYXIqIGFyZ3ZbXSkKewojaWZkZWYgVEVTVElOR19FTkFCTEVECiAgICB0ZXN0X2lzX3J1c3NpYW4oKTsKICAgIHRlc3RfcnVzc2lhbl90b19sb3dlcigpOwogICAgdGVzdF9jb21wYXJlcigpOwojZW5kaWYKCiAgICBpZiAoYXJnYyAhPSAzKQogICAgewogICAgICAgIHN0ZDo6Y2VyciA8PCAid29yZHMgY291bnRlclxuIjsKICAgICAgICBzdGQ6OmNlcnIgPDwgInVzYWdlOlxuIjsKICAgICAgICBzdGQ6OmNlcnIgPDwgIiAgZnJlcXMgaW5fZmlsZSBvdXRfZmlsZVxuIjsKICAgICAgICByZXR1cm4gRVhJVF9GQUlMVVJFOwogICAgfQoKICAgIGNvbnN0IGF1dG8gaW5fZmlsZV9uYW1lID0gYXJndlsxXTsKCiAgICBzdGQ6Omlmc3RyZWFtIGluKGluX2ZpbGVfbmFtZSwgc3RkOjppb3M6OmJpbmFyeSk7CiAgICBpZiAoIWluKQogICAgewogICAgICAgIHN0ZDo6Y2VyciA8PCAiY2FuJ3Qgb3BlbiAiIDw8IGluX2ZpbGVfbmFtZSA8PCAnXG4nOwogICAgICAgIHJldHVybiBFWElUX0ZBSUxVUkU7CiAgICB9CgogICAgc3RkOjp1bm9yZGVyZWRfbWFwPHN0ZDo6c3RyaW5nLCBzaXplX3Q+IGNvdW50X2J5X3dvcmQ7CgogICAgc3RkOjpzdHJpbmcgbGluZTsKICAgIHdoaWxlIChzdGQ6OmdldGxpbmUoaW4sIGxpbmUpKQogICAgewogICAgICAgIGF1dG8gaXQgPSB1dGY4X2l0ZXJhdG9yKGxpbmUuY19zdHIoKSk7CiAgICAgICAgd2hpbGUgKGl0Lmhhc19jaGFyKCkpCiAgICAgICAgewogICAgICAgICAgICBjb25zdCBhdXRvIHdvcmQgPSBnZXRfd29yZChpdCk7CiAgICAgICAgICAgIGlmICghd29yZC5lbXB0eSgpKQogICAgICAgICAgICAgICAgKytjb3VudF9ieV93b3JkW3dvcmRdOwogICAgICAgIH0KICAgIH0KCiAgICBjb25zdCBhdXRvIG91dF9maWxlX25hbWUgPSBhcmd2WzJdOwoKICAgIHN0ZDo6b2ZzdHJlYW0gb3V0KG91dF9maWxlX25hbWUsIHN0ZDo6aW9zOjpiaW5hcnkpOwogICAgaWYgKCFvdXQpCiAgICB7CiAgICAgICAgc3RkOjpjZXJyIDw8ICJjYW4ndCBvcGVuICIgPDwgb3V0X2ZpbGVfbmFtZSA8PCAnXG4nOwogICAgICAgIHJldHVybiBFWElUX0ZBSUxVUkU7CiAgICB9CgogICAgdXNpbmcgc29ydGVkX3dvcmRzX3QgPSBzdGQ6OnNldDxjb25zdCBjaGFyKiwgdXRmOF9jb21wYXJlcj47CiAgICBzdGQ6Om1hcDxzaXplX3QsIHNvcnRlZF93b3Jkc190PiBzb3J0ZWRfd29yZHNfYnlfY291bnQ7CgogICAgZm9yIChhdXRvJiBpdCA6IGNvdW50X2J5X3dvcmQpCiAgICB7CiAgICAgICAgY29uc3QgYXV0byBjb3VudCA9IGl0LnNlY29uZDsKICAgICAgICBjb25zdCBhdXRvIHdvcmQgPSBpdC5maXJzdC5jX3N0cigpOwogICAgICAgIHNvcnRlZF93b3Jkc19ieV9jb3VudFtjb3VudF0uaW5zZXJ0KHdvcmQpOwogICAgfQoKICAgIGZvciAoYXV0byBpdCA9IHNvcnRlZF93b3Jkc19ieV9jb3VudC5yYmVnaW4oKSwgZW5kID0gc29ydGVkX3dvcmRzX2J5X2NvdW50LnJlbmQoKTsgaXQgIT0gZW5kOyArK2l0KQogICAgewogICAgICAgIGNvbnN0IGF1dG8gY291bnQgPSBpdC0+Zmlyc3Q7CiAgICAgICAgZm9yIChhdXRvIHdvcmQgOiBpdC0+c2Vjb25kKQogICAgICAgICAgICBvdXQgPDwgY291bnQgPDwgJyAnIDw8IHdvcmQgPDwgJ1xuJzsKICAgIH0KCiAgICByZXR1cm4gRVhJVF9TVUNDRVNTOwp9Cg==

Runtime error #stdin #stdout #stderr 0s 16080KB

stdin

copy

Standard input is empty

stdout

copy

Standard output is empty

stderr

copy

words counter
usage:
  freqs in_file out_file

https://ideone.com/fRkqnw

language:

C++ (gcc 8.3)

created:

visibility:

public

Share or Embed source code

Discover > Sphere Engine API

The brand new service which powers Ideone!

Discover > IDE Widget

Widget for compiling and running the source code in a web browser!

Discover > Sphere Engine API

Discover > IDE Widget

Choose your language