# Гласные. Их упорядочивать не нужно (они одинаковой длины, внезапно).
VOWELS = ["а", "е", "и", "о", "у", "ы", "э", "ю", "я"]
# Для генерации ADJECTIVAL (ADJECTIVE и PARTICIPLE + ADJECTIVE).
# Просто склеиваем все возможные варианты PARTICIPLE + ADJECTIVE, а потом добавляем к ним чистые ADJECTIVE.
def generate_adjectival():
adjective_suffixes = _ADJECTIVE["2"]
mix_1 = []
for s1 in _PARTICIPLE["1"]:
for s2 in adjective_suffixes:
mix_1.append(s1 + s2)
mix_2 = []
for s1 in _PARTICIPLE["2"]:
for s2 in adjective_suffixes:
mix_2.append(s1 + s2)
mix_2 += adjective_suffixes
return {
"1": mix_1,
"2": mix_2
}
# Для сортировки окончаний по длине, по убывающей, чтобы потом удобно было искать.
def sort_suffixes(constants_list):
for const in constants_list:
const["1"].sort(key=len, reverse=True)
const["2"].sort(key=len, reverse=True)
return
# У всех есть первые группы, иногда - пустые. Так мы избегаем проверок на то, есть ли свойство.
PERFECTIVE_GERUND = {
"1": ["в", "вши", "вшись"],
"2": ["ив", "ивши", "ившись", "ыв", "ывши", "ывшись"]
}
# Не используется в чистом виде, только в генерируемом ADJECTIVAL.
_ADJECTIVE = {
"1": [],
"2": ["ее", "ие", "ые", "ое", "ими", "ыми", "ей", "ий", "ый", "ой", "ем", "им", "ым", "ом", "его", "ого", "ему", "ому", "их", "ых", "ую", "юю", "ая", "яя", "ою", "ею"]
}
# Не используется в чистом виде, только в генерируемом ADJECTIVAL.
_PARTICIPLE = {
"1": ["ем", "нн", "вш", "ющ", "щ"],
"2": ["ивш", "ывш", "ующ"]
}
REFLEXIVE = {
"1": [],
"2": ["ся", "сь"]
}
VERB = {
"1": ["ла", "на", "ете", "йте", "ли", "й", "л", "ем", "н", "ло", "но", "ет", "ют", "ны", "ть", "ешь", "нно"],
"2": ["ила", "ыла", "ена", "ейте", "уйте", "ите", "или", "ыли", "ей", "уй", "ил", "ыл", "им", "ым", "ен", "ило", "ыло", "ено", "ят", "ует", "уют", "ит", "ыт", "ены", "ить", "ыть", "ишь", "ую", "ю"]
}
NOUN = {
"1": [],
"2": ["а", "ев", "ов", "ие", "ье", "е", "иями", "ями", "ами", "еи", "ии", "и", "ией", "ей", "ой", "ий", "й", "иям", "ям", "ием", "ем", "ам", "ом", "о", "у", "ах", "иях", "ях", "ы", "ь", "ию", "ью", "ю", "ия", "ья", "я"]
}
SUPERLATIVE = {
"1": [],
"2": ["ейш", "ейше"]
}
DERIVATIONAL = {
"1": [],
"2": ["ост", "ость"]
}
# Генерируем только здесь, все части уже объявлены выше.
ADJECTIVAL = generate_adjectival()
# Нормализуем слово, чтобы не возникло косяков.
def normalize(word):
word = word.lower()
word = word.replace("ё", "е")
return word
# Находим позицию после первого сочетания "гласная-согласная" в строке.
# V - vowel, C - consonant.
def find_index_after_VC(string):
v_pos = 0 # Индекс гласной в строке.
c_pos = 0 # Индекс согласной в строке.
for i, c in enumerate(string):
if (c in VOWELS):
v_pos = i
else:
c_pos = i
if (v_pos - c_pos == -1):
return c_pos + 1
return 0
# Разбиваем слово на префикс и RV-форму.
def split_rv(word):
for c in word:
if c in VOWELS:
index = word.find(c) + 1
# Разбиваем слово по позиции после первой гласной.
return [word[0:index], word[index:]]
# Возвращаем пустое RV, если гласных не нашлось.
return [word, ""]
# Разбивка RV на префикс и R2-форму.
def split_r2(rv):
if (rv[0] not in VOWELS):
# Если первая в RV - согласная, значит, в полном слове это была бы последовательность "гласная-согласная".
r1 = rv[1:]
else:
# Иначе - ищем первую такую последовательность. В обоих случаях получаем R1.
ind = find_index_after_VC(rv)
r1 = rv[ind:]
# Ищем вторую такую последовательность, получаем R2.
ind = find_index_after_VC(r1)
r2 = r1[ind:]
# Откладываем длину R2 с конца (делаем её отрицательной).
to = len(r2) * -1
# Делим RV на префикс до позиции после второй последовательности "Г-С" и после этой позиции.
return [rv[0:to], rv[to:]]
# Функция для удаления первого найденного среди `suffixes` окончания.
def drop_suffix(word, suffixes):
for suffix in suffixes["1"]:
to = len(suffix) * -1
# В первой группе - дополнительная проверка на предшествующую "а" или "я".
if (word.endswith(suffix) and (word[to-1:to] == "а" or word[to-1:to] == "я")):
return word[0:to]
for suffix in suffixes["2"]:
to = len(suffix) * -1
if (word.endswith(suffix)):
return word[0:to]
# Если никаких окончаний не удалили, возвращаем пришедшую строку.
return word
# Шаг первый.
def step_1(rv):
# Сохраняем форму, чтобы проверить, изменилась ли она после отбрасывания окончания, или ничего не отбросили.
verification = rv
# Пробуем отбросить Perfective Gerund.
rv = drop_suffix(rv, PERFECTIVE_GERUND)
if (rv != verification):
# Если это удалось - возвращаем урезанное RV.
return rv
else:
# Если нет - отбрасываем Reflexive, если есть.
rv = drop_suffix(rv, REFLEXIVE)
# Снова сохраняем для сверки.
verification = rv
# Пробуем удалить любое из перечисленных окончаний.
for suffixes in [ADJECTIVAL, VERB, NOUN]:
rv = drop_suffix(rv, suffixes)
if (rv != verification):
# Как только удалось - возвращаем усечённую форму RV.
return rv
# Если снова ничего не удалилось, возвращаем то же, что и пришло сюда.
return rv
# Шаг второй, простой. Удаляем последнюю букву, это это "и".
def step_2(rv):
if (rv[-1] == "и"):
return rv[0:-1]
else:
return rv
# Шаг третий, отбрасываем Derivational у формы R2. Тоже простой.
def step_3(r2):
r2 = drop_suffix(r2, DERIVATIONAL)
return r2
# Шаг четвёртый.
def step_4(rv):
# Пробуем выкинуть Superlative.
rv = drop_suffix(rv, SUPERLATIVE)
# Затем, если в конце удвоенная "н" или мягкий знак, удаляем последнюю букву.
if (rv[-2:] == "нн" or rv[-1] == "ь"):
rv = rv[:-1]
return rv
# Аргумент dev - для вывода отладочной информации.
def stemmer(word, dev=False):
word = normalize(word)
# Буквы до первой гласной включительно сохраняются в base, форма RV - в соответсвующую переменную.
base, rv = split_rv(word)
# Проверяем, не пусто ли RV.
if (rv == ""):
return base
dev and print("Before steps: ", rv)
rv = step_1(rv)
dev and print("After step 1: ", rv)
rv = step_2(rv)
dev and print("After step 2: ", rv)
# Ещё разок проверяем.
if (rv == ""):
return base
# Делим RV на сохраняемый префикс и r2.
prefix, r2 = split_r2(rv)
r2 = step_3(r2)
rv = prefix + r2
dev and print("After step 3: ", rv)
rv = step_4(rv)
dev and print("After step 4: ", rv)
return base + rv
# Запускаем сортировку окончаний.
sort_suffixes([
PERFECTIVE_GERUND,
ADJECTIVAL,
REFLEXIVE,
VERB,
NOUN,
SUPERLATIVE,
DERIVATIONAL
])
while True:
w = input().strip()
if (w == ""):
break
print(stemmer(w))
# Гласные. Их упорядочивать не нужно (они одинаковой длины, внезапно).
VOWELS = ["а", "е", "и", "о", "у", "ы", "э", "ю", "я"]


# Для генерации ADJECTIVAL (ADJECTIVE и PARTICIPLE + ADJECTIVE).
# Просто склеиваем все возможные варианты PARTICIPLE + ADJECTIVE, а потом добавляем к ним чистые ADJECTIVE.
def generate_adjectival():
	adjective_suffixes = _ADJECTIVE["2"]
	mix_1 = []
	for s1 in _PARTICIPLE["1"]:
		for s2 in adjective_suffixes:
			mix_1.append(s1 + s2)
	mix_2 = []
	for s1 in _PARTICIPLE["2"]:
		for s2 in adjective_suffixes:
			mix_2.append(s1 + s2)
	mix_2 += adjective_suffixes
	return {
		"1": mix_1,
		"2": mix_2
	}

# Для сортировки окончаний по длине, по убывающей, чтобы потом удобно было искать.
def sort_suffixes(constants_list):
	for const in constants_list:
		const["1"].sort(key=len, reverse=True)
		const["2"].sort(key=len, reverse=True)
	return


# У всех есть первые группы, иногда - пустые. Так мы избегаем проверок на то, есть ли свойство.

PERFECTIVE_GERUND = {
	"1": ["в", "вши", "вшись"],
	"2": ["ив", "ивши", "ившись", "ыв", "ывши", "ывшись"]
}

# Не используется в чистом виде, только в генерируемом ADJECTIVAL.
_ADJECTIVE = {
	"1": [],
	"2": ["ее", "ие", "ые", "ое", "ими", "ыми", "ей", "ий", "ый", "ой", "ем", "им", "ым", "ом", "его", "ого", "ему", "ому", "их", "ых", "ую", "юю", "ая", "яя", "ою", "ею"]
}

# Не используется в чистом виде, только в генерируемом ADJECTIVAL.
_PARTICIPLE = {
	"1": ["ем", "нн", "вш", "ющ", "щ"],
	"2": ["ивш", "ывш", "ующ"]
}

REFLEXIVE = {
	"1": [],
	"2": ["ся", "сь"]
}

VERB = {
	"1": ["ла", "на", "ете", "йте", "ли", "й", "л", "ем", "н", "ло", "но", "ет", "ют", "ны", "ть", "ешь", "нно"],
	"2": ["ила", "ыла", "ена", "ейте", "уйте", "ите", "или", "ыли", "ей", "уй", "ил", "ыл", "им", "ым", "ен", "ило", "ыло", "ено", "ят", "ует", "уют", "ит", "ыт", "ены", "ить", "ыть", "ишь", "ую", "ю"]
}

NOUN = {
	"1": [],
	"2": ["а", "ев", "ов", "ие", "ье", "е", "иями", "ями", "ами", "еи", "ии", "и", "ией", "ей", "ой", "ий", "й", "иям", "ям", "ием", "ем", "ам", "ом", "о", "у", "ах", "иях", "ях", "ы", "ь", "ию", "ью", "ю", "ия", "ья", "я"]
}

SUPERLATIVE = {
	"1": [],
	"2": ["ейш", "ейше"]
}

DERIVATIONAL = {
	"1": [],
	"2": ["ост", "ость"]
}

# Генерируем только здесь, все части уже объявлены выше.
ADJECTIVAL = generate_adjectival()


# Нормализуем слово, чтобы не возникло косяков.
def normalize(word):
	word = word.lower()
	word = word.replace("ё", "е")
	return word

# Находим позицию после первого сочетания "гласная-согласная" в строке.
# V - vowel, C - consonant.
def find_index_after_VC(string):
	v_pos = 0 # Индекс гласной в строке.
	c_pos = 0 # Индекс согласной в строке.
	for i, c in enumerate(string):
		if (c in VOWELS):
			v_pos = i
		else:
			c_pos = i
		if (v_pos - c_pos == -1):
			return c_pos + 1
	return 0

# Разбиваем слово на префикс и RV-форму.
def split_rv(word):
	for c in word:
		if c in VOWELS:
			index = word.find(c) + 1
			# Разбиваем слово по позиции после первой гласной.
			return [word[0:index], word[index:]]
	# Возвращаем пустое RV, если гласных не нашлось.
	return [word, ""]

# Разбивка RV на префикс и R2-форму.
def split_r2(rv):
	if (rv[0] not in VOWELS):
		# Если первая в RV - согласная, значит, в полном слове это была бы последовательность "гласная-согласная".
		r1 = rv[1:]
	else:
		# Иначе - ищем первую такую последовательность. В обоих случаях получаем R1.
		ind = find_index_after_VC(rv)
		r1 = rv[ind:]
	# Ищем вторую такую последовательность, получаем R2.
	ind = find_index_after_VC(r1)
	r2 = r1[ind:]
	# Откладываем длину R2 с конца (делаем её отрицательной).
	to = len(r2) * -1
	# Делим RV на префикс до позиции после второй последовательности "Г-С" и после этой позиции.
	return [rv[0:to], rv[to:]]

# Функция для удаления первого найденного среди `suffixes` окончания.
def drop_suffix(word, suffixes):
	for suffix in suffixes["1"]:
		to = len(suffix) * -1
		# В первой группе - дополнительная проверка на предшествующую "а" или "я".
		if (word.endswith(suffix) and (word[to-1:to] == "а" or word[to-1:to] == "я")):
			return word[0:to]
	for suffix in suffixes["2"]:
		to = len(suffix) * -1
		if (word.endswith(suffix)):
			return word[0:to]
	# Если никаких окончаний не удалили, возвращаем пришедшую строку.
	return word


# Шаг первый.
def step_1(rv):
	# Сохраняем форму, чтобы проверить, изменилась ли она после отбрасывания окончания, или ничего не отбросили.
	verification = rv
	# Пробуем отбросить Perfective Gerund.
	rv = drop_suffix(rv, PERFECTIVE_GERUND)
	if (rv != verification):
		# Если это удалось - возвращаем урезанное RV.
		return rv
	else:
		# Если нет - отбрасываем Reflexive, если есть.
		rv = drop_suffix(rv, REFLEXIVE)
		# Снова сохраняем для сверки.
		verification = rv
		# Пробуем удалить любое из перечисленных окончаний.
		for suffixes in [ADJECTIVAL, VERB, NOUN]:
			rv = drop_suffix(rv, suffixes)
			if (rv != verification):
				# Как только удалось - возвращаем усечённую форму RV.
				return rv
	# Если снова ничего не удалилось, возвращаем то же, что и пришло сюда.
	return rv

# Шаг второй, простой. Удаляем последнюю букву, это это "и".
def step_2(rv):
	if (rv[-1] == "и"):
		return rv[0:-1]
	else:
		return rv

# Шаг третий, отбрасываем Derivational у формы R2. Тоже простой.
def step_3(r2):
	r2 = drop_suffix(r2, DERIVATIONAL)
	return r2

# Шаг четвёртый.
def step_4(rv):
	# Пробуем выкинуть Superlative.
	rv = drop_suffix(rv, SUPERLATIVE)
	# Затем, если в конце удвоенная "н" или мягкий знак, удаляем последнюю букву.
	if (rv[-2:] == "нн" or rv[-1] == "ь"):
		rv = rv[:-1]
	return rv


# Аргумент dev - для вывода отладочной информации.
def stemmer(word, dev=False):

	word = normalize(word)

	# Буквы до первой гласной включительно сохраняются в base, форма RV - в соответсвующую переменную.
	base, rv = split_rv(word)

	# Проверяем, не пусто ли RV.
	if (rv == ""):
		return base

	dev and print("Before steps: ", rv)
	rv = step_1(rv)
	dev and print("After step 1: ", rv)
	rv = step_2(rv)
	dev and print("After step 2: ", rv)

	# Ещё разок проверяем.
	if (rv == ""):
		return base

	# Делим RV на сохраняемый префикс и r2.
	prefix, r2 = split_r2(rv)
	r2 = step_3(r2)
	rv = prefix + r2
	dev and print("After step 3: ", rv)

	rv = step_4(rv)
	dev and print("After step 4: ", rv)

	return base + rv


# Запускаем сортировку окончаний.
sort_suffixes([
	PERFECTIVE_GERUND,
	ADJECTIVAL,
	REFLEXIVE,
	VERB,
	NOUN,
	SUPERLATIVE,
	DERIVATIONAL
])


while True:
	w = input().strip()
	if (w == ""):
		break
	print(stemmer(w))
