Ideone.com

download

import java.util.Map;
import java.util.HashMap;
 
/**
 * Halfwidth and Fullwidth Character Normalization for CJK
 * http://s...content-available-to-author-only...s.asia
 *
 * See the Unicode Standard 6.0 – Halfwidth and Fullwidth Forms
 * http://u...content-available-to-author-only...e.org/charts/PDF/UFF00.pdf
 *
 * For Chinese, Japanese and Korean, some characters have Unicode mappings to
 * both a halfwidth and a fullwidth version. This code normalizes them
 * to halfwidth for latin characters, numbers and punctuation and fullwidth
 * for everything else.
 * Fine for half/full width normalization but not fully equivalent to NFKC
 * normalization
 */
public class Main{
 
	private static final Map<Character, Character> charCodeMap;
	// Key — Original Character
	// Value — Replacement character
	static {
		charCodeMap = new HashMap<Character, Character>();
		// TO HALFWIDTH CHARACTERS
		// ASCII variants (Latin Symbols, Punctuation, Numbers, and Alphabet)
		for (char key = '\uff01'; key <= '\uff5e'; key++) {
			char value = (char) (key - '\ufee0');
			charCodeMap.put(key, value);
		}
		// Brackets
		charCodeMap.put('\uff5f', '\u2985'); // left white parenthesis
		charCodeMap.put('\uff60', '\u2986'); // right white parenthesis
		// Symbol Variants
		charCodeMap.put('\uffe0', '\u00a2'); // Cent sign
		charCodeMap.put('\uffe1', '\u00a3'); // Pound sign
		charCodeMap.put('\uffe2', '\u00ac'); // Not sign
		charCodeMap.put('\uffe3', '\u00af'); // Macron
		charCodeMap.put('\uffe4', '\u00a6'); // Broken Bar
		charCodeMap.put('\uffe5', '\u00a5'); // Yen sign
		charCodeMap.put('\uffe6', '\u20a9'); // Won sign
		// Space (strictly speaking not listed in Unicode 6.0 Halfwidth and
		// Fullwidth forms but including here as the ideographic space can
		// cause issues)
		charCodeMap.put('\u3000', '\u0020'); // SPACE
		// TO FULLWIDTH CHARACTERS
		// CJK punctuation
		charCodeMap.put('\uff61', '\u3002'); // ideographic full stop
		charCodeMap.put('\uff62', '\u300c'); // left corner bracket
		charCodeMap.put('\uff63', '\u300d'); // right corner bracket
		charCodeMap.put('\uff64', '\u3001'); // ideographic comma
		// Katakana variants
		charCodeMap.put('\uff65', '\u30fb'); // Middle Dot
		charCodeMap.put('\uff66', '\u30f2'); // Wo
		charCodeMap.put('\uff67', '\u30a1'); // A small
		charCodeMap.put('\uff68', '\u30a3'); // I small
		charCodeMap.put('\uff69', '\u30a5'); // U small
		charCodeMap.put('\uff6a', '\u30a7'); // E small
		charCodeMap.put('\uff6b', '\u30a9'); // O small
		charCodeMap.put('\uff6c', '\u30e3'); // Ya small
		charCodeMap.put('\uff6d', '\u30e5'); // Yu small
		charCodeMap.put('\uff6e', '\u30e7'); // Yo small
		charCodeMap.put('\uff6f', '\u30c3'); // Tsu small
		charCodeMap.put('\uff70', '\u30fc'); // Prolonged Sound Mark
		charCodeMap.put('\uff71', '\u30a2'); // A
		charCodeMap.put('\uff72', '\u30a4'); // I
		charCodeMap.put('\uff73', '\u30a6'); // U
		charCodeMap.put('\uff74', '\u30a8'); // E
		charCodeMap.put('\uff75', '\u30aa'); // O
		charCodeMap.put('\uff76', '\u30ab'); // Ka
		charCodeMap.put('\uff77', '\u30ad'); // Ki
		charCodeMap.put('\uff78', '\u30af'); // Ku
		charCodeMap.put('\uff79', '\u30b1'); // Ke
		charCodeMap.put('\uff7a', '\u30b3'); // Ko
		charCodeMap.put('\uff7b', '\u30b5'); // Sa
		charCodeMap.put('\uff7c', '\u30b7'); // Shi
		charCodeMap.put('\uff7d', '\u30b9'); // Su
		charCodeMap.put('\uff7e', '\u30bb'); // Se
		charCodeMap.put('\uff7f', '\u30bd'); // So
		charCodeMap.put('\uff80', '\u30bf'); // Ta
		charCodeMap.put('\uff81', '\u30c1'); // Chi
		charCodeMap.put('\uff82', '\u30c4'); // Tsu
		charCodeMap.put('\uff83', '\u30c6'); // Te
		charCodeMap.put('\uff84', '\u30c8'); // To
		charCodeMap.put('\uff85', '\u30ca'); // Na
		charCodeMap.put('\uff86', '\u30cb'); // Ni
		charCodeMap.put('\uff87', '\u30cc'); // Nu
		charCodeMap.put('\uff88', '\u30cd'); // Ne
		charCodeMap.put('\uff89', '\u30ce'); // No
		charCodeMap.put('\uff8a', '\u30cf'); // Ha
		charCodeMap.put('\uff8b', '\u30d2'); // Hi
		charCodeMap.put('\uff8c', '\u30d5'); // Hu
		charCodeMap.put('\uff8d', '\u30d8'); // He
		charCodeMap.put('\uff8e', '\u30db'); // Ho
		charCodeMap.put('\uff8f', '\u30de'); // Ma
		charCodeMap.put('\uff90', '\u30df'); // Mi
		charCodeMap.put('\uff91', '\u30e0'); // Mu
		charCodeMap.put('\uff92', '\u30e1'); // Me
		charCodeMap.put('\uff93', '\u30e2'); // Mo
		charCodeMap.put('\uff94', '\u30e4'); // Ya
		charCodeMap.put('\uff95', '\u30e6'); // Yu
		charCodeMap.put('\uff96', '\u30e8'); // Yo
		charCodeMap.put('\uff97', '\u30e9'); // Ra
		charCodeMap.put('\uff98', '\u30ea'); // Ri
		charCodeMap.put('\uff99', '\u30eb'); // Ru
		charCodeMap.put('\uff9a', '\u30ec'); // Re
		charCodeMap.put('\uff9b', '\u30ed'); // Ro
		charCodeMap.put('\uff9c', '\u30ef'); // Wa
		charCodeMap.put('\uff9d', '\u30f3'); // N
		charCodeMap.put('\uff9e', '\u3099'); // Voiced Sound Mark
		charCodeMap.put('\uff9f', '\u309a'); // Semi-Voiced Sound Mark
		// Hangul variants
		charCodeMap.put('\uffa0', '\u3164'); // Hangul Filler
		// Hangul First Range
		// KIYEOK to HIEUH
		for (char key = '\uffa1'; key <= '\uffbe'; key++) {
			char value = (char) (key - '\uce70');
			charCodeMap.put(key, value);
		}
		// Hangul Second Range
		// A to E
		for (char key = '\uffc2'; key <= '\uffc7'; key++) {
			char value = (char) (key - '\uce73');
			charCodeMap.put(key, value);
		}
		// Hangul Third Range
		// YEO to OE
		for (char key = '\uffca'; key <= '\uffcf'; key++) {
			char value = (char) (key - '\uce75');
			charCodeMap.put(key, value);
		}
		// Hangul Fourth Range
		// YO to YU
		for (char key = '\uffd2'; key <= '\uffd7'; key++) {
			char value = (char) (key - '\uce77');
			charCodeMap.put(key, value);
		}
		// More Hangul variants
		charCodeMap.put('\uffda', '\u3161'); // Hangul EU
		charCodeMap.put('\uffdb', '\u3162'); // Hangul YI
		charCodeMap.put('\uffdc', '\u3163'); // Hangul I
		// Symbol Variants
		charCodeMap.put('\uffe8', '\u2502'); // Forms Light Vertical
		charCodeMap.put('\uffe9', '\u2190'); // Leftwards Arrow
		charCodeMap.put('\uffea', '\u2191'); // Upwards Arrow
		charCodeMap.put('\uffeb', '\u2192'); // Rightwards Arrow
		charCodeMap.put('\uffec', '\u2193'); // Downwards Arrow
		charCodeMap.put('\uffed', '\u25a0'); // Black Square
		charCodeMap.put('\uffee', '\u25cb'); // White Circle
	}
 
	/**
	 * Takes an unnormalized (Halfwidth/Fullwidth) and outputs a normalized string
	 */
	public static void main(String[] args) {
		String[] unnormalized = {"Ａｓｉａ", "アジア", "ｱｼﾞｱ"};
		for(int j=0; j<unnormalized.length; j++){
			System.out.println("Unnormalized:\t " + unnormalized[j]);
			char[] buffer = unnormalized[j].toCharArray();
			int bufferLen = buffer.length;
			for (int i = 0; i < bufferLen; i++) {
				if (charCodeMap.containsKey(buffer[i])) {
					buffer[i] = charCodeMap.get(buffer[i]);
				}
			}
			System.out.println("Normalized:\t " + new String(buffer));
		}
	}
 
}

aW1wb3J0IGphdmEudXRpbC5NYXA7CmltcG9ydCBqYXZhLnV0aWwuSGFzaE1hcDsKCi8qKgogKiBIYWxmd2lkdGggYW5kIEZ1bGx3aWR0aCBDaGFyYWN0ZXIgTm9ybWFsaXphdGlvbiBmb3IgQ0pLCiAqIGh0dHA6Ly9zLi4uY29udGVudC1hdmFpbGFibGUtdG8tYXV0aG9yLW9ubHkuLi5zLmFzaWEKICoKICogU2VlIHRoZSBVbmljb2RlIFN0YW5kYXJkIDYuMCDigJMgSGFsZndpZHRoIGFuZCBGdWxsd2lkdGggRm9ybXMKICogaHR0cDovL3UuLi5jb250ZW50LWF2YWlsYWJsZS10by1hdXRob3Itb25seS4uLmUub3JnL2NoYXJ0cy9QREYvVUZGMDAucGRmCiAqCiAqIEZvciBDaGluZXNlLCBKYXBhbmVzZSBhbmQgS29yZWFuLCBzb21lIGNoYXJhY3RlcnMgaGF2ZSBVbmljb2RlIG1hcHBpbmdzIHRvCiAqIGJvdGggYSBoYWxmd2lkdGggYW5kIGEgZnVsbHdpZHRoIHZlcnNpb24uIFRoaXMgY29kZSBub3JtYWxpemVzIHRoZW0KICogdG8gaGFsZndpZHRoIGZvciBsYXRpbiBjaGFyYWN0ZXJzLCBudW1iZXJzIGFuZCBwdW5jdHVhdGlvbiBhbmQgZnVsbHdpZHRoCiAqIGZvciBldmVyeXRoaW5nIGVsc2UuCiAqIEZpbmUgZm9yIGhhbGYvZnVsbCB3aWR0aCBub3JtYWxpemF0aW9uIGJ1dCBub3QgZnVsbHkgZXF1aXZhbGVudCB0byBORktDCiAqIG5vcm1hbGl6YXRpb24KICovCnB1YmxpYyBjbGFzcyBNYWluewoJCglwcml2YXRlIHN0YXRpYyBmaW5hbCBNYXA8Q2hhcmFjdGVyLCBDaGFyYWN0ZXI+IGNoYXJDb2RlTWFwOwoJLy8gS2V5IOKAlCBPcmlnaW5hbCBDaGFyYWN0ZXIKCS8vIFZhbHVlIOKAlCBSZXBsYWNlbWVudCBjaGFyYWN0ZXIKCXN0YXRpYyB7CgkJY2hhckNvZGVNYXAgPSBuZXcgSGFzaE1hcDxDaGFyYWN0ZXIsIENoYXJhY3Rlcj4oKTsKCQkvLyBUTyBIQUxGV0lEVEggQ0hBUkFDVEVSUwoJCS8vIEFTQ0lJIHZhcmlhbnRzIChMYXRpbiBTeW1ib2xzLCBQdW5jdHVhdGlvbiwgTnVtYmVycywgYW5kIEFscGhhYmV0KQoJCWZvciAoY2hhciBrZXkgPSAnXHVmZjAxJzsga2V5IDw9ICdcdWZmNWUnOyBrZXkrKykgewoJCQljaGFyIHZhbHVlID0gKGNoYXIpIChrZXkgLSAnXHVmZWUwJyk7CgkJCWNoYXJDb2RlTWFwLnB1dChrZXksIHZhbHVlKTsKCQl9CgkJLy8gQnJhY2tldHMKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY1ZicsICdcdTI5ODUnKTsgLy8gbGVmdCB3aGl0ZSBwYXJlbnRoZXNpcwoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjYwJywgJ1x1Mjk4NicpOyAvLyByaWdodCB3aGl0ZSBwYXJlbnRoZXNpcwoJCS8vIFN5bWJvbCBWYXJpYW50cwoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZmUwJywgJ1x1MDBhMicpOyAvLyBDZW50IHNpZ24KCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmZlMScsICdcdTAwYTMnKTsgLy8gUG91bmQgc2lnbgoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZmUyJywgJ1x1MDBhYycpOyAvLyBOb3Qgc2lnbgoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZmUzJywgJ1x1MDBhZicpOyAvLyBNYWNyb24KCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmZlNCcsICdcdTAwYTYnKTsgLy8gQnJva2VuIEJhcgoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZmU1JywgJ1x1MDBhNScpOyAvLyBZZW4gc2lnbgoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZmU2JywgJ1x1MjBhOScpOyAvLyBXb24gc2lnbgoJCS8vIFNwYWNlIChzdHJpY3RseSBzcGVha2luZyBub3QgbGlzdGVkIGluIFVuaWNvZGUgNi4wIEhhbGZ3aWR0aCBhbmQKCQkvLyBGdWxsd2lkdGggZm9ybXMgYnV0IGluY2x1ZGluZyBoZXJlIGFzIHRoZSBpZGVvZ3JhcGhpYyBzcGFjZSBjYW4KCQkvLyBjYXVzZSBpc3N1ZXMpCgkJY2hhckNvZGVNYXAucHV0KCdcdTMwMDAnLCAnXHUwMDIwJyk7IC8vIFNQQUNFCgkJLy8gVE8gRlVMTFdJRFRIIENIQVJBQ1RFUlMKCQkvLyBDSksgcHVuY3R1YXRpb24KCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY2MScsICdcdTMwMDInKTsgLy8gaWRlb2dyYXBoaWMgZnVsbCBzdG9wCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmNjInLCAnXHUzMDBjJyk7IC8vIGxlZnQgY29ybmVyIGJyYWNrZXQKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY2MycsICdcdTMwMGQnKTsgLy8gcmlnaHQgY29ybmVyIGJyYWNrZXQKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY2NCcsICdcdTMwMDEnKTsgLy8gaWRlb2dyYXBoaWMgY29tbWEKCQkvLyBLYXRha2FuYSB2YXJpYW50cwoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjY1JywgJ1x1MzBmYicpOyAvLyBNaWRkbGUgRG90CgkJY2hhckNvZGVNYXAucHV0KCdcdWZmNjYnLCAnXHUzMGYyJyk7IC8vIFdvCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmNjcnLCAnXHUzMGExJyk7IC8vIEEgc21hbGwKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY2OCcsICdcdTMwYTMnKTsgLy8gSSBzbWFsbAoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjY5JywgJ1x1MzBhNScpOyAvLyBVIHNtYWxsCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmNmEnLCAnXHUzMGE3Jyk7IC8vIEUgc21hbGwKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY2YicsICdcdTMwYTknKTsgLy8gTyBzbWFsbAoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjZjJywgJ1x1MzBlMycpOyAvLyBZYSBzbWFsbAoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjZkJywgJ1x1MzBlNScpOyAvLyBZdSBzbWFsbAoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjZlJywgJ1x1MzBlNycpOyAvLyBZbyBzbWFsbAoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjZmJywgJ1x1MzBjMycpOyAvLyBUc3Ugc21hbGwKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY3MCcsICdcdTMwZmMnKTsgLy8gUHJvbG9uZ2VkIFNvdW5kIE1hcmsKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY3MScsICdcdTMwYTInKTsgLy8gQQoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjcyJywgJ1x1MzBhNCcpOyAvLyBJCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmNzMnLCAnXHUzMGE2Jyk7IC8vIFUKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY3NCcsICdcdTMwYTgnKTsgLy8gRQoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjc1JywgJ1x1MzBhYScpOyAvLyBPCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmNzYnLCAnXHUzMGFiJyk7IC8vIEthCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmNzcnLCAnXHUzMGFkJyk7IC8vIEtpCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmNzgnLCAnXHUzMGFmJyk7IC8vIEt1CgkJY2hhckNvZGVNYXAucHV0KCdcdWZmNzknLCAnXHUzMGIxJyk7IC8vIEtlCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmN2EnLCAnXHUzMGIzJyk7IC8vIEtvCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmN2InLCAnXHUzMGI1Jyk7IC8vIFNhCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmN2MnLCAnXHUzMGI3Jyk7IC8vIFNoaQoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjdkJywgJ1x1MzBiOScpOyAvLyBTdQoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjdlJywgJ1x1MzBiYicpOyAvLyBTZQoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjdmJywgJ1x1MzBiZCcpOyAvLyBTbwoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjgwJywgJ1x1MzBiZicpOyAvLyBUYQoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZjgxJywgJ1x1MzBjMScpOyAvLyBDaGkKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY4MicsICdcdTMwYzQnKTsgLy8gVHN1CgkJY2hhckNvZGVNYXAucHV0KCdcdWZmODMnLCAnXHUzMGM2Jyk7IC8vIFRlCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmODQnLCAnXHUzMGM4Jyk7IC8vIFRvCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmODUnLCAnXHUzMGNhJyk7IC8vIE5hCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmODYnLCAnXHUzMGNiJyk7IC8vIE5pCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmODcnLCAnXHUzMGNjJyk7IC8vIE51CgkJY2hhckNvZGVNYXAucHV0KCdcdWZmODgnLCAnXHUzMGNkJyk7IC8vIE5lCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmODknLCAnXHUzMGNlJyk7IC8vIE5vCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOGEnLCAnXHUzMGNmJyk7IC8vIEhhCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOGInLCAnXHUzMGQyJyk7IC8vIEhpCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOGMnLCAnXHUzMGQ1Jyk7IC8vIEh1CgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOGQnLCAnXHUzMGQ4Jyk7IC8vIEhlCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOGUnLCAnXHUzMGRiJyk7IC8vIEhvCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOGYnLCAnXHUzMGRlJyk7IC8vIE1hCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOTAnLCAnXHUzMGRmJyk7IC8vIE1pCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOTEnLCAnXHUzMGUwJyk7IC8vIE11CgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOTInLCAnXHUzMGUxJyk7IC8vIE1lCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOTMnLCAnXHUzMGUyJyk7IC8vIE1vCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOTQnLCAnXHUzMGU0Jyk7IC8vIFlhCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOTUnLCAnXHUzMGU2Jyk7IC8vIFl1CgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOTYnLCAnXHUzMGU4Jyk7IC8vIFlvCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOTcnLCAnXHUzMGU5Jyk7IC8vIFJhCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOTgnLCAnXHUzMGVhJyk7IC8vIFJpCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOTknLCAnXHUzMGViJyk7IC8vIFJ1CgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOWEnLCAnXHUzMGVjJyk7IC8vIFJlCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOWInLCAnXHUzMGVkJyk7IC8vIFJvCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOWMnLCAnXHUzMGVmJyk7IC8vIFdhCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmOWQnLCAnXHUzMGYzJyk7IC8vIE4KCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY5ZScsICdcdTMwOTknKTsgLy8gVm9pY2VkIFNvdW5kIE1hcmsKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmY5ZicsICdcdTMwOWEnKTsgLy8gU2VtaS1Wb2ljZWQgU291bmQgTWFyawoJCS8vIEhhbmd1bCB2YXJpYW50cwoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZmEwJywgJ1x1MzE2NCcpOyAvLyBIYW5ndWwgRmlsbGVyCgkJLy8gSGFuZ3VsIEZpcnN0IFJhbmdlCgkJLy8gS0lZRU9LIHRvIEhJRVVICgkJZm9yIChjaGFyIGtleSA9ICdcdWZmYTEnOyBrZXkgPD0gJ1x1ZmZiZSc7IGtleSsrKSB7CgkJCWNoYXIgdmFsdWUgPSAoY2hhcikgKGtleSAtICdcdWNlNzAnKTsKCQkJY2hhckNvZGVNYXAucHV0KGtleSwgdmFsdWUpOwoJCX0KCQkvLyBIYW5ndWwgU2Vjb25kIFJhbmdlCgkJLy8gQSB0byBFCgkJZm9yIChjaGFyIGtleSA9ICdcdWZmYzInOyBrZXkgPD0gJ1x1ZmZjNyc7IGtleSsrKSB7CgkJCWNoYXIgdmFsdWUgPSAoY2hhcikgKGtleSAtICdcdWNlNzMnKTsKCQkJY2hhckNvZGVNYXAucHV0KGtleSwgdmFsdWUpOwoJCX0KCQkvLyBIYW5ndWwgVGhpcmQgUmFuZ2UKCQkvLyBZRU8gdG8gT0UKCQlmb3IgKGNoYXIga2V5ID0gJ1x1ZmZjYSc7IGtleSA8PSAnXHVmZmNmJzsga2V5KyspIHsKCQkJY2hhciB2YWx1ZSA9IChjaGFyKSAoa2V5IC0gJ1x1Y2U3NScpOwoJCQljaGFyQ29kZU1hcC5wdXQoa2V5LCB2YWx1ZSk7CgkJfQoJCS8vIEhhbmd1bCBGb3VydGggUmFuZ2UKCQkvLyBZTyB0byBZVQoJCWZvciAoY2hhciBrZXkgPSAnXHVmZmQyJzsga2V5IDw9ICdcdWZmZDcnOyBrZXkrKykgewoJCQljaGFyIHZhbHVlID0gKGNoYXIpIChrZXkgLSAnXHVjZTc3Jyk7CgkJCWNoYXJDb2RlTWFwLnB1dChrZXksIHZhbHVlKTsKCQl9CgkJLy8gTW9yZSBIYW5ndWwgdmFyaWFudHMKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmZkYScsICdcdTMxNjEnKTsgLy8gSGFuZ3VsIEVVCgkJY2hhckNvZGVNYXAucHV0KCdcdWZmZGInLCAnXHUzMTYyJyk7IC8vIEhhbmd1bCBZSQoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZmRjJywgJ1x1MzE2MycpOyAvLyBIYW5ndWwgSQoJCS8vIFN5bWJvbCBWYXJpYW50cwoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZmU4JywgJ1x1MjUwMicpOyAvLyBGb3JtcyBMaWdodCBWZXJ0aWNhbAoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZmU5JywgJ1x1MjE5MCcpOyAvLyBMZWZ0d2FyZHMgQXJyb3cKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmZlYScsICdcdTIxOTEnKTsgLy8gVXB3YXJkcyBBcnJvdwoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZmViJywgJ1x1MjE5MicpOyAvLyBSaWdodHdhcmRzIEFycm93CgkJY2hhckNvZGVNYXAucHV0KCdcdWZmZWMnLCAnXHUyMTkzJyk7IC8vIERvd253YXJkcyBBcnJvdwoJCWNoYXJDb2RlTWFwLnB1dCgnXHVmZmVkJywgJ1x1MjVhMCcpOyAvLyBCbGFjayBTcXVhcmUKCQljaGFyQ29kZU1hcC5wdXQoJ1x1ZmZlZScsICdcdTI1Y2InKTsgLy8gV2hpdGUgQ2lyY2xlCgl9CgkKCS8qKgoJICogVGFrZXMgYW4gdW5ub3JtYWxpemVkIChIYWxmd2lkdGgvRnVsbHdpZHRoKSBhbmQgb3V0cHV0cyBhIG5vcm1hbGl6ZWQgc3RyaW5nCgkgKi8KCXB1YmxpYyBzdGF0aWMgdm9pZCBtYWluKFN0cmluZ1tdIGFyZ3MpIHsKCQlTdHJpbmdbXSB1bm5vcm1hbGl6ZWQgPSB7Iu+8oe+9k++9ie+9gSIsICLjgqLjgrjjgqIiLCAi772x7728776e772xIn07CgkJZm9yKGludCBqPTA7IGo8dW5ub3JtYWxpemVkLmxlbmd0aDsgaisrKXsKCQkJU3lzdGVtLm91dC5wcmludGxuKCJVbm5vcm1hbGl6ZWQ6XHQgIiArIHVubm9ybWFsaXplZFtqXSk7CgkJCWNoYXJbXSBidWZmZXIgPSB1bm5vcm1hbGl6ZWRbal0udG9DaGFyQXJyYXkoKTsKCQkJaW50IGJ1ZmZlckxlbiA9IGJ1ZmZlci5sZW5ndGg7CgkJCWZvciAoaW50IGkgPSAwOyBpIDwgYnVmZmVyTGVuOyBpKyspIHsKCQkJCWlmIChjaGFyQ29kZU1hcC5jb250YWluc0tleShidWZmZXJbaV0pKSB7CgkJCQkJYnVmZmVyW2ldID0gY2hhckNvZGVNYXAuZ2V0KGJ1ZmZlcltpXSk7CgkJCQl9CgkJCX0KCQkJU3lzdGVtLm91dC5wcmludGxuKCJOb3JtYWxpemVkOlx0ICIgKyBuZXcgU3RyaW5nKGJ1ZmZlcikpOwoJCX0KCX0KCQp9

Success #stdin #stdout 0.03s 245632KB

stdin

Standard input is empty

stdout

Unnormalized:	 Ａｓｉａ
Normalized:	 Asia
Unnormalized:	 アジア
Normalized:	 アジア
Unnormalized:	 ｱｼﾞｱ
Normalized:	 アジア

https://ideone.com/7iAId

language:

Java (HotSpot 12)

created:

visibility:

public

Share or Embed source code

Discover > Sphere Engine API

The brand new service which powers Ideone!

Discover > IDE Widget

Widget for compiling and running the source code in a web browser!

Discover > Sphere Engine API

Discover > IDE Widget

Choose your language