Ideone.com

download

copy

template <typename T> 
	T reduce2(T v) {
		/* pre: ((short*)&v)[i] < 100 for all i
		 *  post: 
		 *     ((char*)&v)[2i] = ((short*)&v)[i] / 10
		 *     ((char*)&v)[2i + 1] = ((short*)&v)[i] % 10
		 *     
		 *     That is, we split each short in v into its ones and tens digits
		 */
 
		/* t < 100 --> (t * 410) >> 12 == t / 10
		 *			&& (t * 410) < 0x10000
		 * 
		 * For the least order short that's all we need, for the others the
		 * shift doesn't drop the remainder so we mask those out
		 */
		T k = ((v * 410) >> 12) & 0x000F000F000F000Full;
 
		/*
		 * Then just subtract out the tens digit to get the ones digit and
		 * shift them into the right place
		 */
		return (((v - k * 10) << 8) + k);
	}
 
	template <typename T>
	T reduce4(T v) {
		/* pre: ((unsigned*)&v)[i] < 10000 for all i
		 *
		 *  preReduce2: 
		 *     ((short*)&v)[2i] = ((unsigned*)&v)[i] / 100
		 *     ((short*)&v)[2i + 1] = ((unsigned*)&v)[i] % 100
		 *     
		 *     That is, we split each int in v into its one/ten and hundred/thousand 
		 *     digit pairs. Put them into the corresponding short positions and then
		 *     call reduce2 to finish the splitting
		 */
 
		/* This is basically the same as reduce2 with different constants
		 */
		T k = ((v * 10486) >> 20) & 0xFF000000FFull;
		return reduce2(((v - k * 100) << 16) + (k));
	}
 
	typedef unsigned long long ull;
	inline ull reduce8(ull v) {
		/* pre: v  < 100000000
		 *
		 *  preReduce4: 
		 *     ((unsigned*)&v)[0] = v / 10000
		 *     ((unsigned*)&v)[1] = v % 10000
		 *
		 *     This should be familiar now, split v into the two 4-digit segments,
		 *     put them in the right place, and let reduce4 continue the splitting
		 */
 
		/* Again, use the same method as reduce4 and reduce2 with correctly tailored constants
		 */
		ull k = ((v * 3518437209u) >> 45);
		return reduce4(((v - k * 10000) << 32) + (k));
	}
 
	template <typename T>
	std::string itostr(T o) {
		/*
		 * Use of this union is not strictly compliant, but, really,
		 * who cares? This is just for fun :)
		 *
		 * Our ones digit will be in str[15]
		 *
		 * We don't actually need the first 6 bytes, but w/e
		 */
		union {
			char str[16];
			unsigned short u2[8];
			unsigned u4[4];
			unsigned long long u8[2];
		};
 
		/* Technically should be "... ? unsigned(~0) + 1 ..." to ensure correct behavior I think */
		/* Tends to compile to: v = (o ^ (o >> 31)) - (o >> 31); */
		unsigned v = o < 0 ? ~o + 1 : o;
 
		/* We want u2[3] = v / 100000000 ... that is, the first 2 bytes of the decimal rep */
 
		/* This is the same as in reduce8, that is divide by 10000. So u8[0] = v / 10000 */
		u8[0] = (ull(v) * 3518437209u) >> 45;
 
		/* Now we want u2[3] = u8[0] / 10000.
		 * If we added " >> 48 " to the end of the calculation below we would get u8[0] = u8[0] / 10000
		 * Note though that in little endian byte ordering u2[3] is the top 2 bytes of u8[0]
		 * and 64 - 16 == 48... Aha, We've got what we want, the rest of u8[0] is junk, but we don't care
		 */
		u8[0] = (u8[0] * 28147497672ull);
 
		/* Then just subtract out those digits from v so that u8[1] now holds
		 * the low 8 decimal digits of v
		 */
		u8[1] = v - u2[3] * 100000000;
 
		/* Split u8[1] into its 8 decimal digits */
		u8[1] = reduce8(u8[1]);
 
		/* f will point to the high order non-zero char */
		char* f;
 
		/* branch post: f is at the correct short (but not necessarily the correct byte) */
		if (u2[3]) {
			/* split the top two digits into their respective chars */
			u2[3] = reduce2(u2[3]);
			f = str + 6;
		} else {
			/* a sort of binary search on first non-zero digit */
			unsigned short* k = u4[2] ? u2 + 4 : u2 + 6;
			f = *k ? (char*)k : (char*)(k + 1);
		}
		/* update f to its final position */
		if (!*f) f++;
 
		/* '0' == 0x30 and i < 10 --> i <= 0xF ... that is, i | 0x30 = 'i' *
		 * Note that we could do u8[0] |= ... u8[1] |= ... but the corresponding
		 * x86-64 operation cannot use a 64 bit immediate value whereas the
		 * 32 bit 'or' can use a 32 bit immediate.
		 */
		u4[1] |= 0x30303030;
		u4[2] |= 0x30303030;
		u4[3] |= 0x30303030;
 
		/* Add the negative sign... note that o is just the original parameter passed */
		if (o < 0) *--f = '-';
 
		/* gcc basically forwards this to std::string(f, str + 16)
		 * but msvc handles it way more efficiently
		 */
		return std::string(f, (str + 16) - f);
	}

dGVtcGxhdGUgPHR5cGVuYW1lIFQ+IAoJVCByZWR1Y2UyKFQgdikgewoJCS8qIHByZTogKChzaG9ydCopJnYpW2ldIDwgMTAwIGZvciBhbGwgaQoJCSAqICBwb3N0OiAKCQkgKiAgICAgKChjaGFyKikmdilbMmldID0gKChzaG9ydCopJnYpW2ldIC8gMTAKCQkgKiAgICAgKChjaGFyKikmdilbMmkgKyAxXSA9ICgoc2hvcnQqKSZ2KVtpXSAlIDEwCgkJICogICAgIAoJCSAqICAgICBUaGF0IGlzLCB3ZSBzcGxpdCBlYWNoIHNob3J0IGluIHYgaW50byBpdHMgb25lcyBhbmQgdGVucyBkaWdpdHMKCQkgKi8KCgkJLyogdCA8IDEwMCAtLT4gKHQgKiA0MTApID4+IDEyID09IHQgLyAxMAoJCSAqCQkJJiYgKHQgKiA0MTApIDwgMHgxMDAwMAoJCSAqIAoJCSAqIEZvciB0aGUgbGVhc3Qgb3JkZXIgc2hvcnQgdGhhdCdzIGFsbCB3ZSBuZWVkLCBmb3IgdGhlIG90aGVycyB0aGUKCQkgKiBzaGlmdCBkb2Vzbid0IGRyb3AgdGhlIHJlbWFpbmRlciBzbyB3ZSBtYXNrIHRob3NlIG91dAoJCSAqLwoJCVQgayA9ICgodiAqIDQxMCkgPj4gMTIpICYgMHgwMDBGMDAwRjAwMEYwMDBGdWxsOwoKCQkvKgoJCSAqIFRoZW4ganVzdCBzdWJ0cmFjdCBvdXQgdGhlIHRlbnMgZGlnaXQgdG8gZ2V0IHRoZSBvbmVzIGRpZ2l0IGFuZAoJCSAqIHNoaWZ0IHRoZW0gaW50byB0aGUgcmlnaHQgcGxhY2UKCQkgKi8KCQlyZXR1cm4gKCgodiAtIGsgKiAxMCkgPDwgOCkgKyBrKTsKCX0KCgl0ZW1wbGF0ZSA8dHlwZW5hbWUgVD4KCVQgcmVkdWNlNChUIHYpIHsKCQkvKiBwcmU6ICgodW5zaWduZWQqKSZ2KVtpXSA8IDEwMDAwIGZvciBhbGwgaQoJCSAqCgkJICogIHByZVJlZHVjZTI6IAoJCSAqICAgICAoKHNob3J0KikmdilbMmldID0gKCh1bnNpZ25lZCopJnYpW2ldIC8gMTAwCgkJICogICAgICgoc2hvcnQqKSZ2KVsyaSArIDFdID0gKCh1bnNpZ25lZCopJnYpW2ldICUgMTAwCgkJICogICAgIAoJCSAqICAgICBUaGF0IGlzLCB3ZSBzcGxpdCBlYWNoIGludCBpbiB2IGludG8gaXRzIG9uZS90ZW4gYW5kIGh1bmRyZWQvdGhvdXNhbmQgCgkJICogICAgIGRpZ2l0IHBhaXJzLiBQdXQgdGhlbSBpbnRvIHRoZSBjb3JyZXNwb25kaW5nIHNob3J0IHBvc2l0aW9ucyBhbmQgdGhlbgoJCSAqICAgICBjYWxsIHJlZHVjZTIgdG8gZmluaXNoIHRoZSBzcGxpdHRpbmcKCQkgKi8KCgkJLyogVGhpcyBpcyBiYXNpY2FsbHkgdGhlIHNhbWUgYXMgcmVkdWNlMiB3aXRoIGRpZmZlcmVudCBjb25zdGFudHMKCQkgKi8KCQlUIGsgPSAoKHYgKiAxMDQ4NikgPj4gMjApICYgMHhGRjAwMDAwMEZGdWxsOwoJCXJldHVybiByZWR1Y2UyKCgodiAtIGsgKiAxMDApIDw8IDE2KSArIChrKSk7Cgl9CgoJdHlwZWRlZiB1bnNpZ25lZCBsb25nIGxvbmcgdWxsOwoJaW5saW5lIHVsbCByZWR1Y2U4KHVsbCB2KSB7CgkJLyogcHJlOiB2ICA8IDEwMDAwMDAwMAoJCSAqCgkJICogIHByZVJlZHVjZTQ6IAoJCSAqICAgICAoKHVuc2lnbmVkKikmdilbMF0gPSB2IC8gMTAwMDAKCQkgKiAgICAgKCh1bnNpZ25lZCopJnYpWzFdID0gdiAlIDEwMDAwCgkJICoKCQkgKiAgICAgVGhpcyBzaG91bGQgYmUgZmFtaWxpYXIgbm93LCBzcGxpdCB2IGludG8gdGhlIHR3byA0LWRpZ2l0IHNlZ21lbnRzLAoJCSAqICAgICBwdXQgdGhlbSBpbiB0aGUgcmlnaHQgcGxhY2UsIGFuZCBsZXQgcmVkdWNlNCBjb250aW51ZSB0aGUgc3BsaXR0aW5nCgkJICovCgoJCS8qIEFnYWluLCB1c2UgdGhlIHNhbWUgbWV0aG9kIGFzIHJlZHVjZTQgYW5kIHJlZHVjZTIgd2l0aCBjb3JyZWN0bHkgdGFpbG9yZWQgY29uc3RhbnRzCgkJICovCgkJdWxsIGsgPSAoKHYgKiAzNTE4NDM3MjA5dSkgPj4gNDUpOwoJCXJldHVybiByZWR1Y2U0KCgodiAtIGsgKiAxMDAwMCkgPDwgMzIpICsgKGspKTsKCX0KCgl0ZW1wbGF0ZSA8dHlwZW5hbWUgVD4KCXN0ZDo6c3RyaW5nIGl0b3N0cihUIG8pIHsKCQkvKgoJCSAqIFVzZSBvZiB0aGlzIHVuaW9uIGlzIG5vdCBzdHJpY3RseSBjb21wbGlhbnQsIGJ1dCwgcmVhbGx5LAoJCSAqIHdobyBjYXJlcz8gVGhpcyBpcyBqdXN0IGZvciBmdW4gOikKCQkgKgoJCSAqIE91ciBvbmVzIGRpZ2l0IHdpbGwgYmUgaW4gc3RyWzE1XQoJCSAqCgkJICogV2UgZG9uJ3QgYWN0dWFsbHkgbmVlZCB0aGUgZmlyc3QgNiBieXRlcywgYnV0IHcvZQoJCSAqLwoJCXVuaW9uIHsKCQkJY2hhciBzdHJbMTZdOwoJCQl1bnNpZ25lZCBzaG9ydCB1Mls4XTsKCQkJdW5zaWduZWQgdTRbNF07CgkJCXVuc2lnbmVkIGxvbmcgbG9uZyB1OFsyXTsKCQl9OwoKCQkvKiBUZWNobmljYWxseSBzaG91bGQgYmUgIi4uLiA/IHVuc2lnbmVkKH4wKSArIDEgLi4uIiB0byBlbnN1cmUgY29ycmVjdCBiZWhhdmlvciBJIHRoaW5rICovCgkJLyogVGVuZHMgdG8gY29tcGlsZSB0bzogdiA9IChvIF4gKG8gPj4gMzEpKSAtIChvID4+IDMxKTsgKi8KCQl1bnNpZ25lZCB2ID0gbyA8IDAgPyB+byArIDEgOiBvOwoKCQkvKiBXZSB3YW50IHUyWzNdID0gdiAvIDEwMDAwMDAwMCAuLi4gdGhhdCBpcywgdGhlIGZpcnN0IDIgYnl0ZXMgb2YgdGhlIGRlY2ltYWwgcmVwICovCgoJCS8qIFRoaXMgaXMgdGhlIHNhbWUgYXMgaW4gcmVkdWNlOCwgdGhhdCBpcyBkaXZpZGUgYnkgMTAwMDAuIFNvIHU4WzBdID0gdiAvIDEwMDAwICovCgkJdThbMF0gPSAodWxsKHYpICogMzUxODQzNzIwOXUpID4+IDQ1OwoKCQkvKiBOb3cgd2Ugd2FudCB1MlszXSA9IHU4WzBdIC8gMTAwMDAuCgkJICogSWYgd2UgYWRkZWQgIiA+PiA0OCAiIHRvIHRoZSBlbmQgb2YgdGhlIGNhbGN1bGF0aW9uIGJlbG93IHdlIHdvdWxkIGdldCB1OFswXSA9IHU4WzBdIC8gMTAwMDAKCQkgKiBOb3RlIHRob3VnaCB0aGF0IGluIGxpdHRsZSBlbmRpYW4gYnl0ZSBvcmRlcmluZyB1MlszXSBpcyB0aGUgdG9wIDIgYnl0ZXMgb2YgdThbMF0KCQkgKiBhbmQgNjQgLSAxNiA9PSA0OC4uLiBBaGEsIFdlJ3ZlIGdvdCB3aGF0IHdlIHdhbnQsIHRoZSByZXN0IG9mIHU4WzBdIGlzIGp1bmssIGJ1dCB3ZSBkb24ndCBjYXJlCgkJICovCgkJdThbMF0gPSAodThbMF0gKiAyODE0NzQ5NzY3MnVsbCk7CgoJCS8qIFRoZW4ganVzdCBzdWJ0cmFjdCBvdXQgdGhvc2UgZGlnaXRzIGZyb20gdiBzbyB0aGF0IHU4WzFdIG5vdyBob2xkcwoJCSAqIHRoZSBsb3cgOCBkZWNpbWFsIGRpZ2l0cyBvZiB2CgkJICovCgkJdThbMV0gPSB2IC0gdTJbM10gKiAxMDAwMDAwMDA7CgoJCS8qIFNwbGl0IHU4WzFdIGludG8gaXRzIDggZGVjaW1hbCBkaWdpdHMgKi8KCQl1OFsxXSA9IHJlZHVjZTgodThbMV0pOwoKCQkvKiBmIHdpbGwgcG9pbnQgdG8gdGhlIGhpZ2ggb3JkZXIgbm9uLXplcm8gY2hhciAqLwoJCWNoYXIqIGY7CgoJCS8qIGJyYW5jaCBwb3N0OiBmIGlzIGF0IHRoZSBjb3JyZWN0IHNob3J0IChidXQgbm90IG5lY2Vzc2FyaWx5IHRoZSBjb3JyZWN0IGJ5dGUpICovCgkJaWYgKHUyWzNdKSB7CgkJCS8qIHNwbGl0IHRoZSB0b3AgdHdvIGRpZ2l0cyBpbnRvIHRoZWlyIHJlc3BlY3RpdmUgY2hhcnMgKi8KCQkJdTJbM10gPSByZWR1Y2UyKHUyWzNdKTsKCQkJZiA9IHN0ciArIDY7CgkJfSBlbHNlIHsKCQkJLyogYSBzb3J0IG9mIGJpbmFyeSBzZWFyY2ggb24gZmlyc3Qgbm9uLXplcm8gZGlnaXQgKi8KCQkJdW5zaWduZWQgc2hvcnQqIGsgPSB1NFsyXSA/IHUyICsgNCA6IHUyICsgNjsKCQkJZiA9ICprID8gKGNoYXIqKWsgOiAoY2hhciopKGsgKyAxKTsKCQl9CgkJLyogdXBkYXRlIGYgdG8gaXRzIGZpbmFsIHBvc2l0aW9uICovCgkJaWYgKCEqZikgZisrOwoKCQkvKiAnMCcgPT0gMHgzMCBhbmQgaSA8IDEwIC0tPiBpIDw9IDB4RiAuLi4gdGhhdCBpcywgaSB8IDB4MzAgPSAnaScgKgoJCSAqIE5vdGUgdGhhdCB3ZSBjb3VsZCBkbyB1OFswXSB8PSAuLi4gdThbMV0gfD0gLi4uIGJ1dCB0aGUgY29ycmVzcG9uZGluZwoJCSAqIHg4Ni02NCBvcGVyYXRpb24gY2Fubm90IHVzZSBhIDY0IGJpdCBpbW1lZGlhdGUgdmFsdWUgd2hlcmVhcyB0aGUKCQkgKiAzMiBiaXQgJ29yJyBjYW4gdXNlIGEgMzIgYml0IGltbWVkaWF0ZS4KCQkgKi8KCQl1NFsxXSB8PSAweDMwMzAzMDMwOwoJCXU0WzJdIHw9IDB4MzAzMDMwMzA7CgkJdTRbM10gfD0gMHgzMDMwMzAzMDsKCgkJLyogQWRkIHRoZSBuZWdhdGl2ZSBzaWduLi4uIG5vdGUgdGhhdCBvIGlzIGp1c3QgdGhlIG9yaWdpbmFsIHBhcmFtZXRlciBwYXNzZWQgKi8KCQlpZiAobyA8IDApICotLWYgPSAnLSc7CgoJCS8qIGdjYyBiYXNpY2FsbHkgZm9yd2FyZHMgdGhpcyB0byBzdGQ6OnN0cmluZyhmLCBzdHIgKyAxNikKCQkgKiBidXQgbXN2YyBoYW5kbGVzIGl0IHdheSBtb3JlIGVmZmljaWVudGx5CgkJICovCgkJcmV0dXJuIHN0ZDo6c3RyaW5nKGYsIChzdHIgKyAxNikgLSBmKTsKCX0=

Not running #stdin #stdout 0s 0KB

stdin

copy

Standard input is empty

stdout

copy

Standard output is empty

https://ideone.com/rnDxk

language:

C++ (gcc 8.3)

created:

visibility:

public

Share or Embed source code

Discover > Sphere Engine API

The brand new service which powers Ideone!

Discover > IDE Widget

Widget for compiling and running the source code in a web browser!

Discover > Sphere Engine API

Discover > IDE Widget

Choose your language