Ideone.com

fork download

copy

#include <algorithm>
#include <cassert>
#include <chrono>
#include <cstdlib>
#include <ctime>
#include <iostream>
#include <map>
#include <random>
#include <unordered_map>
#include <vector>
 
#define BENCHMARK 1
 
 
template<class PairMap>
inline float DotPairsMapped(const PairMap& lhs, const PairMap& rhs) {
	float dot = 0;
	for(auto& pair : lhs) {
		auto pos = rhs.find(pair.first);
		if(pos != rhs.end())
			dot += pair.second * pos->second;
	}
	return dot;
}
 
template<class PairContainerSorted>
inline float DotPairsSorted(const PairContainerSorted& lhs, const PairContainerSorted& rhs) {
	float dot = 0;
	for(auto pLhs = lhs.begin(), pRhs = rhs.begin(), endLhs = lhs.end(), endRhs = rhs.end(); pRhs != endRhs;) {
		for(; pLhs != endLhs && pLhs->first < pRhs->first; ++pLhs);
		if(pLhs == endLhs)
			break;
		for(; pRhs != endRhs && pRhs->first < pLhs->first; ++pRhs);
		if(pRhs == endRhs)
			break;
		if(pLhs->first == pRhs->first) {
			dot += pLhs->second * pRhs->second;
			++pLhs;
			++pRhs;
		}
	}
	return dot;
}
 
template<class PairContainer>
inline float LenSqrPairs(const PairContainer& vec) {
	float dot = 0;
	for(auto& pair : vec)
		dot += pair.second * pair.second;
	return dot;
}
 
struct SparseVector {
	explicit SparseVector(size_t d, const std::pair<size_t, float>* begin, const std::pair<size_t, float>* end) : d(d) {
		size_t k(end - begin);
		idx.resize(k);
		val.resize(k);
		for(size_t i = 0; begin != end; ++i, ++begin) {
			idx[i] = begin->first;
			val[i] = begin->second;
		}
	}
 
	bool IsValid() const {
		if(idx.size() != val.size())
			return false;
		for(size_t i = 1; i < idx.size(); ++i) {
			if(idx[i - 1] >= idx[i])
				return false;
		}
		return true;
	}
 
	static float CosineDistance(const SparseVector& lhs, const SparseVector& rhs);
 
	size_t d;
	std::vector<size_t> idx;
	std::vector<float> val;
};
 
inline float Dot(const std::map<size_t, float>& lhs, const std::map<size_t, float>& rhs) { return DotPairsSorted(lhs, rhs); }
inline float LenSqr(const std::map<size_t, float>& vec) { return LenSqrPairs(vec); }
inline float Dot(const std::unordered_map<size_t, float>& lhs, const std::unordered_map<size_t, float>& rhs) { return DotPairsMapped(lhs, rhs); }
inline float LenSqr(const std::unordered_map<size_t, float>& vec) { return LenSqrPairs(vec); }
inline float Dot(const std::vector<std::pair<size_t, float>>& lhs, const std::vector<std::pair<size_t, float>>& rhs) { return DotPairsSorted(lhs, rhs); }
inline float LenSqr(const std::vector<std::pair<size_t, float>>& vec) { return LenSqrPairs(vec); }
 
inline float Dot(const SparseVector& lhs, const SparseVector& rhs) {
	float dot = 0;
	if(!lhs.idx.empty() && !rhs.idx.empty()) {
		const size_t *itIdxLhs = &lhs.idx[0], *endIdxLhs = &lhs.idx[0] + lhs.idx.size();
		const float *itValLhs = &lhs.val[0], *endValLhs = &lhs.val[0] + lhs.val.size();
		const size_t *itIdxRhs = &rhs.idx[0], *endIdxRhs = &rhs.idx[0] + rhs.idx.size();
		const float *itValRhs = &rhs.val[0], *endValRhs = &rhs.val[0] + rhs.val.size();
		while(itIdxRhs != endIdxRhs) {
			for(; itIdxLhs < endIdxLhs && *itIdxLhs < *itIdxRhs; ++itIdxLhs, ++itValLhs);
			if(itIdxLhs == endIdxLhs)
				break;
			for(; itIdxRhs < endIdxRhs && *itIdxRhs < *itIdxLhs; ++itIdxRhs, ++itValRhs);
			if(itIdxRhs == endIdxRhs)
				break;
			if(*itIdxLhs == *itIdxRhs) {
				dot += (*itValLhs) * (*itValRhs);
				++itIdxLhs;
				++itValLhs;
				++itIdxRhs;
				++itValRhs;
			}
		}
	}
	return dot;
}
 
inline float LenSqr(const SparseVector& vec) {
	float dot = 0;
	for(float v : vec.val)
		dot += v * v;
	return dot;
}
 
template<class Vector>
inline float CosineDistance(const Vector& lhs, const Vector& rhs) {
	return Dot(lhs, rhs) / std::sqrt(LenSqr(lhs) * LenSqr(rhs));
}
 
inline float SparseVector::CosineDistance(const SparseVector& lhs, const SparseVector& rhs) {
	float dotLR = 0, dotLL = 0, dotRR = 0;
	if(!lhs.idx.empty() && !rhs.idx.empty()) {
		const size_t *itIdxLhs = &lhs.idx[0], *endIdxLhs = &lhs.idx[0] + lhs.idx.size();
		const float *itValLhs = &lhs.val[0], *endValLhs = &lhs.val[0] + lhs.val.size();
		const size_t *itIdxRhs = &rhs.idx[0], *endIdxRhs = &rhs.idx[0] + rhs.idx.size();
		const float *itValRhs = &rhs.val[0], *endValRhs = &rhs.val[0] + rhs.val.size();
		while(itIdxRhs != endIdxRhs) {
			for(; itIdxLhs < endIdxLhs && *itIdxLhs < *itIdxRhs; ++itIdxLhs, ++itValLhs)
				dotLL += (*itValLhs) * (*itValLhs);
			if(itIdxLhs == endIdxLhs) {
				for(; itIdxRhs < endIdxRhs; ++itIdxRhs, ++itValRhs)
					dotRR += (*itValRhs) * (*itValRhs);
				break;
			}
			for(; itIdxRhs < endIdxRhs && *itIdxRhs < *itIdxLhs; ++itIdxRhs, ++itValRhs)
				dotRR += (*itValRhs) * (*itValRhs);
			if(itIdxRhs == endIdxRhs) {
				for(; itIdxLhs < endIdxLhs; ++itIdxLhs, ++itValLhs)
					dotLL += (*itValLhs) * (*itValLhs);
				break;
			}
			if(*itIdxLhs == *itIdxRhs) {
				dotLR += (*itValLhs) * (*itValRhs);
				dotLL += (*itValLhs) * (*itValLhs);
				dotRR += (*itValRhs) * (*itValRhs);
				++itIdxLhs;
				++itValLhs;
				++itIdxRhs;
				++itValRhs;
			}
		}
	}
	float lenSqrL = LenSqr(lhs), lenSqrR = LenSqr(rhs);
	return dotLR / std::sqrt(dotLL * dotRR);
}
 
template<class RandomIt, class UniformRandomNumberGenerator>
void shuffleK(RandomIt first, RandomIt last, typename std::iterator_traits<RandomIt>::difference_type k, UniformRandomNumberGenerator&& g) {
	typedef typename std::iterator_traits<RandomIt>::difference_type diff_t;
	typedef typename std::make_unsigned<diff_t>::type udiff_t;
	typedef typename std::uniform_int_distribution<udiff_t> distr_t;
	typedef typename distr_t::param_type param_t;
 
	distr_t D;
	diff_t n = std::min(k, last - first);
	for(diff_t i = n - 1; i > 0; --i) {
		using std::swap;
		swap(first[i], first[D(g, param_t(0, i))]);
	}
}
 
#if BENCHMARK
struct Benchmark {
	double vectorDot, vectorLen, vectorCos;
	double mapDot, mapLen, mapCos;
	double unorderedDot, unorderedLen, unorderedCos;
	double classDot, classLen, classCos;
 
	void min(Benchmark other) {
		vectorDot = std::min(vectorDot, other.vectorDot);
		vectorLen = std::min(vectorLen, other.vectorLen);
		vectorCos = std::min(vectorCos, other.vectorCos);
		mapDot = std::min(mapDot, other.mapDot);
		mapLen = std::min(mapLen, other.mapLen);
		mapCos = std::min(mapCos, other.mapCos);
		unorderedDot = std::min(unorderedDot, other.unorderedDot);
		unorderedLen = std::min(unorderedLen, other.unorderedLen);
		unorderedCos = std::min(unorderedCos, other.unorderedCos);
		classDot = std::min(classDot, other.classDot);
		classLen = std::min(classLen, other.classLen);
		classCos = std::min(classCos, other.classCos);
	}
	void max(Benchmark other) {
		vectorDot = std::max(vectorDot, other.vectorDot);
		vectorLen = std::max(vectorLen, other.vectorLen);
		vectorCos = std::max(vectorCos, other.vectorCos);
		mapDot = std::max(mapDot, other.mapDot);
		mapLen = std::max(mapLen, other.mapLen);
		mapCos = std::max(mapCos, other.mapCos);
		unorderedDot = std::max(unorderedDot, other.unorderedDot);
		unorderedLen = std::max(unorderedLen, other.unorderedLen);
		unorderedCos = std::max(unorderedCos, other.unorderedCos);
		classDot = std::max(classDot, other.classDot);
		classLen = std::max(classLen, other.classLen);
		classCos = std::max(classCos, other.classCos);
	}
	void add(Benchmark other) {
		vectorDot += other.vectorDot;
		vectorLen += other.vectorLen;
		vectorCos += other.vectorCos;
		mapDot += other.mapDot;
		mapLen += other.mapLen;
		mapCos += other.mapCos;
		unorderedDot += other.unorderedDot;
		unorderedLen += other.unorderedLen;
		unorderedCos += other.unorderedCos;
		classDot += other.classDot;
		classLen += other.classLen;
		classCos += other.classCos;
	}
	void sub(Benchmark other) {
		vectorDot -= other.vectorDot;
		vectorLen -= other.vectorLen;
		vectorCos -= other.vectorCos;
		mapDot -= other.mapDot;
		mapLen -= other.mapLen;
		mapCos -= other.mapCos;
		unorderedDot -= other.unorderedDot;
		unorderedLen -= other.unorderedLen;
		unorderedCos -= other.unorderedCos;
		classDot -= other.classDot;
		classLen -= other.classLen;
		classCos -= other.classCos;
	}
	void mul(double factor) {
		vectorDot *= factor;
		vectorLen *= factor;
		vectorCos *= factor;
		mapDot *= factor;
		mapLen *= factor;
		mapCos *= factor;
		unorderedDot *= factor;
		unorderedLen *= factor;
		unorderedCos *= factor;
		classDot *= factor;
		classLen *= factor;
		classCos *= factor;
	}
 
	template<class OStream>
	friend OStream& operator<< (OStream& os, const Benchmark& o) {
		os << "  pairs t(dot): " << o.vectorDot << ", t(len2): " << o.vectorLen << ", t(cos): " << o.vectorCos << std::endl;
		os << "  map'd / pairs dot: " << o.mapDot / o.vectorDot << ", len2: " << o.mapLen / o.vectorLen << ", cos: " << o.mapCos / o.vectorCos << std::endl;
		os << "  hashm / pairs dot: " << o.unorderedDot / o.vectorDot << ", len2: " << o.unorderedLen / o.vectorLen << ", cos: " << o.unorderedCos / o.vectorCos << std::endl;
		os << "  class / pairs dot: " << o.classDot / o.vectorDot << ", len2: " << o.classLen / o.vectorLen << ", cos: " << o.classCos / o.vectorCos << std::endl;
		return os;
	}
};
#endif
 
void RunBenchmark(size_t D, float Ratio, size_t RunCount, std::mt19937& g);
 
int main() {
	const size_t D = 169647;
	const float Ratio = 0.05f;
	const size_t RunCount = 10;
 
	//std::random_device rd;
	//std::mt19937 g(rd());
	std::mt19937 g(0xC0FFEE);
 
	for(int last = 1, cur = 1; cur <= 5; last += cur, std::swap(last, cur))
		RunBenchmark(D, Ratio * cur, RunCount, g);
 
	return 0;
}
 
volatile float sideEffectOnly = 0;
void RunBenchmark(size_t D, float Ratio, size_t RunCount, std::mt19937& g) {
	std::vector<size_t> indices;
	{
		indices.resize(D);
		for(size_t i = 0; i < D; ++i)
			indices[i] = i;
	}
	// Generates two sparse random vectors with on average ratio * D entries
	auto GenerateInput = [&indices, &g](float ratio, std::vector<std::pair<size_t, float>>& a, std::vector<std::pair<size_t, float>>& b) {
		if(indices.size() == 0) {
			a.resize(0);
			b.resize(0);
			return;
		}
 
		// determine number of entries
		typedef std::normal_distribution<float> norm_t;
		norm_t nrand;
		norm_t::param_type nparam(ratio * (float)indices.size(), 3.0f);
		float sizeA = std::min((float)indices.size(), std::max(1.0f, nrand(g, nparam)));
		float sizeB = std::min((float)indices.size(), std::max(1.0f, nrand(g, nparam)));
		a.resize((size_t)sizeA);
		b.resize((size_t)sizeB);
 
		// determine values of entries
		typedef std::uniform_real_distribution<float> uniform_t;
		uniform_t urand;
		shuffleK(&indices[0], &indices[0] + indices.size(), indices.size(), g);
		for(size_t i = 0; i < a.size(); ++i)
			a[i] = std::make_pair(indices[i], urand(g, uniform_t::param_type(-13.37f, 13.37f)));
		shuffleK(&indices[0], &indices[0] + indices.size(), indices.size(), g);
		for(size_t i = 0; i < b.size(); ++i)
			b[i] = std::make_pair(indices[i], urand(g, uniform_t::param_type(-13.37f, 13.37f)));
 
		auto pred = [](std::pair<size_t, float> lhs, std::pair<size_t, float> rhs) -> bool { return lhs.first < rhs.first; };
		std::sort(&a[0], &a[0] + a.size(), pred);
		std::sort(&b[0], &b[0] + b.size(), pred);
	};
 
#if BENCHMARK
	const size_t BenchmarkDot = 3, BenchmarkLen = 10, BenchmarkCos = 3;
	std::vector<Benchmark> benchmarks;
	typedef std::chrono::high_resolution_clock Clock;
	auto intervalAsSeconds = [](Clock::time_point t0, Clock::time_point t1) -> double { return 1e-9 * std::chrono::duration_cast<std::chrono::nanoseconds>(t1 - t0).count(); };
	double tMapDotSpecialMin = 0, tMapDotSpecialAvg = 0, tMapDotSpecialMax = 0;
	double tClassCosSpecialMin = 0, tClassCosSpecialAvg = 0, tClassCosSpecialMax = 0;
#endif
	std::vector<std::pair<size_t, float>> a, b;
	a.reserve(indices.size());
	b.reserve(indices.size());
	for(size_t run = 0; run < RunCount; ++run) {
		GenerateInput(Ratio, a, b);
 
		// ============= MAP ==============
		std::map<size_t, float> mA, mB;
		for(auto pair : a) mA.insert(pair);
		for(auto pair : b) mB.insert(pair);
		assert(mA.size() == a.size() && mB.size() == b.size());
		// warm-up
		const float mapDot = Dot(mA, mB);
		const float mapCos = CosineDistance(mA, mB);
#if BENCHMARK
		std::chrono::time_point<Clock> t0, t1;
		Benchmark benchmark = {};
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkDot; ++i)
			sideEffectOnly += Dot(mA, mB);
		t1 = Clock::now();
		benchmark.mapDot = intervalAsSeconds(t0, t1);
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkLen; ++i) {
			sideEffectOnly += LenSqr(mA);
			sideEffectOnly += LenSqr(mB);
		}
		t1 = Clock::now();
		benchmark.mapLen = intervalAsSeconds(t0, t1);
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkCos; ++i)
			sideEffectOnly += CosineDistance(mA, mB);
		t1 = Clock::now();
		benchmark.mapCos = intervalAsSeconds(t0, t1);
#endif
 
		// ============= UNORDERED MAP ==============
		std::unordered_map<size_t, float> uA, uB;
		for(auto pair : a) uA.insert(pair);
		for(auto pair : b) uB.insert(pair);
		assert(uA.size() == a.size() && uB.size() == b.size());
		const float unorderedDot = Dot(uA, uB);
		const float unorderedCos = CosineDistance(uA, uB);
#if BENCHMARK
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkDot; ++i)
			sideEffectOnly += Dot(uA, uB);
		t1 = Clock::now();
		benchmark.unorderedDot = intervalAsSeconds(t0, t1);
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkLen; ++i) {
			sideEffectOnly += LenSqr(uA);
			sideEffectOnly += LenSqr(uB);
		}
		t1 = Clock::now();
		benchmark.unorderedLen = intervalAsSeconds(t0, t1);
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkCos; ++i)
			sideEffectOnly += CosineDistance(uA, uB);
		t1 = Clock::now();
		benchmark.unorderedCos = intervalAsSeconds(t0, t1);
#endif
 
		// ============= VECTOR OF PAIRS ==============
		const float vectorDot = Dot(a, b);
		const float vectorCos = CosineDistance(a, b);
#if BENCHMARK
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkDot; ++i)
			sideEffectOnly += Dot(a, b);
		t1 = Clock::now();
		benchmark.vectorDot = intervalAsSeconds(t0, t1);
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkLen; ++i) {
			sideEffectOnly += LenSqr(a);
			sideEffectOnly += LenSqr(b);
		}
		t1 = Clock::now();
		benchmark.vectorLen = intervalAsSeconds(t0, t1);
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkCos; ++i)
			sideEffectOnly += CosineDistance(a, b);
		t1 = Clock::now();
		benchmark.vectorCos = intervalAsSeconds(t0, t1);
#endif
 
		// ============= PAIRS OF VECTORS ==============
		SparseVector vA(indices.size(), &a[0], &a[0] + a.size());
		SparseVector vB(indices.size(), &b[0], &b[0] + b.size());
		const float classDot = Dot(vA, vB);
		const float classCos = CosineDistance(vA, vB);
#if BENCHMARK
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkDot; ++i)
			sideEffectOnly += Dot(vA, vB);
		t1 = Clock::now();
		benchmark.classDot = intervalAsSeconds(t0, t1);
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkLen; ++i) {
			sideEffectOnly += LenSqr(vA);
			sideEffectOnly += LenSqr(vB);
		}
		t1 = Clock::now();
		benchmark.classLen = intervalAsSeconds(t0, t1);
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkCos; ++i)
			sideEffectOnly += CosineDistance(vA, vB);
		t1 = Clock::now();
		benchmark.classCos = intervalAsSeconds(t0, t1);
#endif
 
		// ============= NAIVE MAP ==============
		const float mapDotSpecial = DotPairsMapped(mA, mB);
		// ======== DON'T TOUCH IT TWICE ========
		const float classCosSpecial = SparseVector::CosineDistance(vA, vB);
#if BENCHMARK
		// naive dot product with map
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkDot; ++i)
			sideEffectOnly += DotPairsMapped(mA, mB);
		t1 = Clock::now();
		double tMapDotSpecial = intervalAsSeconds(t0, t1);
		// cosine distance computation touching each element just once
		t0 = Clock::now();
		for(size_t i = 0; i < BenchmarkCos; ++i)
			sideEffectOnly += SparseVector::CosineDistance(vA, vB);
		t1 = Clock::now();
		double tClassCosSpecial = intervalAsSeconds(t0, t1);
		// accumulate specials
		if(run == 0) {
			tMapDotSpecialMin = tMapDotSpecial;
			tMapDotSpecialAvg = tMapDotSpecial;
			tMapDotSpecialMax = tMapDotSpecial;
			tClassCosSpecialMin = tClassCosSpecial;
			tClassCosSpecialAvg = tClassCosSpecial;
			tClassCosSpecialMax = tClassCosSpecial;
		} else {
			tMapDotSpecialMin = std::min(tMapDotSpecialMin, tMapDotSpecial);
			tMapDotSpecialAvg += tMapDotSpecial;
			tMapDotSpecialMax = std::max(tMapDotSpecialMax, tMapDotSpecial);
			tClassCosSpecialMin = std::min(tClassCosSpecialMin, tClassCosSpecial);
			tClassCosSpecialAvg += tClassCosSpecial;
			tClassCosSpecialMax = std::max(tClassCosSpecialMax, tClassCosSpecial);
		}
#endif
 
		auto equal = [](float lhs, float rhs) -> bool { return (rhs - lhs) * (rhs - lhs) < 1e-4f * std::max(std::abs(lhs), std::abs(rhs)); };
		if(!equal(vectorDot, mapDot) || !equal(vectorCos, mapCos) ||
		   !equal(vectorDot, unorderedDot) || !equal(vectorCos, unorderedCos) ||
		   !equal(vectorDot, classDot) || !equal(vectorCos, classCos) ||
		   !equal(vectorDot, mapDotSpecial) ||
		   !equal(vectorCos, classCosSpecial)) {
			std::cout << "Validation failure on run " << run << std::endl;
			std::cout << " pairs: dot(a, b): " << Dot(a, b) << ", cos(a, b): " << CosineDistance(a, b) << std::endl;
			std::cout << " map'd: dot(a, b): " << Dot(mA, mB) << ", cos(a, b): " << CosineDistance(mA, mB) << std::endl;
			std::cout << " hashm: dot(a, b): " << Dot(uA, uB) << ", cos(a, b): " << CosineDistance(uA, uB) << std::endl;
			std::cout << " class: dot(a, b): " << Dot(vA, vB) << ", cos(a, b): " << CosineDistance(vA, vB) << std::endl;
			std::cout << " specl map'd: dot(a, b): " << mapDotSpecial << std::endl;
			std::cout << " specl class: cos(a, b): " << classCosSpecial << std::endl;
#if BENCHMARK
		} else {
			benchmarks.push_back(benchmark);
#endif
		}
	}
 
#if BENCHMARK
	if(RunCount > 0 && !benchmarks.empty()) {
		Benchmark min = benchmarks[0], avg = min, max = min;
		for(size_t i = 1; i < benchmarks.size(); ++i) {
			min.min(benchmarks[i]);
			avg.add(benchmarks[i]);
			max.max(benchmarks[i]);
		}
		if(RunCount <= 2) {
			avg.mul(1.0 / RunCount);
			tClassCosSpecialAvg /= RunCount;
		} else {
			avg.sub(min);
			avg.sub(max);
			avg.mul(1.0 / (RunCount - 2));
			tMapDotSpecialAvg = (tMapDotSpecialAvg - tMapDotSpecialMin - tMapDotSpecialMax) / (RunCount - 2);
			tClassCosSpecialAvg = (tClassCosSpecialAvg - tClassCosSpecialMin - tClassCosSpecialMax) / (RunCount - 2);
		}
 
		std::cout << " *** BENCHMARK *** " << std::endl;
		std::cout << "number of runs: " << RunCount << ", dimensions: " << D << " and non-zero ratio: " << Ratio << std::endl;
		std::cout << "number of dot products per run: " << BenchmarkDot << std::endl;
		std::cout << "number of lengthsqares per run: " << BenchmarkLen << std::endl;
		std::cout << "number of cosine dists per run: " << BenchmarkCos << std::endl;
		std::cout << std::endl;
#if 0
		// min(x) / min(base) is not a good measure...
		std::cout << "min" << std::endl;
		std::cout << min;
		std::cout << "  specl / pairs dot (naive map): " << (tMapDotSpecialMin / min.vectorDot) << std::endl;
		std::cout << "  specl / pairs cos (optimised): " << (tClassCosSpecialMin / min.vectorCos) << std::endl;
		std::cout << std::endl;
#endif
		// avg(x) / avg(base)
		std::cout << "avg" << std::endl;
		std::cout << avg;
		std::cout << "  specl / pairs dot (naive map): " << (tMapDotSpecialAvg / avg.vectorDot) << std::endl;
		std::cout << "  specl / pairs cos (optimised): " << (tClassCosSpecialAvg / avg.vectorCos) << std::endl;
		std::cout << std::endl;
#if 0
		// max(x) / max(base) is not a good measure...
		std::cout << "max" << std::endl;
		std::cout << max;
		std::cout << "  specl / pairs dot (naive map): " << (tMapDotSpecialMax / max.vectorDot) << std::endl;
		std::cout << "  specl / pairs cos (optimised): " << (tClassCosSpecialMax / max.vectorCos) << std::endl;
		std::cout << std::endl;
#endif
	}
#endif
}

I2luY2x1ZGUgPGFsZ29yaXRobT4KI2luY2x1ZGUgPGNhc3NlcnQ+CiNpbmNsdWRlIDxjaHJvbm8+CiNpbmNsdWRlIDxjc3RkbGliPgojaW5jbHVkZSA8Y3RpbWU+CiNpbmNsdWRlIDxpb3N0cmVhbT4KI2luY2x1ZGUgPG1hcD4KI2luY2x1ZGUgPHJhbmRvbT4KI2luY2x1ZGUgPHVub3JkZXJlZF9tYXA+CiNpbmNsdWRlIDx2ZWN0b3I+CgojZGVmaW5lIEJFTkNITUFSSyAxCgoKdGVtcGxhdGU8Y2xhc3MgUGFpck1hcD4KaW5saW5lIGZsb2F0IERvdFBhaXJzTWFwcGVkKGNvbnN0IFBhaXJNYXAmIGxocywgY29uc3QgUGFpck1hcCYgcmhzKSB7CglmbG9hdCBkb3QgPSAwOwoJZm9yKGF1dG8mIHBhaXIgOiBsaHMpIHsKCQlhdXRvIHBvcyA9IHJocy5maW5kKHBhaXIuZmlyc3QpOwoJCWlmKHBvcyAhPSByaHMuZW5kKCkpCgkJCWRvdCArPSBwYWlyLnNlY29uZCAqIHBvcy0+c2Vjb25kOwoJfQoJcmV0dXJuIGRvdDsKfQoKdGVtcGxhdGU8Y2xhc3MgUGFpckNvbnRhaW5lclNvcnRlZD4KaW5saW5lIGZsb2F0IERvdFBhaXJzU29ydGVkKGNvbnN0IFBhaXJDb250YWluZXJTb3J0ZWQmIGxocywgY29uc3QgUGFpckNvbnRhaW5lclNvcnRlZCYgcmhzKSB7CglmbG9hdCBkb3QgPSAwOwoJZm9yKGF1dG8gcExocyA9IGxocy5iZWdpbigpLCBwUmhzID0gcmhzLmJlZ2luKCksIGVuZExocyA9IGxocy5lbmQoKSwgZW5kUmhzID0gcmhzLmVuZCgpOyBwUmhzICE9IGVuZFJoczspIHsKCQlmb3IoOyBwTGhzICE9IGVuZExocyAmJiBwTGhzLT5maXJzdCA8IHBSaHMtPmZpcnN0OyArK3BMaHMpOwoJCWlmKHBMaHMgPT0gZW5kTGhzKQoJCQlicmVhazsKCQlmb3IoOyBwUmhzICE9IGVuZFJocyAmJiBwUmhzLT5maXJzdCA8IHBMaHMtPmZpcnN0OyArK3BSaHMpOwoJCWlmKHBSaHMgPT0gZW5kUmhzKQoJCQlicmVhazsKCQlpZihwTGhzLT5maXJzdCA9PSBwUmhzLT5maXJzdCkgewoJCQlkb3QgKz0gcExocy0+c2Vjb25kICogcFJocy0+c2Vjb25kOwoJCQkrK3BMaHM7CgkJCSsrcFJoczsKCQl9Cgl9CglyZXR1cm4gZG90Owp9Cgp0ZW1wbGF0ZTxjbGFzcyBQYWlyQ29udGFpbmVyPgppbmxpbmUgZmxvYXQgTGVuU3FyUGFpcnMoY29uc3QgUGFpckNvbnRhaW5lciYgdmVjKSB7CglmbG9hdCBkb3QgPSAwOwoJZm9yKGF1dG8mIHBhaXIgOiB2ZWMpCgkJZG90ICs9IHBhaXIuc2Vjb25kICogcGFpci5zZWNvbmQ7CglyZXR1cm4gZG90Owp9CgpzdHJ1Y3QgU3BhcnNlVmVjdG9yIHsKCWV4cGxpY2l0IFNwYXJzZVZlY3RvcihzaXplX3QgZCwgY29uc3Qgc3RkOjpwYWlyPHNpemVfdCwgZmxvYXQ+KiBiZWdpbiwgY29uc3Qgc3RkOjpwYWlyPHNpemVfdCwgZmxvYXQ+KiBlbmQpIDogZChkKSB7CgkJc2l6ZV90IGsoZW5kIC0gYmVnaW4pOwoJCWlkeC5yZXNpemUoayk7CgkJdmFsLnJlc2l6ZShrKTsKCQlmb3Ioc2l6ZV90IGkgPSAwOyBiZWdpbiAhPSBlbmQ7ICsraSwgKytiZWdpbikgewoJCQlpZHhbaV0gPSBiZWdpbi0+Zmlyc3Q7CgkJCXZhbFtpXSA9IGJlZ2luLT5zZWNvbmQ7CgkJfQoJfQoKCWJvb2wgSXNWYWxpZCgpIGNvbnN0IHsKCQlpZihpZHguc2l6ZSgpICE9IHZhbC5zaXplKCkpCgkJCXJldHVybiBmYWxzZTsKCQlmb3Ioc2l6ZV90IGkgPSAxOyBpIDwgaWR4LnNpemUoKTsgKytpKSB7CgkJCWlmKGlkeFtpIC0gMV0gPj0gaWR4W2ldKQoJCQkJcmV0dXJuIGZhbHNlOwoJCX0KCQlyZXR1cm4gdHJ1ZTsKCX0KCglzdGF0aWMgZmxvYXQgQ29zaW5lRGlzdGFuY2UoY29uc3QgU3BhcnNlVmVjdG9yJiBsaHMsIGNvbnN0IFNwYXJzZVZlY3RvciYgcmhzKTsKCglzaXplX3QgZDsKCXN0ZDo6dmVjdG9yPHNpemVfdD4gaWR4OwoJc3RkOjp2ZWN0b3I8ZmxvYXQ+IHZhbDsKfTsKCmlubGluZSBmbG9hdCBEb3QoY29uc3Qgc3RkOjptYXA8c2l6ZV90LCBmbG9hdD4mIGxocywgY29uc3Qgc3RkOjptYXA8c2l6ZV90LCBmbG9hdD4mIHJocykgeyByZXR1cm4gRG90UGFpcnNTb3J0ZWQobGhzLCByaHMpOyB9CmlubGluZSBmbG9hdCBMZW5TcXIoY29uc3Qgc3RkOjptYXA8c2l6ZV90LCBmbG9hdD4mIHZlYykgeyByZXR1cm4gTGVuU3FyUGFpcnModmVjKTsgfQppbmxpbmUgZmxvYXQgRG90KGNvbnN0IHN0ZDo6dW5vcmRlcmVkX21hcDxzaXplX3QsIGZsb2F0PiYgbGhzLCBjb25zdCBzdGQ6OnVub3JkZXJlZF9tYXA8c2l6ZV90LCBmbG9hdD4mIHJocykgeyByZXR1cm4gRG90UGFpcnNNYXBwZWQobGhzLCByaHMpOyB9CmlubGluZSBmbG9hdCBMZW5TcXIoY29uc3Qgc3RkOjp1bm9yZGVyZWRfbWFwPHNpemVfdCwgZmxvYXQ+JiB2ZWMpIHsgcmV0dXJuIExlblNxclBhaXJzKHZlYyk7IH0KaW5saW5lIGZsb2F0IERvdChjb25zdCBzdGQ6OnZlY3RvcjxzdGQ6OnBhaXI8c2l6ZV90LCBmbG9hdD4+JiBsaHMsIGNvbnN0IHN0ZDo6dmVjdG9yPHN0ZDo6cGFpcjxzaXplX3QsIGZsb2F0Pj4mIHJocykgeyByZXR1cm4gRG90UGFpcnNTb3J0ZWQobGhzLCByaHMpOyB9CmlubGluZSBmbG9hdCBMZW5TcXIoY29uc3Qgc3RkOjp2ZWN0b3I8c3RkOjpwYWlyPHNpemVfdCwgZmxvYXQ+PiYgdmVjKSB7IHJldHVybiBMZW5TcXJQYWlycyh2ZWMpOyB9CgppbmxpbmUgZmxvYXQgRG90KGNvbnN0IFNwYXJzZVZlY3RvciYgbGhzLCBjb25zdCBTcGFyc2VWZWN0b3ImIHJocykgewoJZmxvYXQgZG90ID0gMDsKCWlmKCFsaHMuaWR4LmVtcHR5KCkgJiYgIXJocy5pZHguZW1wdHkoKSkgewoJCWNvbnN0IHNpemVfdCAqaXRJZHhMaHMgPSAmbGhzLmlkeFswXSwgKmVuZElkeExocyA9ICZsaHMuaWR4WzBdICsgbGhzLmlkeC5zaXplKCk7CgkJY29uc3QgZmxvYXQgKml0VmFsTGhzID0gJmxocy52YWxbMF0sICplbmRWYWxMaHMgPSAmbGhzLnZhbFswXSArIGxocy52YWwuc2l6ZSgpOwoJCWNvbnN0IHNpemVfdCAqaXRJZHhSaHMgPSAmcmhzLmlkeFswXSwgKmVuZElkeFJocyA9ICZyaHMuaWR4WzBdICsgcmhzLmlkeC5zaXplKCk7CgkJY29uc3QgZmxvYXQgKml0VmFsUmhzID0gJnJocy52YWxbMF0sICplbmRWYWxSaHMgPSAmcmhzLnZhbFswXSArIHJocy52YWwuc2l6ZSgpOwoJCXdoaWxlKGl0SWR4UmhzICE9IGVuZElkeFJocykgewoJCQlmb3IoOyBpdElkeExocyA8IGVuZElkeExocyAmJiAqaXRJZHhMaHMgPCAqaXRJZHhSaHM7ICsraXRJZHhMaHMsICsraXRWYWxMaHMpOwoJCQlpZihpdElkeExocyA9PSBlbmRJZHhMaHMpCgkJCQlicmVhazsKCQkJZm9yKDsgaXRJZHhSaHMgPCBlbmRJZHhSaHMgJiYgKml0SWR4UmhzIDwgKml0SWR4TGhzOyArK2l0SWR4UmhzLCArK2l0VmFsUmhzKTsKCQkJaWYoaXRJZHhSaHMgPT0gZW5kSWR4UmhzKQoJCQkJYnJlYWs7CgkJCWlmKCppdElkeExocyA9PSAqaXRJZHhSaHMpIHsKCQkJCWRvdCArPSAoKml0VmFsTGhzKSAqICgqaXRWYWxSaHMpOwoJCQkJKytpdElkeExoczsKCQkJCSsraXRWYWxMaHM7CgkJCQkrK2l0SWR4UmhzOwoJCQkJKytpdFZhbFJoczsKCQkJfQoJCX0KCX0KCXJldHVybiBkb3Q7Cn0KCmlubGluZSBmbG9hdCBMZW5TcXIoY29uc3QgU3BhcnNlVmVjdG9yJiB2ZWMpIHsKCWZsb2F0IGRvdCA9IDA7Cglmb3IoZmxvYXQgdiA6IHZlYy52YWwpCgkJZG90ICs9IHYgKiB2OwoJcmV0dXJuIGRvdDsKfQoKdGVtcGxhdGU8Y2xhc3MgVmVjdG9yPgppbmxpbmUgZmxvYXQgQ29zaW5lRGlzdGFuY2UoY29uc3QgVmVjdG9yJiBsaHMsIGNvbnN0IFZlY3RvciYgcmhzKSB7CglyZXR1cm4gRG90KGxocywgcmhzKSAvIHN0ZDo6c3FydChMZW5TcXIobGhzKSAqIExlblNxcihyaHMpKTsKfQoKaW5saW5lIGZsb2F0IFNwYXJzZVZlY3Rvcjo6Q29zaW5lRGlzdGFuY2UoY29uc3QgU3BhcnNlVmVjdG9yJiBsaHMsIGNvbnN0IFNwYXJzZVZlY3RvciYgcmhzKSB7CglmbG9hdCBkb3RMUiA9IDAsIGRvdExMID0gMCwgZG90UlIgPSAwOwoJaWYoIWxocy5pZHguZW1wdHkoKSAmJiAhcmhzLmlkeC5lbXB0eSgpKSB7CgkJY29uc3Qgc2l6ZV90ICppdElkeExocyA9ICZsaHMuaWR4WzBdLCAqZW5kSWR4TGhzID0gJmxocy5pZHhbMF0gKyBsaHMuaWR4LnNpemUoKTsKCQljb25zdCBmbG9hdCAqaXRWYWxMaHMgPSAmbGhzLnZhbFswXSwgKmVuZFZhbExocyA9ICZsaHMudmFsWzBdICsgbGhzLnZhbC5zaXplKCk7CgkJY29uc3Qgc2l6ZV90ICppdElkeFJocyA9ICZyaHMuaWR4WzBdLCAqZW5kSWR4UmhzID0gJnJocy5pZHhbMF0gKyByaHMuaWR4LnNpemUoKTsKCQljb25zdCBmbG9hdCAqaXRWYWxSaHMgPSAmcmhzLnZhbFswXSwgKmVuZFZhbFJocyA9ICZyaHMudmFsWzBdICsgcmhzLnZhbC5zaXplKCk7CgkJd2hpbGUoaXRJZHhSaHMgIT0gZW5kSWR4UmhzKSB7CgkJCWZvcig7IGl0SWR4TGhzIDwgZW5kSWR4TGhzICYmICppdElkeExocyA8ICppdElkeFJoczsgKytpdElkeExocywgKytpdFZhbExocykKCQkJCWRvdExMICs9ICgqaXRWYWxMaHMpICogKCppdFZhbExocyk7CgkJCWlmKGl0SWR4TGhzID09IGVuZElkeExocykgewoJCQkJZm9yKDsgaXRJZHhSaHMgPCBlbmRJZHhSaHM7ICsraXRJZHhSaHMsICsraXRWYWxSaHMpCgkJCQkJZG90UlIgKz0gKCppdFZhbFJocykgKiAoKml0VmFsUmhzKTsKCQkJCWJyZWFrOwoJCQl9CgkJCWZvcig7IGl0SWR4UmhzIDwgZW5kSWR4UmhzICYmICppdElkeFJocyA8ICppdElkeExoczsgKytpdElkeFJocywgKytpdFZhbFJocykKCQkJCWRvdFJSICs9ICgqaXRWYWxSaHMpICogKCppdFZhbFJocyk7CgkJCWlmKGl0SWR4UmhzID09IGVuZElkeFJocykgewoJCQkJZm9yKDsgaXRJZHhMaHMgPCBlbmRJZHhMaHM7ICsraXRJZHhMaHMsICsraXRWYWxMaHMpCgkJCQkJZG90TEwgKz0gKCppdFZhbExocykgKiAoKml0VmFsTGhzKTsKCQkJCWJyZWFrOwoJCQl9CgkJCWlmKCppdElkeExocyA9PSAqaXRJZHhSaHMpIHsKCQkJCWRvdExSICs9ICgqaXRWYWxMaHMpICogKCppdFZhbFJocyk7CgkJCQlkb3RMTCArPSAoKml0VmFsTGhzKSAqICgqaXRWYWxMaHMpOwoJCQkJZG90UlIgKz0gKCppdFZhbFJocykgKiAoKml0VmFsUmhzKTsKCQkJCSsraXRJZHhMaHM7CgkJCQkrK2l0VmFsTGhzOwoJCQkJKytpdElkeFJoczsKCQkJCSsraXRWYWxSaHM7CgkJCX0KCQl9Cgl9CglmbG9hdCBsZW5TcXJMID0gTGVuU3FyKGxocyksIGxlblNxclIgPSBMZW5TcXIocmhzKTsKCXJldHVybiBkb3RMUiAvIHN0ZDo6c3FydChkb3RMTCAqIGRvdFJSKTsKfQoKdGVtcGxhdGU8Y2xhc3MgUmFuZG9tSXQsIGNsYXNzIFVuaWZvcm1SYW5kb21OdW1iZXJHZW5lcmF0b3I+CnZvaWQgc2h1ZmZsZUsoUmFuZG9tSXQgZmlyc3QsIFJhbmRvbUl0IGxhc3QsIHR5cGVuYW1lIHN0ZDo6aXRlcmF0b3JfdHJhaXRzPFJhbmRvbUl0Pjo6ZGlmZmVyZW5jZV90eXBlIGssIFVuaWZvcm1SYW5kb21OdW1iZXJHZW5lcmF0b3ImJiBnKSB7Cgl0eXBlZGVmIHR5cGVuYW1lIHN0ZDo6aXRlcmF0b3JfdHJhaXRzPFJhbmRvbUl0Pjo6ZGlmZmVyZW5jZV90eXBlIGRpZmZfdDsKCXR5cGVkZWYgdHlwZW5hbWUgc3RkOjptYWtlX3Vuc2lnbmVkPGRpZmZfdD46OnR5cGUgdWRpZmZfdDsKCXR5cGVkZWYgdHlwZW5hbWUgc3RkOjp1bmlmb3JtX2ludF9kaXN0cmlidXRpb248dWRpZmZfdD4gZGlzdHJfdDsKCXR5cGVkZWYgdHlwZW5hbWUgZGlzdHJfdDo6cGFyYW1fdHlwZSBwYXJhbV90OwoKCWRpc3RyX3QgRDsKCWRpZmZfdCBuID0gc3RkOjptaW4oaywgbGFzdCAtIGZpcnN0KTsKCWZvcihkaWZmX3QgaSA9IG4gLSAxOyBpID4gMDsgLS1pKSB7CgkJdXNpbmcgc3RkOjpzd2FwOwoJCXN3YXAoZmlyc3RbaV0sIGZpcnN0W0QoZywgcGFyYW1fdCgwLCBpKSldKTsKCX0KfQoKI2lmIEJFTkNITUFSSwpzdHJ1Y3QgQmVuY2htYXJrIHsKCWRvdWJsZSB2ZWN0b3JEb3QsIHZlY3RvckxlbiwgdmVjdG9yQ29zOwoJZG91YmxlIG1hcERvdCwgbWFwTGVuLCBtYXBDb3M7Cglkb3VibGUgdW5vcmRlcmVkRG90LCB1bm9yZGVyZWRMZW4sIHVub3JkZXJlZENvczsKCWRvdWJsZSBjbGFzc0RvdCwgY2xhc3NMZW4sIGNsYXNzQ29zOwoKCXZvaWQgbWluKEJlbmNobWFyayBvdGhlcikgewoJCXZlY3RvckRvdCA9IHN0ZDo6bWluKHZlY3RvckRvdCwgb3RoZXIudmVjdG9yRG90KTsKCQl2ZWN0b3JMZW4gPSBzdGQ6Om1pbih2ZWN0b3JMZW4sIG90aGVyLnZlY3Rvckxlbik7CgkJdmVjdG9yQ29zID0gc3RkOjptaW4odmVjdG9yQ29zLCBvdGhlci52ZWN0b3JDb3MpOwoJCW1hcERvdCA9IHN0ZDo6bWluKG1hcERvdCwgb3RoZXIubWFwRG90KTsKCQltYXBMZW4gPSBzdGQ6Om1pbihtYXBMZW4sIG90aGVyLm1hcExlbik7CgkJbWFwQ29zID0gc3RkOjptaW4obWFwQ29zLCBvdGhlci5tYXBDb3MpOwoJCXVub3JkZXJlZERvdCA9IHN0ZDo6bWluKHVub3JkZXJlZERvdCwgb3RoZXIudW5vcmRlcmVkRG90KTsKCQl1bm9yZGVyZWRMZW4gPSBzdGQ6Om1pbih1bm9yZGVyZWRMZW4sIG90aGVyLnVub3JkZXJlZExlbik7CgkJdW5vcmRlcmVkQ29zID0gc3RkOjptaW4odW5vcmRlcmVkQ29zLCBvdGhlci51bm9yZGVyZWRDb3MpOwoJCWNsYXNzRG90ID0gc3RkOjptaW4oY2xhc3NEb3QsIG90aGVyLmNsYXNzRG90KTsKCQljbGFzc0xlbiA9IHN0ZDo6bWluKGNsYXNzTGVuLCBvdGhlci5jbGFzc0xlbik7CgkJY2xhc3NDb3MgPSBzdGQ6Om1pbihjbGFzc0Nvcywgb3RoZXIuY2xhc3NDb3MpOwoJfQoJdm9pZCBtYXgoQmVuY2htYXJrIG90aGVyKSB7CgkJdmVjdG9yRG90ID0gc3RkOjptYXgodmVjdG9yRG90LCBvdGhlci52ZWN0b3JEb3QpOwoJCXZlY3RvckxlbiA9IHN0ZDo6bWF4KHZlY3Rvckxlbiwgb3RoZXIudmVjdG9yTGVuKTsKCQl2ZWN0b3JDb3MgPSBzdGQ6Om1heCh2ZWN0b3JDb3MsIG90aGVyLnZlY3RvckNvcyk7CgkJbWFwRG90ID0gc3RkOjptYXgobWFwRG90LCBvdGhlci5tYXBEb3QpOwoJCW1hcExlbiA9IHN0ZDo6bWF4KG1hcExlbiwgb3RoZXIubWFwTGVuKTsKCQltYXBDb3MgPSBzdGQ6Om1heChtYXBDb3MsIG90aGVyLm1hcENvcyk7CgkJdW5vcmRlcmVkRG90ID0gc3RkOjptYXgodW5vcmRlcmVkRG90LCBvdGhlci51bm9yZGVyZWREb3QpOwoJCXVub3JkZXJlZExlbiA9IHN0ZDo6bWF4KHVub3JkZXJlZExlbiwgb3RoZXIudW5vcmRlcmVkTGVuKTsKCQl1bm9yZGVyZWRDb3MgPSBzdGQ6Om1heCh1bm9yZGVyZWRDb3MsIG90aGVyLnVub3JkZXJlZENvcyk7CgkJY2xhc3NEb3QgPSBzdGQ6Om1heChjbGFzc0RvdCwgb3RoZXIuY2xhc3NEb3QpOwoJCWNsYXNzTGVuID0gc3RkOjptYXgoY2xhc3NMZW4sIG90aGVyLmNsYXNzTGVuKTsKCQljbGFzc0NvcyA9IHN0ZDo6bWF4KGNsYXNzQ29zLCBvdGhlci5jbGFzc0Nvcyk7Cgl9Cgl2b2lkIGFkZChCZW5jaG1hcmsgb3RoZXIpIHsKCQl2ZWN0b3JEb3QgKz0gb3RoZXIudmVjdG9yRG90OwoJCXZlY3RvckxlbiArPSBvdGhlci52ZWN0b3JMZW47CgkJdmVjdG9yQ29zICs9IG90aGVyLnZlY3RvckNvczsKCQltYXBEb3QgKz0gb3RoZXIubWFwRG90OwoJCW1hcExlbiArPSBvdGhlci5tYXBMZW47CgkJbWFwQ29zICs9IG90aGVyLm1hcENvczsKCQl1bm9yZGVyZWREb3QgKz0gb3RoZXIudW5vcmRlcmVkRG90OwoJCXVub3JkZXJlZExlbiArPSBvdGhlci51bm9yZGVyZWRMZW47CgkJdW5vcmRlcmVkQ29zICs9IG90aGVyLnVub3JkZXJlZENvczsKCQljbGFzc0RvdCArPSBvdGhlci5jbGFzc0RvdDsKCQljbGFzc0xlbiArPSBvdGhlci5jbGFzc0xlbjsKCQljbGFzc0NvcyArPSBvdGhlci5jbGFzc0NvczsKCX0KCXZvaWQgc3ViKEJlbmNobWFyayBvdGhlcikgewoJCXZlY3RvckRvdCAtPSBvdGhlci52ZWN0b3JEb3Q7CgkJdmVjdG9yTGVuIC09IG90aGVyLnZlY3RvckxlbjsKCQl2ZWN0b3JDb3MgLT0gb3RoZXIudmVjdG9yQ29zOwoJCW1hcERvdCAtPSBvdGhlci5tYXBEb3Q7CgkJbWFwTGVuIC09IG90aGVyLm1hcExlbjsKCQltYXBDb3MgLT0gb3RoZXIubWFwQ29zOwoJCXVub3JkZXJlZERvdCAtPSBvdGhlci51bm9yZGVyZWREb3Q7CgkJdW5vcmRlcmVkTGVuIC09IG90aGVyLnVub3JkZXJlZExlbjsKCQl1bm9yZGVyZWRDb3MgLT0gb3RoZXIudW5vcmRlcmVkQ29zOwoJCWNsYXNzRG90IC09IG90aGVyLmNsYXNzRG90OwoJCWNsYXNzTGVuIC09IG90aGVyLmNsYXNzTGVuOwoJCWNsYXNzQ29zIC09IG90aGVyLmNsYXNzQ29zOwoJfQoJdm9pZCBtdWwoZG91YmxlIGZhY3RvcikgewoJCXZlY3RvckRvdCAqPSBmYWN0b3I7CgkJdmVjdG9yTGVuICo9IGZhY3RvcjsKCQl2ZWN0b3JDb3MgKj0gZmFjdG9yOwoJCW1hcERvdCAqPSBmYWN0b3I7CgkJbWFwTGVuICo9IGZhY3RvcjsKCQltYXBDb3MgKj0gZmFjdG9yOwoJCXVub3JkZXJlZERvdCAqPSBmYWN0b3I7CgkJdW5vcmRlcmVkTGVuICo9IGZhY3RvcjsKCQl1bm9yZGVyZWRDb3MgKj0gZmFjdG9yOwoJCWNsYXNzRG90ICo9IGZhY3RvcjsKCQljbGFzc0xlbiAqPSBmYWN0b3I7CgkJY2xhc3NDb3MgKj0gZmFjdG9yOwoJfQoKCXRlbXBsYXRlPGNsYXNzIE9TdHJlYW0+CglmcmllbmQgT1N0cmVhbSYgb3BlcmF0b3I8PCAoT1N0cmVhbSYgb3MsIGNvbnN0IEJlbmNobWFyayYgbykgewoJCW9zIDw8ICIgIHBhaXJzIHQoZG90KTogIiA8PCBvLnZlY3RvckRvdCA8PCAiLCB0KGxlbjIpOiAiIDw8IG8udmVjdG9yTGVuIDw8ICIsIHQoY29zKTogIiA8PCBvLnZlY3RvckNvcyA8PCBzdGQ6OmVuZGw7CgkJb3MgPDwgIiAgbWFwJ2QgLyBwYWlycyBkb3Q6ICIgPDwgby5tYXBEb3QgLyBvLnZlY3RvckRvdCA8PCAiLCBsZW4yOiAiIDw8IG8ubWFwTGVuIC8gby52ZWN0b3JMZW4gPDwgIiwgY29zOiAiIDw8IG8ubWFwQ29zIC8gby52ZWN0b3JDb3MgPDwgc3RkOjplbmRsOwoJCW9zIDw8ICIgIGhhc2htIC8gcGFpcnMgZG90OiAiIDw8IG8udW5vcmRlcmVkRG90IC8gby52ZWN0b3JEb3QgPDwgIiwgbGVuMjogIiA8PCBvLnVub3JkZXJlZExlbiAvIG8udmVjdG9yTGVuIDw8ICIsIGNvczogIiA8PCBvLnVub3JkZXJlZENvcyAvIG8udmVjdG9yQ29zIDw8IHN0ZDo6ZW5kbDsKCQlvcyA8PCAiICBjbGFzcyAvIHBhaXJzIGRvdDogIiA8PCBvLmNsYXNzRG90IC8gby52ZWN0b3JEb3QgPDwgIiwgbGVuMjogIiA8PCBvLmNsYXNzTGVuIC8gby52ZWN0b3JMZW4gPDwgIiwgY29zOiAiIDw8IG8uY2xhc3NDb3MgLyBvLnZlY3RvckNvcyA8PCBzdGQ6OmVuZGw7CgkJcmV0dXJuIG9zOwoJfQp9OwojZW5kaWYKCnZvaWQgUnVuQmVuY2htYXJrKHNpemVfdCBELCBmbG9hdCBSYXRpbywgc2l6ZV90IFJ1bkNvdW50LCBzdGQ6Om10MTk5MzcmIGcpOwoKaW50IG1haW4oKSB7Cgljb25zdCBzaXplX3QgRCA9IDE2OTY0NzsKCWNvbnN0IGZsb2F0IFJhdGlvID0gMC4wNWY7Cgljb25zdCBzaXplX3QgUnVuQ291bnQgPSAxMDsKCgkvL3N0ZDo6cmFuZG9tX2RldmljZSByZDsKCS8vc3RkOjptdDE5OTM3IGcocmQoKSk7CglzdGQ6Om10MTk5MzcgZygweEMwRkZFRSk7CgoJZm9yKGludCBsYXN0ID0gMSwgY3VyID0gMTsgY3VyIDw9IDU7IGxhc3QgKz0gY3VyLCBzdGQ6OnN3YXAobGFzdCwgY3VyKSkKCQlSdW5CZW5jaG1hcmsoRCwgUmF0aW8gKiBjdXIsIFJ1bkNvdW50LCBnKTsKCglyZXR1cm4gMDsKfQoKdm9sYXRpbGUgZmxvYXQgc2lkZUVmZmVjdE9ubHkgPSAwOwp2b2lkIFJ1bkJlbmNobWFyayhzaXplX3QgRCwgZmxvYXQgUmF0aW8sIHNpemVfdCBSdW5Db3VudCwgc3RkOjptdDE5OTM3JiBnKSB7CglzdGQ6OnZlY3RvcjxzaXplX3Q+IGluZGljZXM7Cgl7CgkJaW5kaWNlcy5yZXNpemUoRCk7CgkJZm9yKHNpemVfdCBpID0gMDsgaSA8IEQ7ICsraSkKCQkJaW5kaWNlc1tpXSA9IGk7Cgl9CgkvLyBHZW5lcmF0ZXMgdHdvIHNwYXJzZSByYW5kb20gdmVjdG9ycyB3aXRoIG9uIGF2ZXJhZ2UgcmF0aW8gKiBEIGVudHJpZXMKCWF1dG8gR2VuZXJhdGVJbnB1dCA9IFsmaW5kaWNlcywgJmddKGZsb2F0IHJhdGlvLCBzdGQ6OnZlY3RvcjxzdGQ6OnBhaXI8c2l6ZV90LCBmbG9hdD4+JiBhLCBzdGQ6OnZlY3RvcjxzdGQ6OnBhaXI8c2l6ZV90LCBmbG9hdD4+JiBiKSB7CgkJaWYoaW5kaWNlcy5zaXplKCkgPT0gMCkgewoJCQlhLnJlc2l6ZSgwKTsKCQkJYi5yZXNpemUoMCk7CgkJCXJldHVybjsKCQl9CgoJCS8vIGRldGVybWluZSBudW1iZXIgb2YgZW50cmllcwoJCXR5cGVkZWYgc3RkOjpub3JtYWxfZGlzdHJpYnV0aW9uPGZsb2F0PiBub3JtX3Q7CgkJbm9ybV90IG5yYW5kOwoJCW5vcm1fdDo6cGFyYW1fdHlwZSBucGFyYW0ocmF0aW8gKiAoZmxvYXQpaW5kaWNlcy5zaXplKCksIDMuMGYpOwoJCWZsb2F0IHNpemVBID0gc3RkOjptaW4oKGZsb2F0KWluZGljZXMuc2l6ZSgpLCBzdGQ6Om1heCgxLjBmLCBucmFuZChnLCBucGFyYW0pKSk7CgkJZmxvYXQgc2l6ZUIgPSBzdGQ6Om1pbigoZmxvYXQpaW5kaWNlcy5zaXplKCksIHN0ZDo6bWF4KDEuMGYsIG5yYW5kKGcsIG5wYXJhbSkpKTsKCQlhLnJlc2l6ZSgoc2l6ZV90KXNpemVBKTsKCQliLnJlc2l6ZSgoc2l6ZV90KXNpemVCKTsKCgkJLy8gZGV0ZXJtaW5lIHZhbHVlcyBvZiBlbnRyaWVzCgkJdHlwZWRlZiBzdGQ6OnVuaWZvcm1fcmVhbF9kaXN0cmlidXRpb248ZmxvYXQ+IHVuaWZvcm1fdDsKCQl1bmlmb3JtX3QgdXJhbmQ7CgkJc2h1ZmZsZUsoJmluZGljZXNbMF0sICZpbmRpY2VzWzBdICsgaW5kaWNlcy5zaXplKCksIGluZGljZXMuc2l6ZSgpLCBnKTsKCQlmb3Ioc2l6ZV90IGkgPSAwOyBpIDwgYS5zaXplKCk7ICsraSkKCQkJYVtpXSA9IHN0ZDo6bWFrZV9wYWlyKGluZGljZXNbaV0sIHVyYW5kKGcsIHVuaWZvcm1fdDo6cGFyYW1fdHlwZSgtMTMuMzdmLCAxMy4zN2YpKSk7CgkJc2h1ZmZsZUsoJmluZGljZXNbMF0sICZpbmRpY2VzWzBdICsgaW5kaWNlcy5zaXplKCksIGluZGljZXMuc2l6ZSgpLCBnKTsKCQlmb3Ioc2l6ZV90IGkgPSAwOyBpIDwgYi5zaXplKCk7ICsraSkKCQkJYltpXSA9IHN0ZDo6bWFrZV9wYWlyKGluZGljZXNbaV0sIHVyYW5kKGcsIHVuaWZvcm1fdDo6cGFyYW1fdHlwZSgtMTMuMzdmLCAxMy4zN2YpKSk7CgoJCWF1dG8gcHJlZCA9IFtdKHN0ZDo6cGFpcjxzaXplX3QsIGZsb2F0PiBsaHMsIHN0ZDo6cGFpcjxzaXplX3QsIGZsb2F0PiByaHMpIC0+IGJvb2wgeyByZXR1cm4gbGhzLmZpcnN0IDwgcmhzLmZpcnN0OyB9OwoJCXN0ZDo6c29ydCgmYVswXSwgJmFbMF0gKyBhLnNpemUoKSwgcHJlZCk7CgkJc3RkOjpzb3J0KCZiWzBdLCAmYlswXSArIGIuc2l6ZSgpLCBwcmVkKTsKCX07CgojaWYgQkVOQ0hNQVJLCgljb25zdCBzaXplX3QgQmVuY2htYXJrRG90ID0gMywgQmVuY2htYXJrTGVuID0gMTAsIEJlbmNobWFya0NvcyA9IDM7CglzdGQ6OnZlY3RvcjxCZW5jaG1hcms+IGJlbmNobWFya3M7Cgl0eXBlZGVmIHN0ZDo6Y2hyb25vOjpoaWdoX3Jlc29sdXRpb25fY2xvY2sgQ2xvY2s7CglhdXRvIGludGVydmFsQXNTZWNvbmRzID0gW10oQ2xvY2s6OnRpbWVfcG9pbnQgdDAsIENsb2NrOjp0aW1lX3BvaW50IHQxKSAtPiBkb3VibGUgeyByZXR1cm4gMWUtOSAqIHN0ZDo6Y2hyb25vOjpkdXJhdGlvbl9jYXN0PHN0ZDo6Y2hyb25vOjpuYW5vc2Vjb25kcz4odDEgLSB0MCkuY291bnQoKTsgfTsKCWRvdWJsZSB0TWFwRG90U3BlY2lhbE1pbiA9IDAsIHRNYXBEb3RTcGVjaWFsQXZnID0gMCwgdE1hcERvdFNwZWNpYWxNYXggPSAwOwoJZG91YmxlIHRDbGFzc0Nvc1NwZWNpYWxNaW4gPSAwLCB0Q2xhc3NDb3NTcGVjaWFsQXZnID0gMCwgdENsYXNzQ29zU3BlY2lhbE1heCA9IDA7CiNlbmRpZgoJc3RkOjp2ZWN0b3I8c3RkOjpwYWlyPHNpemVfdCwgZmxvYXQ+PiBhLCBiOwoJYS5yZXNlcnZlKGluZGljZXMuc2l6ZSgpKTsKCWIucmVzZXJ2ZShpbmRpY2VzLnNpemUoKSk7Cglmb3Ioc2l6ZV90IHJ1biA9IDA7IHJ1biA8IFJ1bkNvdW50OyArK3J1bikgewoJCUdlbmVyYXRlSW5wdXQoUmF0aW8sIGEsIGIpOwoKCQkvLyA9PT09PT09PT09PT09IE1BUCA9PT09PT09PT09PT09PQoJCXN0ZDo6bWFwPHNpemVfdCwgZmxvYXQ+IG1BLCBtQjsKCQlmb3IoYXV0byBwYWlyIDogYSkgbUEuaW5zZXJ0KHBhaXIpOwoJCWZvcihhdXRvIHBhaXIgOiBiKSBtQi5pbnNlcnQocGFpcik7CgkJYXNzZXJ0KG1BLnNpemUoKSA9PSBhLnNpemUoKSAmJiBtQi5zaXplKCkgPT0gYi5zaXplKCkpOwoJCS8vIHdhcm0tdXAKCQljb25zdCBmbG9hdCBtYXBEb3QgPSBEb3QobUEsIG1CKTsKCQljb25zdCBmbG9hdCBtYXBDb3MgPSBDb3NpbmVEaXN0YW5jZShtQSwgbUIpOwojaWYgQkVOQ0hNQVJLCgkJc3RkOjpjaHJvbm86OnRpbWVfcG9pbnQ8Q2xvY2s+IHQwLCB0MTsKCQlCZW5jaG1hcmsgYmVuY2htYXJrID0ge307CgkJdDAgPSBDbG9jazo6bm93KCk7CgkJZm9yKHNpemVfdCBpID0gMDsgaSA8IEJlbmNobWFya0RvdDsgKytpKQoJCQlzaWRlRWZmZWN0T25seSArPSBEb3QobUEsIG1CKTsKCQl0MSA9IENsb2NrOjpub3coKTsKCQliZW5jaG1hcmsubWFwRG90ID0gaW50ZXJ2YWxBc1NlY29uZHModDAsIHQxKTsKCQl0MCA9IENsb2NrOjpub3coKTsKCQlmb3Ioc2l6ZV90IGkgPSAwOyBpIDwgQmVuY2htYXJrTGVuOyArK2kpIHsKCQkJc2lkZUVmZmVjdE9ubHkgKz0gTGVuU3FyKG1BKTsKCQkJc2lkZUVmZmVjdE9ubHkgKz0gTGVuU3FyKG1CKTsKCQl9CgkJdDEgPSBDbG9jazo6bm93KCk7CgkJYmVuY2htYXJrLm1hcExlbiA9IGludGVydmFsQXNTZWNvbmRzKHQwLCB0MSk7CgkJdDAgPSBDbG9jazo6bm93KCk7CgkJZm9yKHNpemVfdCBpID0gMDsgaSA8IEJlbmNobWFya0NvczsgKytpKQoJCQlzaWRlRWZmZWN0T25seSArPSBDb3NpbmVEaXN0YW5jZShtQSwgbUIpOwoJCXQxID0gQ2xvY2s6Om5vdygpOwoJCWJlbmNobWFyay5tYXBDb3MgPSBpbnRlcnZhbEFzU2Vjb25kcyh0MCwgdDEpOwojZW5kaWYKCgkJLy8gPT09PT09PT09PT09PSBVTk9SREVSRUQgTUFQID09PT09PT09PT09PT09CgkJc3RkOjp1bm9yZGVyZWRfbWFwPHNpemVfdCwgZmxvYXQ+IHVBLCB1QjsKCQlmb3IoYXV0byBwYWlyIDogYSkgdUEuaW5zZXJ0KHBhaXIpOwoJCWZvcihhdXRvIHBhaXIgOiBiKSB1Qi5pbnNlcnQocGFpcik7CgkJYXNzZXJ0KHVBLnNpemUoKSA9PSBhLnNpemUoKSAmJiB1Qi5zaXplKCkgPT0gYi5zaXplKCkpOwoJCWNvbnN0IGZsb2F0IHVub3JkZXJlZERvdCA9IERvdCh1QSwgdUIpOwoJCWNvbnN0IGZsb2F0IHVub3JkZXJlZENvcyA9IENvc2luZURpc3RhbmNlKHVBLCB1Qik7CiNpZiBCRU5DSE1BUksKCQl0MCA9IENsb2NrOjpub3coKTsKCQlmb3Ioc2l6ZV90IGkgPSAwOyBpIDwgQmVuY2htYXJrRG90OyArK2kpCgkJCXNpZGVFZmZlY3RPbmx5ICs9IERvdCh1QSwgdUIpOwoJCXQxID0gQ2xvY2s6Om5vdygpOwoJCWJlbmNobWFyay51bm9yZGVyZWREb3QgPSBpbnRlcnZhbEFzU2Vjb25kcyh0MCwgdDEpOwoJCXQwID0gQ2xvY2s6Om5vdygpOwoJCWZvcihzaXplX3QgaSA9IDA7IGkgPCBCZW5jaG1hcmtMZW47ICsraSkgewoJCQlzaWRlRWZmZWN0T25seSArPSBMZW5TcXIodUEpOwoJCQlzaWRlRWZmZWN0T25seSArPSBMZW5TcXIodUIpOwoJCX0KCQl0MSA9IENsb2NrOjpub3coKTsKCQliZW5jaG1hcmsudW5vcmRlcmVkTGVuID0gaW50ZXJ2YWxBc1NlY29uZHModDAsIHQxKTsKCQl0MCA9IENsb2NrOjpub3coKTsKCQlmb3Ioc2l6ZV90IGkgPSAwOyBpIDwgQmVuY2htYXJrQ29zOyArK2kpCgkJCXNpZGVFZmZlY3RPbmx5ICs9IENvc2luZURpc3RhbmNlKHVBLCB1Qik7CgkJdDEgPSBDbG9jazo6bm93KCk7CgkJYmVuY2htYXJrLnVub3JkZXJlZENvcyA9IGludGVydmFsQXNTZWNvbmRzKHQwLCB0MSk7CiNlbmRpZgoKCQkvLyA9PT09PT09PT09PT09IFZFQ1RPUiBPRiBQQUlSUyA9PT09PT09PT09PT09PQoJCWNvbnN0IGZsb2F0IHZlY3RvckRvdCA9IERvdChhLCBiKTsKCQljb25zdCBmbG9hdCB2ZWN0b3JDb3MgPSBDb3NpbmVEaXN0YW5jZShhLCBiKTsKI2lmIEJFTkNITUFSSwoJCXQwID0gQ2xvY2s6Om5vdygpOwoJCWZvcihzaXplX3QgaSA9IDA7IGkgPCBCZW5jaG1hcmtEb3Q7ICsraSkKCQkJc2lkZUVmZmVjdE9ubHkgKz0gRG90KGEsIGIpOwoJCXQxID0gQ2xvY2s6Om5vdygpOwoJCWJlbmNobWFyay52ZWN0b3JEb3QgPSBpbnRlcnZhbEFzU2Vjb25kcyh0MCwgdDEpOwoJCXQwID0gQ2xvY2s6Om5vdygpOwoJCWZvcihzaXplX3QgaSA9IDA7IGkgPCBCZW5jaG1hcmtMZW47ICsraSkgewoJCQlzaWRlRWZmZWN0T25seSArPSBMZW5TcXIoYSk7CgkJCXNpZGVFZmZlY3RPbmx5ICs9IExlblNxcihiKTsKCQl9CgkJdDEgPSBDbG9jazo6bm93KCk7CgkJYmVuY2htYXJrLnZlY3RvckxlbiA9IGludGVydmFsQXNTZWNvbmRzKHQwLCB0MSk7CgkJdDAgPSBDbG9jazo6bm93KCk7CgkJZm9yKHNpemVfdCBpID0gMDsgaSA8IEJlbmNobWFya0NvczsgKytpKQoJCQlzaWRlRWZmZWN0T25seSArPSBDb3NpbmVEaXN0YW5jZShhLCBiKTsKCQl0MSA9IENsb2NrOjpub3coKTsKCQliZW5jaG1hcmsudmVjdG9yQ29zID0gaW50ZXJ2YWxBc1NlY29uZHModDAsIHQxKTsKI2VuZGlmCgoJCS8vID09PT09PT09PT09PT0gUEFJUlMgT0YgVkVDVE9SUyA9PT09PT09PT09PT09PQoJCVNwYXJzZVZlY3RvciB2QShpbmRpY2VzLnNpemUoKSwgJmFbMF0sICZhWzBdICsgYS5zaXplKCkpOwoJCVNwYXJzZVZlY3RvciB2QihpbmRpY2VzLnNpemUoKSwgJmJbMF0sICZiWzBdICsgYi5zaXplKCkpOwoJCWNvbnN0IGZsb2F0IGNsYXNzRG90ID0gRG90KHZBLCB2Qik7CgkJY29uc3QgZmxvYXQgY2xhc3NDb3MgPSBDb3NpbmVEaXN0YW5jZSh2QSwgdkIpOwojaWYgQkVOQ0hNQVJLCgkJdDAgPSBDbG9jazo6bm93KCk7CgkJZm9yKHNpemVfdCBpID0gMDsgaSA8IEJlbmNobWFya0RvdDsgKytpKQoJCQlzaWRlRWZmZWN0T25seSArPSBEb3QodkEsIHZCKTsKCQl0MSA9IENsb2NrOjpub3coKTsKCQliZW5jaG1hcmsuY2xhc3NEb3QgPSBpbnRlcnZhbEFzU2Vjb25kcyh0MCwgdDEpOwoJCXQwID0gQ2xvY2s6Om5vdygpOwoJCWZvcihzaXplX3QgaSA9IDA7IGkgPCBCZW5jaG1hcmtMZW47ICsraSkgewoJCQlzaWRlRWZmZWN0T25seSArPSBMZW5TcXIodkEpOwoJCQlzaWRlRWZmZWN0T25seSArPSBMZW5TcXIodkIpOwoJCX0KCQl0MSA9IENsb2NrOjpub3coKTsKCQliZW5jaG1hcmsuY2xhc3NMZW4gPSBpbnRlcnZhbEFzU2Vjb25kcyh0MCwgdDEpOwoJCXQwID0gQ2xvY2s6Om5vdygpOwoJCWZvcihzaXplX3QgaSA9IDA7IGkgPCBCZW5jaG1hcmtDb3M7ICsraSkKCQkJc2lkZUVmZmVjdE9ubHkgKz0gQ29zaW5lRGlzdGFuY2UodkEsIHZCKTsKCQl0MSA9IENsb2NrOjpub3coKTsKCQliZW5jaG1hcmsuY2xhc3NDb3MgPSBpbnRlcnZhbEFzU2Vjb25kcyh0MCwgdDEpOwojZW5kaWYKCgkJLy8gPT09PT09PT09PT09PSBOQUlWRSBNQVAgPT09PT09PT09PT09PT0KCQljb25zdCBmbG9hdCBtYXBEb3RTcGVjaWFsID0gRG90UGFpcnNNYXBwZWQobUEsIG1CKTsKCQkvLyA9PT09PT09PSBET04nVCBUT1VDSCBJVCBUV0lDRSA9PT09PT09PQoJCWNvbnN0IGZsb2F0IGNsYXNzQ29zU3BlY2lhbCA9IFNwYXJzZVZlY3Rvcjo6Q29zaW5lRGlzdGFuY2UodkEsIHZCKTsKI2lmIEJFTkNITUFSSwoJCS8vIG5haXZlIGRvdCBwcm9kdWN0IHdpdGggbWFwCgkJdDAgPSBDbG9jazo6bm93KCk7CgkJZm9yKHNpemVfdCBpID0gMDsgaSA8IEJlbmNobWFya0RvdDsgKytpKQoJCQlzaWRlRWZmZWN0T25seSArPSBEb3RQYWlyc01hcHBlZChtQSwgbUIpOwoJCXQxID0gQ2xvY2s6Om5vdygpOwoJCWRvdWJsZSB0TWFwRG90U3BlY2lhbCA9IGludGVydmFsQXNTZWNvbmRzKHQwLCB0MSk7CgkJLy8gY29zaW5lIGRpc3RhbmNlIGNvbXB1dGF0aW9uIHRvdWNoaW5nIGVhY2ggZWxlbWVudCBqdXN0IG9uY2UKCQl0MCA9IENsb2NrOjpub3coKTsKCQlmb3Ioc2l6ZV90IGkgPSAwOyBpIDwgQmVuY2htYXJrQ29zOyArK2kpCgkJCXNpZGVFZmZlY3RPbmx5ICs9IFNwYXJzZVZlY3Rvcjo6Q29zaW5lRGlzdGFuY2UodkEsIHZCKTsKCQl0MSA9IENsb2NrOjpub3coKTsKCQlkb3VibGUgdENsYXNzQ29zU3BlY2lhbCA9IGludGVydmFsQXNTZWNvbmRzKHQwLCB0MSk7CgkJLy8gYWNjdW11bGF0ZSBzcGVjaWFscwoJCWlmKHJ1biA9PSAwKSB7CgkJCXRNYXBEb3RTcGVjaWFsTWluID0gdE1hcERvdFNwZWNpYWw7CgkJCXRNYXBEb3RTcGVjaWFsQXZnID0gdE1hcERvdFNwZWNpYWw7CgkJCXRNYXBEb3RTcGVjaWFsTWF4ID0gdE1hcERvdFNwZWNpYWw7CgkJCXRDbGFzc0Nvc1NwZWNpYWxNaW4gPSB0Q2xhc3NDb3NTcGVjaWFsOwoJCQl0Q2xhc3NDb3NTcGVjaWFsQXZnID0gdENsYXNzQ29zU3BlY2lhbDsKCQkJdENsYXNzQ29zU3BlY2lhbE1heCA9IHRDbGFzc0Nvc1NwZWNpYWw7CgkJfSBlbHNlIHsKCQkJdE1hcERvdFNwZWNpYWxNaW4gPSBzdGQ6Om1pbih0TWFwRG90U3BlY2lhbE1pbiwgdE1hcERvdFNwZWNpYWwpOwoJCQl0TWFwRG90U3BlY2lhbEF2ZyArPSB0TWFwRG90U3BlY2lhbDsKCQkJdE1hcERvdFNwZWNpYWxNYXggPSBzdGQ6Om1heCh0TWFwRG90U3BlY2lhbE1heCwgdE1hcERvdFNwZWNpYWwpOwoJCQl0Q2xhc3NDb3NTcGVjaWFsTWluID0gc3RkOjptaW4odENsYXNzQ29zU3BlY2lhbE1pbiwgdENsYXNzQ29zU3BlY2lhbCk7CgkJCXRDbGFzc0Nvc1NwZWNpYWxBdmcgKz0gdENsYXNzQ29zU3BlY2lhbDsKCQkJdENsYXNzQ29zU3BlY2lhbE1heCA9IHN0ZDo6bWF4KHRDbGFzc0Nvc1NwZWNpYWxNYXgsIHRDbGFzc0Nvc1NwZWNpYWwpOwoJCX0KI2VuZGlmCgoJCWF1dG8gZXF1YWwgPSBbXShmbG9hdCBsaHMsIGZsb2F0IHJocykgLT4gYm9vbCB7IHJldHVybiAocmhzIC0gbGhzKSAqIChyaHMgLSBsaHMpIDwgMWUtNGYgKiBzdGQ6Om1heChzdGQ6OmFicyhsaHMpLCBzdGQ6OmFicyhyaHMpKTsgfTsKCQlpZighZXF1YWwodmVjdG9yRG90LCBtYXBEb3QpIHx8ICFlcXVhbCh2ZWN0b3JDb3MsIG1hcENvcykgfHwKCQkgICAhZXF1YWwodmVjdG9yRG90LCB1bm9yZGVyZWREb3QpIHx8ICFlcXVhbCh2ZWN0b3JDb3MsIHVub3JkZXJlZENvcykgfHwKCQkgICAhZXF1YWwodmVjdG9yRG90LCBjbGFzc0RvdCkgfHwgIWVxdWFsKHZlY3RvckNvcywgY2xhc3NDb3MpIHx8CgkJICAgIWVxdWFsKHZlY3RvckRvdCwgbWFwRG90U3BlY2lhbCkgfHwKCQkgICAhZXF1YWwodmVjdG9yQ29zLCBjbGFzc0Nvc1NwZWNpYWwpKSB7CgkJCXN0ZDo6Y291dCA8PCAiVmFsaWRhdGlvbiBmYWlsdXJlIG9uIHJ1biAiIDw8IHJ1biA8PCBzdGQ6OmVuZGw7CgkJCXN0ZDo6Y291dCA8PCAiIHBhaXJzOiBkb3QoYSwgYik6ICIgPDwgRG90KGEsIGIpIDw8ICIsIGNvcyhhLCBiKTogIiA8PCBDb3NpbmVEaXN0YW5jZShhLCBiKSA8PCBzdGQ6OmVuZGw7CgkJCXN0ZDo6Y291dCA8PCAiIG1hcCdkOiBkb3QoYSwgYik6ICIgPDwgRG90KG1BLCBtQikgPDwgIiwgY29zKGEsIGIpOiAiIDw8IENvc2luZURpc3RhbmNlKG1BLCBtQikgPDwgc3RkOjplbmRsOwoJCQlzdGQ6OmNvdXQgPDwgIiBoYXNobTogZG90KGEsIGIpOiAiIDw8IERvdCh1QSwgdUIpIDw8ICIsIGNvcyhhLCBiKTogIiA8PCBDb3NpbmVEaXN0YW5jZSh1QSwgdUIpIDw8IHN0ZDo6ZW5kbDsKCQkJc3RkOjpjb3V0IDw8ICIgY2xhc3M6IGRvdChhLCBiKTogIiA8PCBEb3QodkEsIHZCKSA8PCAiLCBjb3MoYSwgYik6ICIgPDwgQ29zaW5lRGlzdGFuY2UodkEsIHZCKSA8PCBzdGQ6OmVuZGw7CgkJCXN0ZDo6Y291dCA8PCAiIHNwZWNsIG1hcCdkOiBkb3QoYSwgYik6ICIgPDwgbWFwRG90U3BlY2lhbCA8PCBzdGQ6OmVuZGw7CgkJCXN0ZDo6Y291dCA8PCAiIHNwZWNsIGNsYXNzOiBjb3MoYSwgYik6ICIgPDwgY2xhc3NDb3NTcGVjaWFsIDw8IHN0ZDo6ZW5kbDsKI2lmIEJFTkNITUFSSwoJCX0gZWxzZSB7CgkJCWJlbmNobWFya3MucHVzaF9iYWNrKGJlbmNobWFyayk7CiNlbmRpZgoJCX0KCX0KCiNpZiBCRU5DSE1BUksKCWlmKFJ1bkNvdW50ID4gMCAmJiAhYmVuY2htYXJrcy5lbXB0eSgpKSB7CgkJQmVuY2htYXJrIG1pbiA9IGJlbmNobWFya3NbMF0sIGF2ZyA9IG1pbiwgbWF4ID0gbWluOwoJCWZvcihzaXplX3QgaSA9IDE7IGkgPCBiZW5jaG1hcmtzLnNpemUoKTsgKytpKSB7CgkJCW1pbi5taW4oYmVuY2htYXJrc1tpXSk7CgkJCWF2Zy5hZGQoYmVuY2htYXJrc1tpXSk7CgkJCW1heC5tYXgoYmVuY2htYXJrc1tpXSk7CgkJfQoJCWlmKFJ1bkNvdW50IDw9IDIpIHsKCQkJYXZnLm11bCgxLjAgLyBSdW5Db3VudCk7CgkJCXRDbGFzc0Nvc1NwZWNpYWxBdmcgLz0gUnVuQ291bnQ7CgkJfSBlbHNlIHsKCQkJYXZnLnN1YihtaW4pOwoJCQlhdmcuc3ViKG1heCk7CgkJCWF2Zy5tdWwoMS4wIC8gKFJ1bkNvdW50IC0gMikpOwoJCQl0TWFwRG90U3BlY2lhbEF2ZyA9ICh0TWFwRG90U3BlY2lhbEF2ZyAtIHRNYXBEb3RTcGVjaWFsTWluIC0gdE1hcERvdFNwZWNpYWxNYXgpIC8gKFJ1bkNvdW50IC0gMik7CgkJCXRDbGFzc0Nvc1NwZWNpYWxBdmcgPSAodENsYXNzQ29zU3BlY2lhbEF2ZyAtIHRDbGFzc0Nvc1NwZWNpYWxNaW4gLSB0Q2xhc3NDb3NTcGVjaWFsTWF4KSAvIChSdW5Db3VudCAtIDIpOwoJCX0KCgkJc3RkOjpjb3V0IDw8ICIgKioqIEJFTkNITUFSSyAqKiogIiA8PCBzdGQ6OmVuZGw7CgkJc3RkOjpjb3V0IDw8ICJudW1iZXIgb2YgcnVuczogIiA8PCBSdW5Db3VudCA8PCAiLCBkaW1lbnNpb25zOiAiIDw8IEQgPDwgIiBhbmQgbm9uLXplcm8gcmF0aW86ICIgPDwgUmF0aW8gPDwgc3RkOjplbmRsOwoJCXN0ZDo6Y291dCA8PCAibnVtYmVyIG9mIGRvdCBwcm9kdWN0cyBwZXIgcnVuOiAiIDw8IEJlbmNobWFya0RvdCA8PCBzdGQ6OmVuZGw7CgkJc3RkOjpjb3V0IDw8ICJudW1iZXIgb2YgbGVuZ3Roc3FhcmVzIHBlciBydW46ICIgPDwgQmVuY2htYXJrTGVuIDw8IHN0ZDo6ZW5kbDsKCQlzdGQ6OmNvdXQgPDwgIm51bWJlciBvZiBjb3NpbmUgZGlzdHMgcGVyIHJ1bjogIiA8PCBCZW5jaG1hcmtDb3MgPDwgc3RkOjplbmRsOwoJCXN0ZDo6Y291dCA8PCBzdGQ6OmVuZGw7CiNpZiAwCgkJLy8gbWluKHgpIC8gbWluKGJhc2UpIGlzIG5vdCBhIGdvb2QgbWVhc3VyZS4uLgoJCXN0ZDo6Y291dCA8PCAibWluIiA8PCBzdGQ6OmVuZGw7CgkJc3RkOjpjb3V0IDw8IG1pbjsKCQlzdGQ6OmNvdXQgPDwgIiAgc3BlY2wgLyBwYWlycyBkb3QgKG5haXZlIG1hcCk6ICIgPDwgKHRNYXBEb3RTcGVjaWFsTWluIC8gbWluLnZlY3RvckRvdCkgPDwgc3RkOjplbmRsOwoJCXN0ZDo6Y291dCA8PCAiICBzcGVjbCAvIHBhaXJzIGNvcyAob3B0aW1pc2VkKTogIiA8PCAodENsYXNzQ29zU3BlY2lhbE1pbiAvIG1pbi52ZWN0b3JDb3MpIDw8IHN0ZDo6ZW5kbDsKCQlzdGQ6OmNvdXQgPDwgc3RkOjplbmRsOwojZW5kaWYKCQkvLyBhdmcoeCkgLyBhdmcoYmFzZSkKCQlzdGQ6OmNvdXQgPDwgImF2ZyIgPDwgc3RkOjplbmRsOwoJCXN0ZDo6Y291dCA8PCBhdmc7CgkJc3RkOjpjb3V0IDw8ICIgIHNwZWNsIC8gcGFpcnMgZG90IChuYWl2ZSBtYXApOiAiIDw8ICh0TWFwRG90U3BlY2lhbEF2ZyAvIGF2Zy52ZWN0b3JEb3QpIDw8IHN0ZDo6ZW5kbDsKCQlzdGQ6OmNvdXQgPDwgIiAgc3BlY2wgLyBwYWlycyBjb3MgKG9wdGltaXNlZCk6ICIgPDwgKHRDbGFzc0Nvc1NwZWNpYWxBdmcgLyBhdmcudmVjdG9yQ29zKSA8PCBzdGQ6OmVuZGw7CgkJc3RkOjpjb3V0IDw8IHN0ZDo6ZW5kbDsKI2lmIDAKCQkvLyBtYXgoeCkgLyBtYXgoYmFzZSkgaXMgbm90IGEgZ29vZCBtZWFzdXJlLi4uCgkJc3RkOjpjb3V0IDw8ICJtYXgiIDw8IHN0ZDo6ZW5kbDsKCQlzdGQ6OmNvdXQgPDwgbWF4OwoJCXN0ZDo6Y291dCA8PCAiICBzcGVjbCAvIHBhaXJzIGRvdCAobmFpdmUgbWFwKTogIiA8PCAodE1hcERvdFNwZWNpYWxNYXggLyBtYXgudmVjdG9yRG90KSA8PCBzdGQ6OmVuZGw7CgkJc3RkOjpjb3V0IDw8ICIgIHNwZWNsIC8gcGFpcnMgY29zIChvcHRpbWlzZWQpOiAiIDw8ICh0Q2xhc3NDb3NTcGVjaWFsTWF4IC8gbWF4LnZlY3RvckNvcykgPDwgc3RkOjplbmRsOwoJCXN0ZDo6Y291dCA8PCBzdGQ6OmVuZGw7CiNlbmRpZgoJfQojZW5kaWYKfQo=

Success #stdin #stdout 4.57s 3440KB

stdin

copy

Standard input is empty

stdout

copy

 *** BENCHMARK *** 
number of runs: 10, dimensions: 169647 and non-zero ratio: 0.05
number of dot products per run: 3
number of lengthsqares per run: 10
number of cosine dists per run: 3

avg
  pairs t(dot): 0.000327096, t(len2): 0.000311987, t(cos): 0.000407925
  map'd / pairs dot: 3.31911, len2: 7.33166, cos: 4.17641
  hashm / pairs dot: 3.50114, len2: 2.28485, cos: 3.32586
  class / pairs dot: 1.03311, len2: 0.993495, cos: 1.06469
  specl / pairs dot (naive map): 8.52663
  specl / pairs cos (optimised): 0.960054

 *** BENCHMARK *** 
number of runs: 10, dimensions: 169647 and non-zero ratio: 0.1
number of dot products per run: 3
number of lengthsqares per run: 10
number of cosine dists per run: 3

avg
  pairs t(dot): 0.000665155, t(len2): 0.000643923, t(cos): 0.000826484
  map'd / pairs dot: 3.61124, len2: 7.90967, cos: 4.60001
  hashm / pairs dot: 4.02014, len2: 3.5281, cos: 4.08672
  class / pairs dot: 1.02877, len2: 0.965892, cos: 1.10754
  specl / pairs dot (naive map): 10.1952
  specl / pairs cos (optimised): 0.946074

 *** BENCHMARK *** 
number of runs: 10, dimensions: 169647 and non-zero ratio: 0.15
number of dot products per run: 3
number of lengthsqares per run: 10
number of cosine dists per run: 3

avg
  pairs t(dot): 0.00103057, t(len2): 0.000990735, t(cos): 0.00126902
  map'd / pairs dot: 3.52397, len2: 8.30844, cos: 4.82504
  hashm / pairs dot: 4.93329, len2: 4.31091, cos: 5.00829
  class / pairs dot: 1.01788, len2: 0.937355, cos: 1.05164
  specl / pairs dot (naive map): 10.0939
  specl / pairs cos (optimised): 0.948841

 *** BENCHMARK *** 
number of runs: 10, dimensions: 169647 and non-zero ratio: 0.25
number of dot products per run: 3
number of lengthsqares per run: 10
number of cosine dists per run: 3

avg
  pairs t(dot): 0.00178728, t(len2): 0.00205486, t(cos): 0.00232333
  map'd / pairs dot: 3.69081, len2: 7.66045, cos: 4.8268
  hashm / pairs dot: 5.75653, len2: 5.47987, cos: 6.4527
  class / pairs dot: 1.0306, len2: 0.755855, cos: 1.00221
  specl / pairs dot (naive map): 10.461
  specl / pairs cos (optimised): 0.932331

https://ideone.com/rzznp9

language:

C++14 (gcc 8.3)

created:

visibility:

public

Share or Embed source code

Discover > Sphere Engine API

The brand new service which powers Ideone!

Discover > IDE Widget

Widget for compiling and running the source code in a web browser!

Discover > Sphere Engine API

Discover > IDE Widget

Choose your language