Ideone.com

fork download

copy

#include <bits/stdc++.h>
using namespace std;
 
const auto PI = acos(-1);
 
/**
 * @brief Permutes an array of numbers by the inverse of its binary index.
 * @tparam T The type of value contained in $a$. 
 * @param a A reference to a vector that is to be sorted.
 * @return Nothing.
 * 
 * Changes $a$ by the reverse of the binary representation of each index
 * from $[0, \texttt{a}.size())$. 
 * 
 * For instance, let $a = [0, 1, 2, 3, 4, 5, 6, 7]$. Applying `
 * reverse_bit_sort(a)` would change $a$ into $[0, 4, 2, 6, 1, 5, 3, 7]$. 
 * 
 * Note that the contents of $a$ are modified. 
 */
template<typename T>
void reverse_bit_sort(vector<T> &a) {
	int n = a.size();
	for (int i = 1, j = 0; i < n; i++) {
		// i - current index
		// j - current reversed index
		// t - current bit
		// To transition from i to i + 1, flip
		// all prefix 1s in j and the first set bit.
 
		int t = n >> 1;
		for (; t & j; t >>= 1)
			j ^= t;
		j ^= t;
		if (i < j)
			swap(a[i], a[j]);
	}
}
 
/**
 * @brief Computes the discrete fourier transform of $a$.
 * @tparam T A floating point type, such that $a$ contains `std::complex<T>`.
 * @param a A reference to a vector that is to have the DFT computed.
 * @return Nothing.
 * 
 * Given a polynomial $a = a[0] + a[1]x + a[2]x^2 + \dots = \sum_{i = 0}^{n - 1} a[i]x^i$, 
 * computes a vector $z$ such that $z[i] = a(w_n^i)$ for $i \in [0, n)$; that is, evaluates
 * $a$ at each of the roots of unity for order $n$. 
 * 
 * Note that the contents of $a$ are modified. 
 */
template<typename T> 
typename enable_if<is_floating_point<T>::value, void>::type
fast_fourier_transform(vector<complex<T>> &a) {
	int n = a.size();
 
	// eliminate need for recursion using butterfly transform
	reverse_bit_sort(a); 
 
	// iterate over length of segment
	for (int l = 2; l <= n; l <<= 1) { 
		// l - length of segment
		// theta - angle len
		// dw - change in w
		// i - current block
		// j - current index
		// w - current value
 
		T theta = 2 * PI / l;
		complex<T> dw(cos(theta), sin(theta));
		for (int i = 0; i < n; i += l) { 
			complex<T> w = 1; // trivial root
			for (int j = 0; j < l / 2; j++, w *= dw) {
				auto t1 = a[i + j], t2 = a[i + j + l / 2] * w;
				a[i + j] = t1 + t2, a[i + j + l / 2] = t1 - t2;
			}
		}
	}
}
 
/**
 * @brief Computes the inverse discrete fourier transform of $a$. 
 * @tparam T A floating point type, such that $a$ contains `std::complex<T>`.
 * @param a A reference to a vector that is to have the inverse DFT computed.
 * @return Nothing.
 * 
 * Given a vector $a$ such that $a[i] = p(w_n^i)$ for some polynomial $p$ of
 * degree $n$, computes the vector of coefficients that constitute $p$. In 
 * other words, it interpolates a polynomial evaluated at the roots of unity
 * of order $n$. 
 * 
 * Note that the contents of $a$ are modified. 
 */
template<typename T> 
typename enable_if<is_floating_point<T>::value, void>::type
inverse_fast_fourier_transform(vector<complex<T>> &a) {
	int n = a.size();
 
	// eliminate need for recursion using butterfly transform
	reverse_bit_sort(a);
	for (int l = 2; l <= n; l <<= 1) {
		// l - length of segment
		// theta - angle len (note sign change)
		// dw - change in w
		// i - current block
		// j - current index
		// w - current value
 
		T theta = -2 * PI / l;
		complex<T> dw(cos(theta), sin(theta));
		for (int i = 0; i < n; i += l) {
			complex<T> w = 1;
			for (int j = 0; j < l / 2; j++) {
				auto t1 = a[i + j], t2 = a[i + j + l / 2] * w;
				a[i + j] = t1 + t2;
				a[i + j + l / 2] = t1 - t2;
				w *= dw;
			}
		}
	}
 
	// divide all coefficients by $n$ 
	// (derived from inverse of vandermonde matrix)
	for (int i = 0; i < n; i++)
		a[i] /= n; 
}
 
/**
 * @brief Computes the convolution of two vectors using fast fourier transform.
 * @tparam T The type contained in the vectors.
 * @tparam U A floating point type (defaulted to double) used in FFT.
 * @param a The first vector
 * @param b The second vector
 * @return The convolution of $a$ and $b$. 
 * 
 * Given two vectors $a$ and $b$, computes $c$ such that 
 * $c[i] = \sum_{j = 0}^i a[j]b[i - j]$ for $i \in [0, n + m - 1)$. 
 * 
 * Note that this method runs in $\mathcal{O}(n\log n)$ (as opposed to the $\mathcal{O}(n^2)$
 * naive solution). However, there may be issues with floating-point arithmatics and overflow. 
 * For best results, set `U` to `long double`. 
 */
template<typename T, typename U = double>
vector<T> convolution(const vector<T> &a, const vector<T> &b) {
	vector<complex<U>> pa(a.begin(), a.end()), pb(b.begin(), b.end());
 
	// scale $n$ up to a power of two for divide and conquer to work
	int n = 1;
	while (n < a.size() + b.size()) 
		n <<= 1;
	pa.resize(n), pb.resize(n);
 
	// find discrete fourier transforms of a and b
	fast_fourier_transform(pa);
	fast_fourier_transform(pb);
 
	// compute point product of a and b
	for (int i = 0; i < n; i++)
		pa[i] *= pb[i];
 
	// compute inverse discrete fourier transform
	inverse_fast_fourier_transform(pa);
 
	// return answer (assuming that T is a real type)
	n = a.size() + b.size() - 1;
	vector<T> ret(n);
	for (int i = 0; i < n; i++)
		ret[i] = round(pa[i].real());
	return ret;
}
 
int main() {
	int N, M;
	cin >> N >> M;
	vector<int> A(N + 1), B(M + 1);
	for (int &a : A)
		cin >> a;
	for (int &b : B)
		cin >> b;
	auto C = convolution(A, B);
	for (int c : C)
		cout << c << ' ';
	cout << '\n';
}

I2luY2x1ZGUgPGJpdHMvc3RkYysrLmg+CnVzaW5nIG5hbWVzcGFjZSBzdGQ7Cgpjb25zdCBhdXRvIFBJID0gYWNvcygtMSk7CgovKioKICogQGJyaWVmIFBlcm11dGVzIGFuIGFycmF5IG9mIG51bWJlcnMgYnkgdGhlIGludmVyc2Ugb2YgaXRzIGJpbmFyeSBpbmRleC4KICogQHRwYXJhbSBUIFRoZSB0eXBlIG9mIHZhbHVlIGNvbnRhaW5lZCBpbiAkYSQuIAogKiBAcGFyYW0gYSBBIHJlZmVyZW5jZSB0byBhIHZlY3RvciB0aGF0IGlzIHRvIGJlIHNvcnRlZC4KICogQHJldHVybiBOb3RoaW5nLgogKiAKICogQ2hhbmdlcyAkYSQgYnkgdGhlIHJldmVyc2Ugb2YgdGhlIGJpbmFyeSByZXByZXNlbnRhdGlvbiBvZiBlYWNoIGluZGV4CiAqIGZyb20gJFswLCBcdGV4dHR0e2F9LnNpemUoKSkkLiAKICogCiAqIEZvciBpbnN0YW5jZSwgbGV0ICRhID0gWzAsIDEsIDIsIDMsIDQsIDUsIDYsIDddJC4gQXBwbHlpbmcgYAogKiByZXZlcnNlX2JpdF9zb3J0KGEpYCB3b3VsZCBjaGFuZ2UgJGEkIGludG8gJFswLCA0LCAyLCA2LCAxLCA1LCAzLCA3XSQuIAogKiAKICogTm90ZSB0aGF0IHRoZSBjb250ZW50cyBvZiAkYSQgYXJlIG1vZGlmaWVkLiAKICovCnRlbXBsYXRlPHR5cGVuYW1lIFQ+CnZvaWQgcmV2ZXJzZV9iaXRfc29ydCh2ZWN0b3I8VD4gJmEpIHsKCWludCBuID0gYS5zaXplKCk7Cglmb3IgKGludCBpID0gMSwgaiA9IDA7IGkgPCBuOyBpKyspIHsKCQkvLyBpIC0gY3VycmVudCBpbmRleAoJCS8vIGogLSBjdXJyZW50IHJldmVyc2VkIGluZGV4CgkJLy8gdCAtIGN1cnJlbnQgYml0CgkJLy8gVG8gdHJhbnNpdGlvbiBmcm9tIGkgdG8gaSArIDEsIGZsaXAKCQkvLyBhbGwgcHJlZml4IDFzIGluIGogYW5kIHRoZSBmaXJzdCBzZXQgYml0LgoKCQlpbnQgdCA9IG4gPj4gMTsKCQlmb3IgKDsgdCAmIGo7IHQgPj49IDEpCgkJCWogXj0gdDsKCQlqIF49IHQ7CgkJaWYgKGkgPCBqKQoJCQlzd2FwKGFbaV0sIGFbal0pOwoJfQp9CgovKioKICogQGJyaWVmIENvbXB1dGVzIHRoZSBkaXNjcmV0ZSBmb3VyaWVyIHRyYW5zZm9ybSBvZiAkYSQuCiAqIEB0cGFyYW0gVCBBIGZsb2F0aW5nIHBvaW50IHR5cGUsIHN1Y2ggdGhhdCAkYSQgY29udGFpbnMgYHN0ZDo6Y29tcGxleDxUPmAuCiAqIEBwYXJhbSBhIEEgcmVmZXJlbmNlIHRvIGEgdmVjdG9yIHRoYXQgaXMgdG8gaGF2ZSB0aGUgREZUIGNvbXB1dGVkLgogKiBAcmV0dXJuIE5vdGhpbmcuCiAqIAogKiBHaXZlbiBhIHBvbHlub21pYWwgJGEgPSBhWzBdICsgYVsxXXggKyBhWzJdeF4yICsgXGRvdHMgPSBcc3VtX3tpID0gMH1ee24gLSAxfSBhW2ldeF5pJCwgCiAqIGNvbXB1dGVzIGEgdmVjdG9yICR6JCBzdWNoIHRoYXQgJHpbaV0gPSBhKHdfbl5pKSQgZm9yICRpIFxpbiBbMCwgbikkOyB0aGF0IGlzLCBldmFsdWF0ZXMKICogJGEkIGF0IGVhY2ggb2YgdGhlIHJvb3RzIG9mIHVuaXR5IGZvciBvcmRlciAkbiQuIAogKiAKICogTm90ZSB0aGF0IHRoZSBjb250ZW50cyBvZiAkYSQgYXJlIG1vZGlmaWVkLiAKICovCnRlbXBsYXRlPHR5cGVuYW1lIFQ+IAp0eXBlbmFtZSBlbmFibGVfaWY8aXNfZmxvYXRpbmdfcG9pbnQ8VD46OnZhbHVlLCB2b2lkPjo6dHlwZQpmYXN0X2ZvdXJpZXJfdHJhbnNmb3JtKHZlY3Rvcjxjb21wbGV4PFQ+PiAmYSkgewoJaW50IG4gPSBhLnNpemUoKTsKCgkvLyBlbGltaW5hdGUgbmVlZCBmb3IgcmVjdXJzaW9uIHVzaW5nIGJ1dHRlcmZseSB0cmFuc2Zvcm0KCXJldmVyc2VfYml0X3NvcnQoYSk7IAoKCS8vIGl0ZXJhdGUgb3ZlciBsZW5ndGggb2Ygc2VnbWVudAoJZm9yIChpbnQgbCA9IDI7IGwgPD0gbjsgbCA8PD0gMSkgeyAKCQkvLyBsIC0gbGVuZ3RoIG9mIHNlZ21lbnQKCQkvLyB0aGV0YSAtIGFuZ2xlIGxlbgoJCS8vIGR3IC0gY2hhbmdlIGluIHcKCQkvLyBpIC0gY3VycmVudCBibG9jawoJCS8vIGogLSBjdXJyZW50IGluZGV4CgkJLy8gdyAtIGN1cnJlbnQgdmFsdWUKCgkJVCB0aGV0YSA9IDIgKiBQSSAvIGw7CgkJY29tcGxleDxUPiBkdyhjb3ModGhldGEpLCBzaW4odGhldGEpKTsKCQlmb3IgKGludCBpID0gMDsgaSA8IG47IGkgKz0gbCkgeyAKCQkJY29tcGxleDxUPiB3ID0gMTsgLy8gdHJpdmlhbCByb290CgkJCWZvciAoaW50IGogPSAwOyBqIDwgbCAvIDI7IGorKywgdyAqPSBkdykgewoJCQkJYXV0byB0MSA9IGFbaSArIGpdLCB0MiA9IGFbaSArIGogKyBsIC8gMl0gKiB3OwoJCQkJYVtpICsgal0gPSB0MSArIHQyLCBhW2kgKyBqICsgbCAvIDJdID0gdDEgLSB0MjsKCQkJfQoJCX0KCX0KfQoKLyoqCiAqIEBicmllZiBDb21wdXRlcyB0aGUgaW52ZXJzZSBkaXNjcmV0ZSBmb3VyaWVyIHRyYW5zZm9ybSBvZiAkYSQuIAogKiBAdHBhcmFtIFQgQSBmbG9hdGluZyBwb2ludCB0eXBlLCBzdWNoIHRoYXQgJGEkIGNvbnRhaW5zIGBzdGQ6OmNvbXBsZXg8VD5gLgogKiBAcGFyYW0gYSBBIHJlZmVyZW5jZSB0byBhIHZlY3RvciB0aGF0IGlzIHRvIGhhdmUgdGhlIGludmVyc2UgREZUIGNvbXB1dGVkLgogKiBAcmV0dXJuIE5vdGhpbmcuCiAqIAogKiBHaXZlbiBhIHZlY3RvciAkYSQgc3VjaCB0aGF0ICRhW2ldID0gcCh3X25eaSkkIGZvciBzb21lIHBvbHlub21pYWwgJHAkIG9mCiAqIGRlZ3JlZSAkbiQsIGNvbXB1dGVzIHRoZSB2ZWN0b3Igb2YgY29lZmZpY2llbnRzIHRoYXQgY29uc3RpdHV0ZSAkcCQuIEluIAogKiBvdGhlciB3b3JkcywgaXQgaW50ZXJwb2xhdGVzIGEgcG9seW5vbWlhbCBldmFsdWF0ZWQgYXQgdGhlIHJvb3RzIG9mIHVuaXR5CiAqIG9mIG9yZGVyICRuJC4gCiAqIAogKiBOb3RlIHRoYXQgdGhlIGNvbnRlbnRzIG9mICRhJCBhcmUgbW9kaWZpZWQuIAogKi8KdGVtcGxhdGU8dHlwZW5hbWUgVD4gCnR5cGVuYW1lIGVuYWJsZV9pZjxpc19mbG9hdGluZ19wb2ludDxUPjo6dmFsdWUsIHZvaWQ+Ojp0eXBlCmludmVyc2VfZmFzdF9mb3VyaWVyX3RyYW5zZm9ybSh2ZWN0b3I8Y29tcGxleDxUPj4gJmEpIHsKCWludCBuID0gYS5zaXplKCk7CgoJLy8gZWxpbWluYXRlIG5lZWQgZm9yIHJlY3Vyc2lvbiB1c2luZyBidXR0ZXJmbHkgdHJhbnNmb3JtCglyZXZlcnNlX2JpdF9zb3J0KGEpOwoJZm9yIChpbnQgbCA9IDI7IGwgPD0gbjsgbCA8PD0gMSkgewoJCS8vIGwgLSBsZW5ndGggb2Ygc2VnbWVudAoJCS8vIHRoZXRhIC0gYW5nbGUgbGVuIChub3RlIHNpZ24gY2hhbmdlKQoJCS8vIGR3IC0gY2hhbmdlIGluIHcKCQkvLyBpIC0gY3VycmVudCBibG9jawoJCS8vIGogLSBjdXJyZW50IGluZGV4CgkJLy8gdyAtIGN1cnJlbnQgdmFsdWUKCgkJVCB0aGV0YSA9IC0yICogUEkgLyBsOwoJCWNvbXBsZXg8VD4gZHcoY29zKHRoZXRhKSwgc2luKHRoZXRhKSk7CgkJZm9yIChpbnQgaSA9IDA7IGkgPCBuOyBpICs9IGwpIHsKCQkJY29tcGxleDxUPiB3ID0gMTsKCQkJZm9yIChpbnQgaiA9IDA7IGogPCBsIC8gMjsgaisrKSB7CgkJCQlhdXRvIHQxID0gYVtpICsgal0sIHQyID0gYVtpICsgaiArIGwgLyAyXSAqIHc7CgkJCQlhW2kgKyBqXSA9IHQxICsgdDI7CgkJCQlhW2kgKyBqICsgbCAvIDJdID0gdDEgLSB0MjsKCQkJCXcgKj0gZHc7CgkJCX0KCQl9Cgl9CgoJLy8gZGl2aWRlIGFsbCBjb2VmZmljaWVudHMgYnkgJG4kIAoJLy8gKGRlcml2ZWQgZnJvbSBpbnZlcnNlIG9mIHZhbmRlcm1vbmRlIG1hdHJpeCkKCWZvciAoaW50IGkgPSAwOyBpIDwgbjsgaSsrKQoJCWFbaV0gLz0gbjsgCn0KCi8qKgogKiBAYnJpZWYgQ29tcHV0ZXMgdGhlIGNvbnZvbHV0aW9uIG9mIHR3byB2ZWN0b3JzIHVzaW5nIGZhc3QgZm91cmllciB0cmFuc2Zvcm0uCiAqIEB0cGFyYW0gVCBUaGUgdHlwZSBjb250YWluZWQgaW4gdGhlIHZlY3RvcnMuCiAqIEB0cGFyYW0gVSBBIGZsb2F0aW5nIHBvaW50IHR5cGUgKGRlZmF1bHRlZCB0byBkb3VibGUpIHVzZWQgaW4gRkZULgogKiBAcGFyYW0gYSBUaGUgZmlyc3QgdmVjdG9yCiAqIEBwYXJhbSBiIFRoZSBzZWNvbmQgdmVjdG9yCiAqIEByZXR1cm4gVGhlIGNvbnZvbHV0aW9uIG9mICRhJCBhbmQgJGIkLiAKICogCiAqIEdpdmVuIHR3byB2ZWN0b3JzICRhJCBhbmQgJGIkLCBjb21wdXRlcyAkYyQgc3VjaCB0aGF0IAogKiAkY1tpXSA9IFxzdW1fe2ogPSAwfV5pIGFbal1iW2kgLSBqXSQgZm9yICRpIFxpbiBbMCwgbiArIG0gLSAxKSQuIAogKiAKICogTm90ZSB0aGF0IHRoaXMgbWV0aG9kIHJ1bnMgaW4gJFxtYXRoY2Fse099KG5cbG9nIG4pJCAoYXMgb3Bwb3NlZCB0byB0aGUgJFxtYXRoY2Fse099KG5eMikkCiAqIG5haXZlIHNvbHV0aW9uKS4gSG93ZXZlciwgdGhlcmUgbWF5IGJlIGlzc3VlcyB3aXRoIGZsb2F0aW5nLXBvaW50IGFyaXRobWF0aWNzIGFuZCBvdmVyZmxvdy4gCiAqIEZvciBiZXN0IHJlc3VsdHMsIHNldCBgVWAgdG8gYGxvbmcgZG91YmxlYC4gCiAqLwp0ZW1wbGF0ZTx0eXBlbmFtZSBULCB0eXBlbmFtZSBVID0gZG91YmxlPgp2ZWN0b3I8VD4gY29udm9sdXRpb24oY29uc3QgdmVjdG9yPFQ+ICZhLCBjb25zdCB2ZWN0b3I8VD4gJmIpIHsKCXZlY3Rvcjxjb21wbGV4PFU+PiBwYShhLmJlZ2luKCksIGEuZW5kKCkpLCBwYihiLmJlZ2luKCksIGIuZW5kKCkpOwoKCS8vIHNjYWxlICRuJCB1cCB0byBhIHBvd2VyIG9mIHR3byBmb3IgZGl2aWRlIGFuZCBjb25xdWVyIHRvIHdvcmsKCWludCBuID0gMTsKCXdoaWxlIChuIDwgYS5zaXplKCkgKyBiLnNpemUoKSkgCgkJbiA8PD0gMTsKCXBhLnJlc2l6ZShuKSwgcGIucmVzaXplKG4pOwoJCgkvLyBmaW5kIGRpc2NyZXRlIGZvdXJpZXIgdHJhbnNmb3JtcyBvZiBhIGFuZCBiCglmYXN0X2ZvdXJpZXJfdHJhbnNmb3JtKHBhKTsKCWZhc3RfZm91cmllcl90cmFuc2Zvcm0ocGIpOwoKCS8vIGNvbXB1dGUgcG9pbnQgcHJvZHVjdCBvZiBhIGFuZCBiCglmb3IgKGludCBpID0gMDsgaSA8IG47IGkrKykKCQlwYVtpXSAqPSBwYltpXTsKCgkvLyBjb21wdXRlIGludmVyc2UgZGlzY3JldGUgZm91cmllciB0cmFuc2Zvcm0KCWludmVyc2VfZmFzdF9mb3VyaWVyX3RyYW5zZm9ybShwYSk7CgoJLy8gcmV0dXJuIGFuc3dlciAoYXNzdW1pbmcgdGhhdCBUIGlzIGEgcmVhbCB0eXBlKQoJbiA9IGEuc2l6ZSgpICsgYi5zaXplKCkgLSAxOwoJdmVjdG9yPFQ+IHJldChuKTsKCWZvciAoaW50IGkgPSAwOyBpIDwgbjsgaSsrKQoJCXJldFtpXSA9IHJvdW5kKHBhW2ldLnJlYWwoKSk7CglyZXR1cm4gcmV0Owp9CgppbnQgbWFpbigpIHsKCWludCBOLCBNOwoJY2luID4+IE4gPj4gTTsKCXZlY3RvcjxpbnQ+IEEoTiArIDEpLCBCKE0gKyAxKTsKCWZvciAoaW50ICZhIDogQSkKCQljaW4gPj4gYTsKCWZvciAoaW50ICZiIDogQikKCQljaW4gPj4gYjsKCWF1dG8gQyA9IGNvbnZvbHV0aW9uKEEsIEIpOwoJZm9yIChpbnQgYyA6IEMpCgkJY291dCA8PCBjIDw8ICcgJzsKCWNvdXQgPDwgJ1xuJzsKfQ==

Runtime error #stdin #stdout 0.75s 1828684KB

stdin

copy

Standard input is empty

stdout

copy

Standard output is empty

https://ideone.com/fYB5iv

language:

C++14 (gcc 8.3)

created:

visibility:

public

Share or Embed source code

Discover > Sphere Engine API

The brand new service which powers Ideone!

Discover > IDE Widget

Widget for compiling and running the source code in a web browser!

Discover > Sphere Engine API

Discover > IDE Widget

Choose your language