DSP/DSP_Lib_TestSuite/RefLibs/src/ComplexMathFunctions/cmplx_dot_prod.c - third_party/github/STMicroelectronics/cmsis_core - Git at Google

 #include "ref.h"

 void ref_cmplx_dot_prod_f32(
   float32_t * pSrcA,
   float32_t * pSrcB,
   uint32_t numSamples,
   float32_t * realResult,
   float32_t * imagResult)
 {
 	float32_t sumr, sumi;
 	uint32_t i;

 	sumr = 0;
 	sumi = 0;

 	for(i=0;i<numSamples*2;i+=2)
 	{
 		sumr += pSrcA[i] * pSrcB[i]   - pSrcA[i+1] * pSrcB[i+1];
 		sumi += pSrcA[i] * pSrcB[i+1] + pSrcA[i+1] * pSrcB[i];
 	}

 	*realResult = sumr;
 	*imagResult = sumi;
 }

 void ref_cmplx_dot_prod_q31(
   q31_t * pSrcA,
   q31_t * pSrcB,
   uint32_t numSamples,
   q63_t * realResult,
   q63_t * imagResult)
 {
 	q63_t sumr, sumi;
 	uint32_t i;

 	sumr = 0;
 	sumi = 0;

 	for(i=0;i<numSamples*2;i+=2)
 	{
 		//shifting down 14 here to provide guard bits
 		sumr += (((q63_t)pSrcA[i] * pSrcB[i]  ) >> 14) - (((q63_t)pSrcA[i+1] * pSrcB[i+1]) >> 14);
 		sumi += (((q63_t)pSrcA[i] * pSrcB[i+1]) >> 14) + (((q63_t)pSrcA[i+1] * pSrcB[i]  ) >> 14);
 	}

 	*realResult = sumr;
 	*imagResult = sumi;
 }

 void ref_cmplx_dot_prod_q15(
   q15_t * pSrcA,
   q15_t * pSrcB,
   uint32_t numSamples,
   q31_t * realResult,
   q31_t * imagResult)
 {
 	q63_t sumr, sumi;
 	uint32_t i;

 	sumr = 0;
 	sumi = 0;

 	for(i=0;i<numSamples*2;i+=2)
 	{
 		sumr += (q31_t)pSrcA[i] * pSrcB[i]   - (q31_t)pSrcA[i+1] * pSrcB[i+1];
 		sumi += (q31_t)pSrcA[i] * pSrcB[i+1] + (q31_t)pSrcA[i+1] * pSrcB[i];
 	}

 	//shifting down 6 at the end here because there are already 32 guard bits available, this method is more accurate
 	*realResult = (q31_t)(sumr >> 6);
 	*imagResult = (q31_t)(sumi >> 6);
 }
	#include "ref.h"

	void ref_cmplx_dot_prod_f32(
	float32_t * pSrcA,
	float32_t * pSrcB,
	uint32_t numSamples,
	float32_t * realResult,
	float32_t * imagResult)
	{
	float32_t sumr, sumi;
	uint32_t i;

	sumr = 0;
	sumi = 0;

	for(i=0;i<numSamples*2;i+=2)
	{
	sumr += pSrcA[i] * pSrcB[i] - pSrcA[i+1] * pSrcB[i+1];
	sumi += pSrcA[i] * pSrcB[i+1] + pSrcA[i+1] * pSrcB[i];
	}

	*realResult = sumr;
	*imagResult = sumi;
	}

	void ref_cmplx_dot_prod_q31(
	q31_t * pSrcA,
	q31_t * pSrcB,
	uint32_t numSamples,
	q63_t * realResult,
	q63_t * imagResult)
	{
	q63_t sumr, sumi;
	uint32_t i;

	sumr = 0;
	sumi = 0;

	for(i=0;i<numSamples*2;i+=2)
	{
	//shifting down 14 here to provide guard bits
	sumr += (((q63_t)pSrcA[i] * pSrcB[i] ) >> 14) - (((q63_t)pSrcA[i+1] * pSrcB[i+1]) >> 14);
	sumi += (((q63_t)pSrcA[i] * pSrcB[i+1]) >> 14) + (((q63_t)pSrcA[i+1] * pSrcB[i] ) >> 14);
	}

	*realResult = sumr;
	*imagResult = sumi;
	}

	void ref_cmplx_dot_prod_q15(
	q15_t * pSrcA,
	q15_t * pSrcB,
	uint32_t numSamples,
	q31_t * realResult,
	q31_t * imagResult)
	{
	q63_t sumr, sumi;
	uint32_t i;

	sumr = 0;
	sumi = 0;

	for(i=0;i<numSamples*2;i+=2)
	{
	sumr += (q31_t)pSrcA[i] * pSrcB[i] - (q31_t)pSrcA[i+1] * pSrcB[i+1];
	sumi += (q31_t)pSrcA[i] * pSrcB[i+1] + (q31_t)pSrcA[i+1] * pSrcB[i];
	}

	//shifting down 6 at the end here because there are already 32 guard bits available, this method is more accurate
	*realResult = (q31_t)(sumr >> 6);
	*imagResult = (q31_t)(sumi >> 6);
	}