Viele Post-Processing-Beamforming-Algorithmen beruhen auf der Kreuzspektralmatrix (CSM), genauer auf der Matrix der spektralen Kreuzleistungsdichte. Das Autoleistungspektrum eines Signals \(x(t)\) beschreibt dessen Leistungsverteilung über die Frequenz. Im Frequenzbereich ist dies gleichbedeutend mit dem (normierten) Betragsquadrat nach der Fourier-Transformation des Eingangssignals.
Dementsprechend ist die spektrale Kreuzleistungsdichte zweier diskreter Signale \(x(t)\) und \(y(t)\) definiert durch die Beziehung:
$$PSD_{xy}(f) = \frac{1}{T}DFT(x(t))\cdot DFT^*(y(t))$$
Hier steht \(DFT\) für die Diskrete Fourier-Transformation, \(T\) bezeichnet die Zeitperiode und \(*\) bezeichnet die Komplex-Konjugierte der \(DFT\). Die spektrale Kreuzleistungsdichte wird genau wie die Kreuz-Korrelation im Zeitbereich in der Signalverarbeitung eingesetzt, um den Grad der Korrelation zwischen zwei Signalen abzuschätzen.
Die CSM wird erzeugt, indem die Kombination (zusammen mit ihren Komplex-Konjugierten, einschließlich der Autokorrelation jedes Mikrofons in der Diagonalen) der spektralen Kreuz-Leistungsdichten aller Mikrofonpaare in die Matrix eingetragen wird. Diese Operation ist für jede Frequenz aus dem interessierenden Spektralbereich durchzuführen. Ein 3D-Diagramm einer solchen Matrix ist in Abb. 1 dargestellt, wobei \(m\) und n die Mikrofonindizes darstellen, \(M\) die Anzahl der Mikrofone bedeutet, \(ω\) die Kreisfrequenz und \(L\) die Blocklänge des gewählten Frequenzintervalls ist. Die hermitesche CSM ermöglicht ein kompaktes Datenmanagement für weitere, komplexe Signalverarbeitungsmethoden, wie z.B. CLEAN-SC, SODIX, MUSIC, Orthogonales Beamforming etc.