盲源分离算法初步研究 联系客服

发布时间 : 星期日 文章盲源分离算法初步研究更新完毕开始阅读7c5789265f0e7cd18425367d

盲源分离算法初步研究 一、盲源分离基本问题 1.概念

BSS信号盲分离,是指从若干观测到的混合信号中恢复出未知的源信号的方法。典型的观测到的混合信号是一系列传感器的输出,而每一个传感器输出的是一系列源信号经过不同程度的混合之后的信号。其中,“盲”有两方面的含义:(1)源信号是未知的;(2)混合方式也是未知的。

根据不同的分类标准,信号盲分离问题可以分成以下几类:

(1)从混合通道的个数上分,信号的盲分离可以分为多通道信号分离和单通道信号分离。单通道信号分离是指多路源信号混合后只得到一路混合信号,设法从这一路混合信号中分离出多个源信号的问题就是单通道信号分离。多通道信号分离是M个源信号混合后得到N路混合信号(通常N≥M)。从N路混合信号中恢复出M个源信号的问题即为多通道信号分离。一般情况下,单通道信号分离的难度要超过多通道信号分离。

(2)从源信号的混合方式上分,可将信号盲分离问题分为瞬时混合和卷积混合、线性混合和非线性混合等不同种类。在目前信号盲分离的研究文章中,所建模型大部分为瞬时混合。但是,作为更接近实际情况的卷积混合方式正受到越来越多的关注。

(3)根据源信号的种类,也可将信号盲分离分为多类。在通常的处理方法上,根据不同种类信号的特点,也有一些独特的处理技术。 2.盲分离问题的描述

BSS是指仅从观测的混合信号(通常是多个传感器的输出)中恢复独立的源信号,在科学研究和工程应用中,很多观测信号都可以假设成是不可见的源信号的混合。所谓的“鸡尾酒会”问题就是一个典型的例子。在某个场所,多个人正在高声交谈。我们用多个麦克风来接受这些人说话的声音信号。每个人说话的声音是源信号,麦克风阵列的输出是观测信号。由于每个麦克风距离各个说话者的相对方位不同,它们接受到的也是这些人的声音信号以不同方式的混合。盲信号分离此时的任务是从麦克风阵列的输出信号中估计出每个人各自说话的声音信号,即源信号。如果混合系统是已知的,则以上问题就退化成简单的求混合矩阵的逆矩阵。但是在更多的情况下,人们无法获取有关混合系统的先验知识,这就要求人们从观测信号来推断这个混合矩阵,实现盲源分离。 3.混合模型

信号的混合模型包含两个方面的内容:(1)源信号的统计特征;(2)源信号的混合方式。

3.1源信号的统计特征

已有的研究表明如果加上源信号间相互独立的限制条件,就可以有效地补偿对以上先验知识的缺乏。如果用qi表示第i个分量的概率密度函数,则这种统计独立性可以表示为:

q(s)?q1(s1)?q2(s2)?...?qn(sn)?qi(si) ?i?1n其中q(s)是s的联合概率密度函数。 3.2源信号的混合方式

最简单的混合模型假定各个分量是线性叠加混合在一起而形成观测信号的。基于这样的假设,我们可以把观测信号和源信号用矩阵的方式表示为:

x(t)?Hs(t)

式中H是n×n阶的混合矩阵。基于该模型,盲信号分离x(t)?Hs(t)的目标可以表

述为,找到一个分离矩阵W,使得y(t)?Wx(t),是对源信号s(t)的良好的估计,显然在最理想的情况下我们应该能找到W?H?1,此时有y即我们完全恢复了源信号。 (t)?s(t),4.盲分离的数学模型

由此我们建立这样的盲源分离的数学模型:设有N个未知的源信号si(t),i=1,…,N构成一个列向量S(t)??t),...,sN(t)??s1(?,其中t是离散时刻,取值为0,1,2…。设A是一个M×N维矩阵,一般称为混合矩阵。设X(t)??t),...,xM(t)??x1(?是由M个可观察信号Xi(t),i=1,…,M构成的列向量,且满足下列方程:

TTX(t)?AS(t), M≥N

BSS的问题是,对任意t,根据已知的X(t)在A未知的条件下求已知的S(t)。这构成了一个无噪声的盲分离问题。设N(t)??t),...,NM(t)??N1(?是由M个白色、高斯、统计独立噪声信号Ni(t)构成的列向量,且X(t)满足下列方程:

TX(t)?AS(t)?N(t), M≥N

则由已知的X(t)在A未知的条件下求已知的S(t)的问题是一个有噪声盲分离问题。 5.信号盲分离的不确定性

需要指出的是对瞬时混合信号盲分离,当源信号可以精确恢复的情况下应有W?A?1,在假设条件的约束下,盲源分离问题是可解的,只不过存在两个不确定性,即恢复的源信号的幅度不确定和源信号各分量次序的不确定性。 5.1分离结果的幅度存在不确定性

由于在X=AS中,A和S均未知,如果将S中任一分量Si扩大a倍,只需将A中相应的混合系数乘以1/a,上式仍成立。在观测信号幅度不变的前提下,源信号的幅度存在不确定性。因此,在求解独立分量时,往往事先假设S具有单位方差ESi???1,且各分量

2均值为零。

5.2分离结果的排序存在不确定性

由于A和S的未知,公式X=AS中独立分量的顺序可能会被调换,在X=AS中插入一个置换矩阵P和它的逆矩阵P-1,得到X=AP-1PS,将AP-1看成新的混合矩阵,则PS中的各分量便成为新的已调换顺序的独立源Si。这表明ICA分离结果存在顺序上的不确定性。

二、独立分量分析 1.独立分量分析介绍

目前的盲信源分离方法主要都是基于神经网路的ICA独立分量分析方法,ICA是20世纪90年代发展起来的一种新的型号处理技术,最早是由Comon提出的,它是从多维统计数据中找出隐含因子或分量的方法。从线性变换和线性空间角度,源信号为相互独立的非高斯型号,可以看作线性空间的基信号,而观测信号则为源信号的线性组合,ICA就是在源信号和线性变换均不可知的情况下,从观测的混合信号中估计出数据空间的基本结构或者说源信号。所以说ICA的任务和目的就是在只有传感器观测数据的条件下恢复独立的源信号,而这些传感器观测数据是那些不可测量的独立源信号经过未知线性混合后的输出。 2.独立分量分析的线性模型

ICA是伴随着BSS问题发展起来的,ICA的目的是对任何t,根据已知的X(t)在A未知时求未知的S(t),ICA的思路是设置一个N×N维反混合阵W?(wij),X(t)经过W变换后得到N维输出列向量Y(t),Y(t)??t),...,YN(t)??Y1(?,考虑如下线性瞬时混合信号系统模型,即假设传输是瞬时的,也就是不同信号到达各个传感器的时间差别可以忽略不计,并且传感器接收到的是各个源信号的线性组合,即有

TY(t)?WX(t)?WAS(t)

整个过程可以表示成如下图:

如果通过学习得以实现WA=I(I是N×N维单位阵),则Y(t)?S(t),从而达到了源信号分离目标。

3.ICA问题中的基本假设

由于源信号来自不同的信号源,所以一个合理的假设是认为各个源信号Si(t)之间是统计独立的。用f(s)表示源信号矢量s(t)的联合概率密度函数,而用f1(s1),…,fN(sN)分别表示源信号的边际概率密度函数,则源信号矢量各个分量之间的统计独立性假设描述为:

f(s)?f1(s1)?f2(s2)?...?fn(sn)?fi(si) ?i?1N即源信号矢量s(t)的联合概率密度函数为其各分量的边际概率密度函数的乘积。这一源

信号的统计独立性假设,是已有的绝大多数信号源盲分离算法的基础出发点。

除了对源信号矢量s(t)各个分量之间的统计独立性假设之外,还需要对混合矩阵做出合理的假设。显然,如果能求出矩阵A的广义逆矩阵A-1,则有

S(t)?A-1X(t)

为使盲分离问题可解,必须保证混合矩阵A的左逆存在,因此盲分离问题总假设混合矩阵A是列满秩的。

综上所示,ICA的几个基本假设条件来解决BSS问题:

(1)各源信号Si(t)均为0均值、实随机变量,各源信号之间统计独立。

(2)源信号数M与观察信号数N相同,即N=M,这是混合阵A是一个确定且未知的N×N维方阵。假设A是列满秩的,逆矩阵A-1存在。

(3)各个Si(t)的概率分布函数中最多允许有一个具有高斯分布。

(4)各观察器引入的噪声很小,可以忽略不计。源信号与观察信号之间的关系N=M。 (5)关于各源信号的概率分布函数要略有一些先验知识。 4.对信号的预处理

在使用ICA算法之前进行一些预处理通常是十分有利的。它们常使ICA估计问题变得更加简单。最常见的预处理过程有两个,一是去除信号的均值,另一个事白化。 4.1信号的零均值化

对观测信号去均值是ICA算法最基本和最必须的预处理步骤,其处理过程是从观测信号中减去信号的均值向量m=E(x),使得观测信号成为零均值向量。这意味着ICA得到的源信号的S(t)估计y(t)也是零均值的,该预处理只是为了简化ICA算法,并不意味着均值不能估计出来。用去均值数据估计分离矩阵W后,可以在源信号的估计Y上加上均值,此时所加的均值矢量是A-1m,m为在预处理过程中所减去的均值。

4.2白化

一般情况下,所获得的数据都具有相关性,所以通常都要求对数据进行初步的白化或球化处理,因为白化处理可去除观测信号之间的相关性,从而简化了后续独立分量的提取过程,而且通常情况下,数据进行白化处理与不对数据进行白化处理相比,算法的收敛性较好,有更好的稳定性。但是当混合矩阵A为病态矩阵或者某些源信号较其他源信号强度弱很多时,白化可能使ICA很难甚至不可能实现分离。 5.独立分量分析独立性的度量

ICA以统计独立性为基本原则,统计独立的衡量为ICA算法的关键。 5.1非高斯性极大

非高斯性的存在是ICA方法必须的前提条件,如果随机变量都是高斯分布,那么ICA方法也就没有研究的必要。实际上,自然界中的大部分随机信号都是超高斯或亚高斯分布,真正满足高斯分布的很少,因此ICA具有极其重要的意义和广泛的应用前景。基于非高斯性极大的ICA思想来自于中心极限定理,中心极限定理表明,当一组均值和方差为同一数量级的随机变量共同作用的结果必接近于高斯分布。因此,如果观测信号是多个独立源的线性组合,那么观测信号比源信号更接近高斯分布,或者说源信号的非高斯性比观测信号的非高斯性要强。根据这一思想,我们可以对分离结果的非高斯性进行度量,当其非高斯性达到最大时,可以认为实现最佳分离。 5.2互信息量最小

互信息通常为非负值,只有当变量之间相互独立时,互信息为0。设N维随机列向量X(t)的概率分布函数为pX(X),它的各分量Xi(t)的概率分布函数为pi(Xi),i=1~N。可以用pX(X)和

pi(X?i?1Ni)之间的KL发散度来衡量X(t)各分量之间的统计独立性。这一量也称为X(t)

各分量间的互信息,并表示为I(X),即有: