Общая дисперсия

Общая дисперсию (не следует путать с общей дисперсией, что приводит от общей суммы квадратов рассчитанных) находится в многомерных статистиках являются мерой общего разлива многомерного (многомерным) набора данных (с переменными ). Другой мерой общего разброса многомерного набора данных является обобщенная дисперсия .

определение

Общая дисперсия определяется как

,

в котором го наблюдения в переменной , среднее арифметическое из наблюдений переменных и квадрат евклидова расстояния между многофакторного наблюдения и центром данных представляет.

Таким образом , расширение эмпирической дисперсии с переменной в многомерном случае:

Важным свойством полной дисперсии является ее инвариантность относительно вращения набора данных, т.е. ЧАС. общая дисперсия повернутых данных равна общей дисперсии неотвернутых данных. Это верно, потому что общая дисперсия - это среднее расстояние между наблюдением и центром набора данных.

Связь с ковариационной матрицей

Общая дисперсия тесно связана с ковариационной матрицей данных, которую также можно рассматривать как обобщение одномерной дисперсии, но она зависит от выбранной базы. Тогда общая дисперсия - это просто след этой матрицы, поэтому она также является суммой собственных значений ковариационной матрицы. Таким образом, доля заявленной общей дисперсии используется в анализе главных компонентов , факторном анализе и кластерном анализе как мера того, насколько хорошо проведенная редукция данных отражает многомерный набор данных. При использовании этой меры в кластерном анализе говорят о «внутренней проверке », поскольку она не требует дополнительной внешней информации.

литература

  • Людвиг Фармейр, Вольфганг Брахингер, Альфред Хамерле, Герхард Тутц: многомерные статистические методы , Gruyter, 2-е издание, 1996 г.

Индивидуальные доказательства

  1. ^ Элвин К. Ренчер: Методы многомерного анализа. Том 492. John Wiley & Sons, 2003. стр. 74.