Solving rician data analysis problems: theory and numerical modeling using computer algebra metods in Wolfram Mathematica
- Authors: Yakovleva T.V.1
-
Affiliations:
- Federal Research Center “Computer Science and Control”, Russian Academy of Sciences
- Issue: No 2 (2024)
- Pages: 118-124
- Section: COMPUTER ALGEBRA
- URL: https://journals.rcsi.science/0132-3474/article/view/262657
- DOI: https://doi.org/10.31857/S0132347424020155
- EDN: https://elibrary.ru/RNLIBR
- ID: 262657
Cite item
Full Text
Abstract
This paper considers theoretical foundations and mathematical methods of data analysis under the conditions of the Rice statistical distribution. The problem involves joint estimation of the signal and noise parameters. It is shown that this estimation requires the solution of a complex system of essentially nonlinear equations with two unknown variables, which implies significant computational costs. This study is aimed at mathematical optimization of computer algebra methods for numerical solution of the problem of Rician data analysis. As a result of the optimization, the solution of the system of two nonlinear equations is reduced to the solution of one equation with one unknown variable, which significantly simplifies algorithms for the numerical solution of the problem, reduces the amount of necessary computational resources, and enables the use of advanced methods for parameter estimation in information systems with priority of real-time operation. Results of numerical experiments carried out using Wolfram Mathematica confirm the effectiveness of the developed methods for two-parameter analysis of Rician data. The data analysis methods considered in this paper are useful for solving many scientific and applied problems that involve analysis of data described by the Rice statistical model.
Full Text
1. Введение
При обработке стохастических данных, в частности, при решении задач шумоподавления, широко используется подход, основанный на использовании методов математической статистики, таких, в частности, как метод максимума правдоподобия, варианты метода моментов и т.д. Очевидно, что при применении данных методов эффективность решения задачи в значительной степени определяется особенностями статистического распределения анализируемых данных. В настоящей работе рассматривается проблема оптимизации применения методов компьютерной алгебры для решения задачи двухпараметрического анализа райсовских данных, который предполагает совместный расчет информативной и шумовой составляющих измеряемого сигнала.
Как известно, статистическое распределение Райса описывает широкий круг задач обработки информации, в которых выходной сигнал формируется как сумма искомого начального сигнала и случайного шума, генерируемого многими нормально-распределенными компонентами с нулевым средним значением и некоторой величиной стандартного отклонения. При этом измеряемой и анализируемой величиной является амплитуда, или огибающая результирующего сигнала, величина которой, как известно, подчиняется статистическому распределению Райса [1].
Задача совместного оценивания сигнала и шума при двухпараметрическом анализе райсовских данных состоит в совместном расчете параметров распределения Райса. Традиционно используемый однопараметрический подход к решению задачи восстановления полезного сигнала на фоне шума предполагает априорную известность одного из райсовских параметров, а именно – дисперсии шума, и, следовательно, расчет лишь одного неизвестного параметра [2–4]. Однако условие априорной известности дисперсии шума никогда не выполняется на практике. В противоположность упрощенному однопараметрическому приближению, двухпараметрический подход не ограничен никакими априорными предположениями и тем самым обеспечивает значительно более корректное оценивание искомых величин сигнала и шума.
Однако решение задачи двухпараметрического анализа райсовских данных, как можно показать, связано с необходимостью решения системы двух существенно нелинейных уравнений с двумя неизвестными, что сопряжено со значительными трудностями как теоретического, так и вычислительного характера. В общем случае соотношения параметров такая задача может быть решена только численно, в связи с чем возникает проблема, обусловленная большим объемом необходимых вычислительных ресурсов. С другой стороны, задача расчета райсовских параметров, с решением которой связано восстановление полезного, информативного сигнала на фоне шума, особенно востребована во многих приложениях, которые предполагают необходимость обработки сигналов в системах с приоритетом работы в режиме реального времени. К таким приложениям, в частности, относится обработка данных в системах медицинской диагностики, в частности, анализ изображений при ультразвуковой визуализации.
В этой связи важно оптимизировать математические методы решения задачи двухпараметрического анализа райсовских данных таким образом, чтобы обеспечить упрощение алгоритмов численного решения задачи и сократить объем необходимых вычислительных ресурсов. Именно эти аспекты численного решения задачи анализа стохастических данных стали предметом данной работы: а именно, в результате проведенного математического исследования численное решение сложной системы двух нелинейных уравнений для двух неизвестных удалось свести к решению одного уравнения с одной неизвестной, что позволило обеспечить решение двухпараметрической задачи, используя компьютерные ресурсы лишь в том объеме, который необходим для решения однопараметрической задачи. Предварительная версия данной работы докладывалась на 5-й Международной конференции «Компьютерная алгебра» (Москва, июнь 2023 г.).
2. Теоретические и численные аспекты решения задачи совместного расчета райсовских параметров
Как известно, статистическому распределению Райса подчиняется амплитуда случайной величины, образуемой в результате сложения исходно детерминированного комплексного сигнала и искажающего его гауссовского шума. В силу центральной предельной теоремы такая ситуация является весьма типичной для многих задач обработки сигналов различной физической природы. Это означает, что статистическая модель Райса описывает широкий спектр задач, что обусловливает значимость разработки и широкую применимость методов анализа райсовских данных с целью восстановления исходного, неискаженного сигнала на фоне шума.
В задачах анализа райсовского сигнала измеряемой величиной является амплитуда
комплексной переменной величины с действительной xRe и мнимой xIm составляющими, характеризуемыми математическим ожиданием ν и искажаемыми нормально распределенным гауссовским шумом с дисперсией σ2 [1–5]. Амплитуда
подчиняется статистическому распределению Райса с функцией плотности вероятности, определяемой следующим выражением:
(1)
где Ia(z) — модифицированная функция Бесселя первого рода порядка a. Поставленная задача двухпараметрического анализа райсовских данных состоит в совместном расчете параметров ν и σ2 распределения Райса на основе данных, полученных в выборках измерений. Именно эти параметры определяют величину исходного, неискаженного сигнала ν и дисперсию искажающего его шума σ2.
На рис.1 представлена иллюстрация формирования райсовского сигнала из исходно детерминированной величины A = ν амплитуды вектора, характеризующего некоторый процесс и искажаемого под неизбежным воздействием гауссовского шума, описываемого неким вектором .
На рис. 1 амплитуда x является райсовской величиной, поведение функции плотности вероятности которой иллюстрируется таким образом, что яркость каждой точки на рис. 1 пропорциональна значению данной функции в соответствующей точке.
Рис. 1. Иллюстрация поведения функции плотности вероятности, характеризующей распределение райсовской величины x, формируемой из исходной детерминированной величины A под воздействием гауссовского шума.
Величины математического ожидания x и квадрата стандартного отклонения σx2 даются следующими формулами:
(2)
где L1/2(z) — полином Лаггера. Как легко видеть, математическое ожидание райсовской величины и ее стандартное отклонение не совпадают с параметрами ν и σ2, что характеризует особые, нелинейные свойства этого статистического распределения, в силу которых анализ райсовской случайной величины требует развития особых методов и соответствующего математического аппарата.
Ряд математических методов совместного расчета райсовских параметров сигнала и шума были развиты и строго обоснованы в работе [5] и других работах автора данной статьи. В основе этих методов лежат принципы математической статистики. В данной работе возможность существенной оптимизации решения задачи методами компьютерной алгебры продемонстрирована на примере использования для расчета райсовских параметров метода, представляющего собой комбинирование принципа максимума правдоподобия и метода моментов.
Ниже приведены основные выкладки, лежащие в основе данного метода. Будем использовать следующие обозначения: xi — величина сигнала, полученная как результат i-го измерения в выборке; ν — количество элементов в выборке, называемое также длиной выборки. Рассчитанное на основе выборочных измерений значение ⟨x k⟩ стремится к значению соответствующего k-го момента случайного райсовского сигнала при бесконечно большой длине ν выборки измерений:
Рис. 2. Иллюстрация нелинейных свойств распределения Райса: (a) – нелинейная зависимость математического ожидания райсовской величины x от райсовского параметра ν; (б) – нелинейная зависимость квадрата стандартного отклонения райсовского сигнала от дисперсии гауссовского шума σ2, формирующего райсовскую случайную величину.
Рассмотрим выборку из ν измерений величины райсовской случайной величины x. Тогда функция правдоподобия F(ν,σ2), т.е. функция совместной плотности вероятности событий, состоящих в том, что результатом i-го измерения является величина выражается как произведение функций плотности вероятности для каждого измерения из выборки:
(3)
где функция P(x | ν,σ2) определяется формулой (1). При полученных в результате измерений конкретных данных выборок функция правдоподобия является функцией неизвестных статистических параметров ν и σ2. Как известно, метод максимума правдоподобия состоит в определении тех значений параметров ν и σ2, которые максимизируют функцию правдоподобия (3), или, что эквивалентно, ее логарифм, называемый логарифмической функцией правдоподобия распределения Райса:
. (4)
Существование и единственность максимума функции правдоподобия были строго доказаны автором данной работы и иллюстрируются рис. 3, который представляет трехмерные графики функции правдоподобия распределения Райса, полученные в ходе численного эксперимента в системе Wolfram Mathematica для различных значений отношения параметров сигнала и шума. Ожидаемо, чем больше значение величины отношения сигнала к шуму, тем более детерминированным становится сигнал и тем более острую форму приобретает функция правдоподобия.
Рис. 3. Трехмерные графики функции правдоподобия статистического распределения Райса, построенные в системе Wolfram Mathematica для различных соотношений величин райсовских параметров.
Представляемый в настоящей работе метод определения искомых параметров ν и σ2 распределения Райса основан на использовании двух известных подходов к решению задач математической статистики: принципа максимума правдоподобия и метода моментов [6–8]. В качестве одного из уравнений нового комбинированного метода будем использовать уравнение метода максимума правдоподобия, полученное приравниванием нулю частной производной логарифмической функции правдоподобия по параметру сигнала ν:
Тогда, принимая во внимание выражение (4), получаем:
(5)
В качестве второго уравнения комбинированного метода будем использовать выражение для первого момента райсовской случайной величины [9]:
(6)
Формулы (5) и (6) фактически представляют собой систему двух уравнений для двух неизвестных ν и σ2.
Используя известное соотношение
,
[10] и проводя несложные преобразования, получаем следующую систему уравнений рассматриваемого метода:
(7)
В первом уравнении системы (7) обозначение используется для функции
,
равной отношению модифицированных функций Бесселя первого и нулевого порядков. Уравнения (7) представляют собой систему двух существенно нелинейных уравнений для двух неизвестных: ν и σ2.
Введем переменную r = ν2/(2σ2), которая характеризует величину отношения сигнала к шуму. Переходя от пары переменных (ν,σ) к переменным (r,σ), получим из (7) следующую систему уравнений:
(8)
где — измеренное в выборках значение первого момента, или среднего значения райсовской величины x. Из второго уравнения системы (8) получаем для переменной σ следующее выражение:
(9)
Подставляя (9) в первое уравнение системы (8), получаем уравнение для переменной r:
. (10)
Таким образом, задачу решения системы (8) двух уравнений для двух неизвестных (r,σ) удалось свести к задаче решения одного уравнения (10) для одной неизвестной величины r, что позволяет существенно упростить решения данной задачи посредством символьных вычислений в системе Wolfram Mathematica.
Поставленная задача расчета величины полезного сигнала и дисперсии шума состоит в том, чтобы, подставляя выборочные данные для величины сигнала в уравнение (10), найти решение этого уравнения для неизвестной величины r и затем рассчитать параметр шума σ, используя формулу (9). Используя полученные значения для σ и r, а также формулу r = ν2/(2σ2), нетрудно получить значение искомого параметра полезного сигнала .
На рис. 4 представлены графики расчета райсовских параметров, полученные представленным выше методом в ходе символьных вычислений в системе Wolfram Mathematica.
Рис. 4. Результаты расчета райсовских параметров сигнала ν (а) и шума σ (б) в системе Wolfram Mathematica посредством представленного комбинированного метода.
На рис. 4 а представлена зависимость рассчитанного параметра сигнала от величины, пропорциональной отношению сигнала к шуму, при заданном значении второго параметра, причем сплошная, пунктирная и штрихпунктирная кривые соответствуют следующим значениям параметра: =0.5 (сплошная линия); (пунктирная линия); =1,5 (штрихпунктирная линия). На рис. 4 б представлены зависимости рассчитанного параметра шума при различных заданных значениях параметра сигнала, а именно: =3.0, =2.0 и =1.0, соответственно. Прямые линии на обоих графиках соответствуют исходно заданным значениям параметров. Длина выборки для проводимых вычислений составляла с усреднением по 25 выборкам (в реальных системах обработки райсовских данных число усредняемых выборок составляет, как правило, величины порядка 103÷104, что обеспечивает гораздо более высокую точность расчетов. Представленные графики демонстрируют также ожидаемое повышение точности расчетов с увеличением величины отношения сигнала к шуму.
3. Заключение
Совместный расчет параметров статистического распределения Райса обеспечивает эффективное восстановление информативной составляющей стохастических данных на фоне шума. Представленное исследование дает возможность существенно сократить вычислительные ресурсы, требуемые для решения данной задачи, и обеспечивает упрощение алгоритмов численного анализа райсовских данных и тем самым – оптимизацию методов компьютерной алгебры для совместного расчета райсовских параметров сигнала и шума. В результате задача решения системы двух существенно нелинейных уравнений для двух неизвестных была сведена к решению одного уравнения для одной неизвестной величины, что означает существенное повышение эффективности методов компьютерной алгебры для решения рассматриваемой задачи, а также значительное, практически двукратное сокращение требуемых вычислительных ресурсов: представленные методы обеспечивают решение двухпараметрической задачи, используя вычислительные ресурсы лишь в объеме, необходимом для решения однопараметрической задачи.
Такая оптимизация решения задачи методами компьютерной алгебры и снижение объема необходимых вычислительных ресурсов позволяют в свою очередь повысить информативность и точность результатов обработки стохастических данных, что, в свою очередь, делает возможным применение разработанных методов в информационных технологиях и системах с приоритетом работы в режиме реального времени. Эта возможность очень важна во многих приложениях, в частности, таких, которые связаны с обработкой изображений в системах медицинской диагностической визуализации.
Численные результаты подтверждают эффективность решения задачи анализа райсовских данных разработанными методами с обеспечением высокой точности в широком диапазоне величин соотношения параметров.
Представленная математическая оптимизация продемонстрировала, что совершенствование средств компьютерной алгебры с целью упрощения символьных вычислений является важной и решаемой задачей.
Благодарности
Автор выражает глубокую признательность Абрамову Сергею Александровичу и Рябенко Анне Андреевне за полезные обсуждения и помощь в подготовке данной работы.
About the authors
T. V. Yakovleva
Federal Research Center “Computer Science and Control”, Russian Academy of Sciences
Author for correspondence.
Email: tan-ya@bk.ru
ORCID iD: 0000-0003-2401-9825
Russian Federation, ul. Vavilova 44/2, Moscow, 119333
References
- Rice S. O. Mathematical analysis of random noise // Bell Syst. Technological J. 1944. V. 23. P. 282.
- Benedict T.R., Soong T.T. The joint estimation of signal and noise from the sum envelope IEEE Transactions on Information Theory. Institute of Electrical and Electronics Engineers. 1967. V. 13. № 3. P. 447–454.
- Talukdar K.K., Lawing W.D. Estimation of the parameters of Rice distribution ,J. Acoust. Soc. Amer., Mar. 1991. V. 89. № 3. P. 1193–1197.
- Sijbers J., den Dekker A.J., Scheunders P., Van Dyck D. Maximum-Likelihood Estimation of Rician Distribution Parameters, IEEE Transactions on Medical Imaging. 1998. V. 17. № 3. P. 357–361.
- Yakovleva T.V. A Theory of Signal Processing at the Rice Distribution, Dorodnicyn Computing Centre, RAS, Moscow, 2015, 268 p.
- Deutsch R. Estimation Theory. NJ: Prentice-Hall: Englewood Cliifs, 1965.
- Port S.C. Theoretical Probability for Applications. New York: Wiley, 1944.
- Venttsel’ E.S., Teoriya veroyatnostei (Probability Theory), Moscow: Akademiya, 2005, 10th ed.
- Park J.H. Moments of the generalized Rayleigh distribution // Quarterly of Applied Mathematics. 1961. V. 19. № 1. P. 45–49.
- Abramowitz, M., Stegun, I.A. Handbook of Mathematical Functions, United States Department of Commerce, National Bureau of Standards (NBS), 1964.
Supplementary files
