Предисловие
Данный очерк посвящен физике рентгеновской спектроскопии и связанными с нею неразрушающим методам контроля и определения состава вещества. Он замешан на одном недоразумении, имевшем место в 60х годах прошлого столетия в период становления этой науки. О нем пойдет речь в этой статье.
Хоть в очерке идет речь конкретно о рентгеновской спектроскопии, понятия, обсуждаемые здесь, относятся к гораздо более широкому кругу задач.
Суть спектральных методов неразрушающего анализа и контроля проста. Если вещество облучить лучами определенной энергии, то, в зависимости от состава вещества, часть излучения будет поглощаться, часть отражаться, а часть поглощенного излучения, согласно квантовой теории, будет переизлучаться на длинах волн, характерных для элементов, составляющих образец.
Интенсивность этого характеристического излучения в первом приближении будет пропорциональна количеству содержащегося в образце элемента. Все очень просто.
Именно это обстоятельство позволяет нам исследовать с помощью космических аппаратов состав вещества других планет, определить с помощью спектрометров состав старинной монеты, не разрушая ее, и т. д.
Конкретный вид возбуждающего излучения не столь важен (рентген, электронный пучок, синхротронное излучение), будут различными вид формул и коэффициенты, сама же суть метода остается неизменной [1].
Методы неразрушающих дистанционных спектральных измерений проникли повсюду, их диапазон расширяется, созданы приборы по контролю наркотиков, примесей в продуктах питания, примесей в нефтепродуктах, анализируются жидкие среды и биообъекты. Различных приложений – море, нет, океан, объять все абсолютно невозможно [43]. Похоже, мы прозреваем постепенно в области рентгена: рентгеновские зеркала, рентгеновские линзы, рентгеновские телескопы, рентгеновские трехмерные изображения и прочее.
Дальше - больше, лаборатории, в которых приборы прошли сертификацию путем анализа тестовых образцов, получают право сертифицировать продукты питания на наличие примесей и создается на этой основе единая система сертификации продуктов. Точность метода такова, что он считается методом аналитической химии наряду с прямым химанализом. Поэтому создаются международные стандарты и нормы измерений.
Характеристикой любого прибора или метода определения состава вещества является его предел обнаружения, то минимальное количество вещества, которое можно обнаружить данным прибором.
В очерке показано, что международный стандарт, определяющий предел обнаружения вещества в количественном рентгеноспектральном анализе, не верен, что метод теоретически может быть точнее, чем сегодня считают.
Показано, что обратная задача количественного рентгеноспектрального анализа относится к классу специальных некорректных обратных задач. Что проблема была в свое время не до конца понята.
В очерке показано, что международный стандарт, определяющий предел обнаружения вещества в количественном рентгеноспектральном анализе, не верен, что метод теоретически может быть точнее, чем сегодня считают
Автору удалось, определив решение задачи как задачу нелинейного регрессионного анализа, найти теоретическую оценку точности полученного решения и на этой основе построить последовательный непротиворечивый анализ проблемы, получить ответ на некоторые нерешенные до сих пор вопросы.
Если посмотреть на изложенное в статье в совокупности, то прорисовываются контуры новой дисциплины, не знаю, как ее назвать, «Статистический спектральный анализ», «Статистическая спектроскопия», «Вероятностные методы спектрального анализа»? То, что статанализ - это независимый метод исследования, понял еще лорд Рамзай, обнаруживший, что дефицит веса газов воздушной смеси лежит за пределами погрешности измерений. Это привело к открытию аргона. Я убежден, что со временем эта предложенная мной программа будет реализована. Но лучше бы сейчас. Поэтому я отчетливо сознаю необыкновенное значение всего изложенного. Сегодняшнее положение я нахожу катастрофическим и скандальным. На фоне успехов других дисциплин за прошедшее столетие, закрадываются подозрения, что все это неспроста.
При подготовке данного обзора я преследовал несколько целей.
Во-первых, дать представление людям, интересующимся проблемами физики, но не имеющим непосредственного отношения к обсуждаемым вопросам, людям, работающим с этими приборами – химикам, биологам, металлургам, геологам, даже математикам, не знакомым с физической стороной задачи, с наличием такой проблемы. Познакомить с положением в этой области знаний, сложившимся в результате ошибки, допущенной более чем 50 лет назад. С перспективами, возможными, если ошибку исправить.
Во – вторых, я рассчитывал на реакцию людей, может быть с компетенцией, большей, чем у меня, так как я тематикой интенсивно не занимаюсь, людей, которые укажут мне на результаты, которые я не нашел, или мои ошибки. Что – то вроде научного обсуждения. Эти люди знакомы с проблематикой, и мне не надо им объяснять, как устроен рентгеновский спектрометр. Хотя это не подходящее место для такого обсуждения. А вдруг?
Постановка задачи
Взаимодействие излучения с веществом хорошо описывается с помощью математической модели. Модель эта не совсем теоретическая, некоторые зависимости, которые мы не можем полностью описать теоретически, аппроксимируются по результатам измерений на эталонных образцах с помощью эмпирических формул (зависимость поглощения или отражения излучения от глубины проникновения излучения, коэффициенты поглощения излучения и прочее).
Параметрам этой модели мы придаем физический смысл. Мы можем, задавая спектр облучения, воздействующего на образец и состав вещества, рассчитать с хорошим приближением измеряемый спектр. Это называется прямой задачей.
Можно, измеряя спектры излучения исследуемого образца и используя математическую модель, рассчитать количественный состав вещества. Такая задача называется обратной задачей или задачей оценки концентраций.
Тут надо бы пояснить несколько понятий, относящихся к специфике проблемы.
Аналитический сигнал (экспериментальная величина, которая подставляется в уравнения при решении обратной задачи) в рентгеновской спектроскопии формируется как отношение интенсивностей пиков характеристического излучения к аналогичной интенсивности, измеренной на образце сравнения (или рассчитанной), с целью исключения приборной константы.
Как было сказано, интенсивность этого характеристического излучения в первом приближении будет пропорциональна количеству содержащегося в образце элемента. Во втором приближении учитывается взаимодействие элементов. Выбитый падающим излучением со своей орбиты электрон теряет энергию. Кванты излучения этой энергии действуют на электронные орбиты уровней меньшей энергии, вызывая лавину различных физических явлений, которые надо учитывать при расчете регистрируемого нами излучения. Аналитический сигнал умножается на поправку, сложную функцию искомых концентраций элементов, все элементы взаимодействуют со всеми.
Часто наряду с этими сложными уравнениями рассматривается конкурирующая простая феноменологическая модель, взаимодействие элементов описывается с помощью коэффициента влияния одного элемента на другой.
Коэффициенты влияния могут быть определены однажды в калибровочном эксперименте с помощью набора образцов с различными, но известными концентрациями элементов. Или их можно вычислить для многих случаев с помощью нелинейных уравнений связи. Они, эти коэффициенты, не зависят от определяемых концентраций, опубликованы в печати и используются исследователями при дальнейших измерениях в различных лабораториях без необходимости их повторного измерения. Они являются как бы феноменологическими физическими константами, зависящими только от физических параметров проведения эксперимента, таких как вид возбуждающего излучения, его энергия, и пр.
Тогда поправка является линейной однородной функцией концентраций.
Такая формула поправки коэффициентов влияния встречается во многих других приложениях, в количественной оптической спектроскопии, в хроматографии, в рентгенофлуоресцентной спектроскопии, в количественном рентгеновском микроанализе, в дифрактометрии, анализе с помощью синхротронного рентгеновского излучения. Определенно не только там.
Прошу обратить внимание на это обстоятельство, оно будет играть важную роль в дальнейших рассуждениях.
При выводе уравнений связи предполагается, что в формуле все элементы образца нами учтены. По крайней мере, так должно быть для всех компонент, участвующих в спектральном взаимодействии. Иначе не выполнить расчет. Тогда сумма всех долей весовых концентраций анализируемых элементов должна составлять единицу, все 100% учтены. Эту сумму называют часто уравнением нормировки.
Анализируемые образцы в геологии или полупроводниковые составы, а также сплавы металлов часто представляют собой соединения с частично известными химическими формулами. Это означает известные априори количественные (относительные) соотношения между массами веществ в химических формулах. Можно вспомнить такие школьные понятия, как закон кратных отношений, граммолекула, число Авогадро[27].
Эти стехиометрические соотношения вместе с уравнением нормировки можно записать математически в виде матричного соотношения ограничений с помощью неквадратной матрицы. Подробности определений смотри [26, 8]. Выше упомянутые соотношения учитывают при вычислении теоретических интенсивностей в прямой задаче. При постановке обратной задачи поступают аналогично. При этом, используя эти соотношения, исключают часть концентраций из уравнений. Получается переопределенная система уравнений относительно меньшего числа переменных. Для оставшихся переменных выбирают сильные линии для анализа. Выбирают число уравнений равное числу анализируемых переменных. Не анализируемые элементы определяют затем из матричного соотношения ограничений.
Во всех случаях речь идет об алгебраическом решении нелинейной квадратной системы уравнений.
Физики в рентгенофлуоресцентной спектроскопии и количественном рентгеновском микроанализе добились такого совпадения расчетных спектров излучения с экспериментом, что это позволило отказаться от экспериментов измерения спектров эталонных образцов. Их заменили расчетными спектрами. Методика называется безэталонный анализ.
Все это сформировалось как наука в середине прошлого, двадцатого – начале нынешнего века и позволило одному из отцов – создателей количественного рентгеновского микроанализа Курту Хейнричу опубликовать очерк, озаглавленный «Золотой век микроанализа» [2]. Статья была опубликована в 2001 году. Автор статьи считал, что все основные проблемы теории и построения аппаратуры уже решены. Статья содержит прекрасный исторический очерк.
Но, как говорил Жванецкий, в действительности все не так как на самом деле! Не все так гладко и просто, как выглядит на первый взгляд. Имеются, по моему мнению, существенные нерешенные проблемы, имеющие принципиальный характер. Эти проблемы умышленно или неумышленно замалчиваются, что ведет к серьезным последствиям.
И здесь начинаются серьезные трудности. Дело в том, что обратная задача рентгеновского спектрального анализа принадлежит к классу некорректных обратных задач.
Некорректные задачи
Что это такое, некорректная обратная задача?
По определению, данному Жаком Адамаром, математические модели физических явлений (уравнения обратной задачи) должны иметь следующие свойства:
· Решение существует.
· Решение единственно.
· Решение непрерывно зависит от исходных данных в некоторой разумной топологии (устойчиво).
Такая задача называется корректно поставленной.
Некорректно поставленная задача — это задача, не обладающая каким-либо из свойств корректно поставленной задачи.
Некорректные обратные задачи часто встречаются в физике. Чаще всего они связаны с решением уравнений, возникающих при оцифровке результатов наблюдений, полученных со слишком малым промежутком времени или другой независимой переменной между отсчетами. Тогда два соседних уравнения, описывающих вход – выход прибора или системы измерений, являются «почти» одинаковыми и квадратная система уравнений не позволяет получить результат с заданной точностью, уравнений как бы не хватает.
При решении обратных некорректных задач в этом случае применяют методы регуляризации решения. Суть их в том, что с помощью дополнительной информации из возможного множества решений выбирают единственное решение или множество решений, не отличающихся друг от друга с определенной точностью. Этой дополнительной информацией может быть условие типа уравнения ограничений, упомянутых выше, или другое подходящее условие. Нужно только чтобы основных уравнений и уравнений – условий хватало для однозначного определения решения. Эти условия учитываются с определенным весом, зависящим от степени нашего доверия этим условиям. Или вес этих условий устремляют постепенно к нулю до конечного момента устойчивости процедуры итераций. Их общим недостатком часто является неоднозначный выбор параметра регуляризации, что не позволяет теоретически оценить точность решения. Такая ситуация встречается и в рентгеновской спектроскопии.
Но обратная задача рентгеновского спектрального анализа, кроме всего прочего, принадлежит к особому классу некорректных обратных задач. К нему относятся задачи, для которых прямые уравнения получены при известных нам условиях, связывающих исходные переменные. Эти, точно известные нам условия должны автоматически выполняться и при решении обратной задачи. По крайней мере, так должно быть для всех компонент, участвующих в спектральном взаимодействии. Например, сумма всех найденных концентраций элементов должна составлять 100%.
Но так не получается. Или получается не всегда. Попробуем в этом разобраться.
Начнем с того, что не существует доказательства существования и единственности безусловного решения исходной системы физических уравнений. Но по сложившейся традиции исследователи считают, что решение существует.
Считается, что решение получено, если достигнута стационарная точка, то есть следующий шаг итерации не отличается существенно от предыдущего. После каждого шага итераций производится нормировка результата.
В ответе приводится как нормированный, так и ненормированный результат. Но обоснованного критерия остановки итераций не существует. Особое значение придается ненормированному результату, если полученная сумма концентраций сильно отличается от 100%, то это трактуется как наличие неучтенных компонентов, примесей.
Оценить погрешность такой эмпирической процедуры итераций нет возможности. И нет доказательств существования стационарной точки. На практике ограничиваются 3 – 5 итерациями. О точности вычислений судят путем сравнения с результатами химического анализа.
С этой целью на большом количестве эталонных образцов с известным содержанием элементов, охватывающих широкий диапазон таблицы элементов, провели измерения интенсивностей, а затем провели по ним вычисления концентраций. Результаты расчетов были представлены в виде гистограммы распределения относительного отклонения расчетного содержания от истинного (химический анализ). Методика, напоминающая проверку качества медикаментов в медицине на выбранной группе испытуемых. Что – то вроде средней по больнице температуре пациентов. И это в спектроскопии, науке такой же старой, как вся Борновская атомная физика! И это для приборов, служащих, в том числе для определения наркотических веществ и вредных примесей в продуктах! (приборы рентгенофлуоресцентного анализа и контроля). Полный бред! Ну а что еще остается делать!
Все выглядит так, как если бы уравнение нормировки использовалось лишь с целью регуляризации решения. Решение тогда приблизительно удовлетворяет как физическим уравнениям, так и уравнению нормировки.
Но ведь как выше отмечено, уравнения справедливы, если только учтены все компоненты, в сумме должно быть 100%. Как же так? Ведь это некорректно!
Оставаясь в рамках поиска алгебраического решения задачи, мы имеем, таким образом, следующую ситуацию.
Будем считать, что условие нормировки выполняется, и будем при решении обратной задачи рассматривать его как дополнительное уравнение.
Тогда в случае «идеальных», бесшумных наблюдений система физических уравнений будет вырождена, любое физическое уравнение вследствие наличия уравнения нормировки будет следствием остальных. При этом система физических уравнений плюс условие нормировки будет переопределенной совместной системой, имеющей однозначное решение.
На самом же деле при подстановке в уравнения значений аналитического сигнала, полученных с погрешностью в конкретном эксперименте, физические уравнения будут независимы, система физических уравнений не обязательно вырождена и упомянутая выше общая система уравнений становится переопределенной и несовместной, алгебраического решения не существует и решение должно быть определено в каком–либо смысле.
Заметим, что утверждения «несовместная переопределенная система», «Система физических уравнений вырождена» нужно употреблять с осторожностью, так как эти понятия определены только для систем линейных уравнений.
Именно такие линейные системы возникают часто при итерациях при поиске решения.
Выше описанная ситуация, как определить решение, породила научную дискуссию на рубеже веков, но действительного понимания не было достигнуто. Под решением по-прежнему понимали и понимают алгебраическое решение квадратной нелинейной системы физических уравнений. А комичный спор как искать решение этих уравнений и о приоритетах публикаций по этому вопросу в рентгенофлуоресцентном анализе, имеющий мало общего с наукой, мог бы составить еще одну статью для этого журнала.
Между тем, как было отмечено, точность метода рентгеноспектрального анализа такова, что он считается методом аналитической химии наряду с прямым химическим анализом. Поэтому методика измерений должна быть согласована с принятыми международными нормами измерений аналитической химии. Речь идет о следующем.
Еще в прошлом веке международный химический консорциум IUPA определил понятие и критерий обнаружения малого количества вещества в пробе. Так как регистрируемый сигнал имеет случайный характер, то критерий обнаружения основан на теории проверки статистических гипотез и сравнении регистрируемого сигнала с порогом.
Статистическая постановка задачи
Критерий утверждает, что если зарегистрированный аналитический сигнал превышает в несколько раз сигнал фона, то можно с определенной вероятностью утверждать о наличии вещества в образце. Исходя из требуемой доверительной вероятности правильного решения, выбирается два порога. В зависимости от того, насколько сигнал превышает шум, различают
- -Наименьший предел обнаружения (Low Detection Limit, LDL)
- Предел достоверного обнаружения (Identification limit, IDL)
- Обнаружение с возможностью достоверного определения количества (Quantification Limit, Estimating Detection Limit, EDL )
Перечисленные определения отличаются выбором уровня доверительной вероятности для трех случаев соответственно: когда сигнал достигает первого порога обнаружения, попадает в интервал неопределенности и превышает его. Это общее определение. Случайная погрешность обусловлена флуктуациями фонового сигнала, случайность аналитического сигнала не учитывается.
В определении IUPAC, сформулированном обще, и справедливом для различных методов анализа вещества, ничего не говорится о способе вычисления концентраций, ведь, в зависимости от способа оценки концентраций по уже обнаруженному аналитическому сигналу, оценка концентрации может иметь разную точность (дисперсию оценки, смещенность оценки). От этого зависит действительное качество обнаружения.
Чтобы определить качество оценки концентрации, исследователю надо иметь две вещи:
Надо иметь саму оценку концентрации. Для этого надо решить обсуждаемые уравнения связи. Но не только это. Нужно суметь рассчитать дисперсию решения, , чтобы просчитать вероятность обнаружения элемента. Ее - то, как раз и не могут рассчитать славные физики для эмпирической процедуры итераций для многокомпонентного образца. Согласитесь, что гистограмма относительных погрешностей решения (отклонения полученной оценки от результатов химического анализа) имеет мало общего с математикой.
Для того, чтобы понять дальнейшее, нужно вернуться на шаг назад. Вычислить точность решения удалось Зиболду [9] в его модели двухкомпонентного образца и линейной однородной поправки на взаимодействие элементов, феноменологическая модель поправки, обсуждавшаяся выше.
Зиболд предположил, что система двух физических уравнений вырождена, поэтому отбросил второе уравнение и, используя первое уравнение и уравнение нормировки, получил решение. Предположив, что дисперсия шумов аналитического сигнала вызвана статистикой регистрации рентгеновских квантов, он вычислил ее. Это известная величина.
Далее, считая, что погрешность решения обусловлена лишь погрешностью регистрации экспериментальных данных, вычислил погрешность решения, продифференцировав полученную формулу для концентрации по погрешности экспериментальных данных. Зиболд использовал этот результат для определения предела обнаружения рентгеновского микроанализатора.
На этой основе он дал определение чувствительности и предела обнаружения примеси в рентгеновском микроанализе, смотри [3]. Примесь считается обнаруженной, если оценка концентрации превышает порог сравнения при вероятности обнаружения 95%.
Для полученной величины этой предельной концентрации он по формуле вычислил порог сравнения для регистрируемого аналитического сигнала. По сути метод прямо противоположен методу, предложенному IUPA. По требуемой вероятности обнаружения примеси он определяет требуемый уровень превышения аналитического сигнала над порогом, а не наоборот.
Именно в этом заключается причина того, что больше, чем 50 лет мировое научное сообщество держится за результат Зиболда (1967 год) [3]. Это единственный существующий результат такого рода.
На этом результате базируются до сих пор международные и национальные стандарты, в том числе и российские. Лаборатории, в которых приборы прошли сертификацию путем анализа тестовых образцов, получают право сертифицировать продукты питания на наличие примесей и создается на этой основе единая система сертификации продуктов.
При этом Зиболд сделал ряд некорректных допущений, что привело его к неправильному результату. Обнаружить это можно лишь в рамках статистической постановки задачи. Специфика заключается в некорректности задачи. Если зарегистрированные спектральные данные известны нам с погрешностью, то это делает систему линейную однородную систему физических уравнений невырожденной, ей удовлетворяет только нулевое решение. Тогда уравнение нормировки не выполняется, система трех уравнений несовместна, она не имеет алгебраического решения.
Кроме того, он совершил еще одну ошибку. Его формула оценки концентрации содержит экспериментальные данные, которые входят туда нелинейным образом. Поэтому при осреднении оценки по совокупности повторных экспериментов шумы не нивелируются, а приводят к появлению дополнительных слагаемых и оценка не стемится к истинному значению концентрации (смещенность оценки). Если оценка смещенная, то квадрат общей погрешности решения равен сумме квадрата смещенности и дисперсии решения. Тех, кто владеет математикой, отсылаю к источнику [9] . Это азы статистики, почему это не обсуждалось ранее совершенно непонятно. Но результату Зиболда 54 года и он положен в основу международного стандарта предела обнаружения этих приборов.
Еще один повод обратить внимание на эти бинарные уравнения заключается в том, что эти уравнения используются при решении нелинейных уравнений в общем многокомпонентном случае. При этом на каждом шаге итераций используется упомянутая линейная аппроксимация поправки и условие нормировки. Образец представляют как квазибинарный, в виде анализируемый элемент и через коэффициент влияния оставшаяся часть. Коэффициент влияния рассчитывается из нелинейных уравнений. При этом вычисления повторяют, вычисляя вновь коэффициент влияния из нелинейных уравнений для полученных оценок концентраций (итерации). Процедуру повторяют затем последовательно для всех элементов образца. При составлении рентгеновской карты образца и определении его однородности поступают подобным же образом в каждой точке и для каждого элемента. Поэтому избавиться вообще от этих формул в обсуждении нет возможности.
Как я уже заметил, алгебраического решения не существует и решение должно быть определено в каком–либо смысле. Проблема сводится теперь к поиску наилучших способов оценки искомых параметров. Этой цели служит статистическая теория нелинейного оценивания параметров. Центральную роль играют в ней оценки максимального правдоподобия или оценки минимальной дисперсии или по-другому оптимальные оценки.
Критерий решения минимальной дисперсии (максимума вероятности, смотри далее) позволяет получить решение, учитывающее оба физических уравнения для бинарного образца и дающее результат более точный, чем результат Зиболда, подробности приведены в[9].
Статистические оценки минимальной дисперсии
Как было сказано, проблема сводится теперь к поиску наилучших способов оценки искомых параметров.
Заметим, что, речь может теперь идти не об алгебраическом решении исходной нелинейной системы уравнений, а о решении методом наименьших квадратов расширенной системы уравнений. Эта, не обязательно квадратная система уравнений, может включать много уравнений, полученных повторными измерениями или измерениями при других условиях анализа, другой энергии возбуждающего излучения, другом угле отбора излучения и пр. Включение в систему дополнительных уравнений позволяет при решении системы нивелировать случайные ошибки измерений, уменьшая тем самым погрешность решения. Эти повторные измерения называются в статистике выборками из общего поля распределения вероятностей, тогда говорят о средней величине по выборочному распределению вероятностей и других величинах.
Если предположить нормальное распределение шумов аналитического сигнала, то критерий максимального правдоподобия с учетом ограничений сводится к критерию метода взвешенных наименьших квадратов, оценки называются restricted least squares estimates.
Свойства таких оценок хорошо изучены, они широко применяются в статистической теории линейного и нелинейного оценивания параметров.
Кардинальным при этом является понятие минимальной достижимой границы дисперсии. Существует минимальная граница дисперсии для любого способа несмещенной оценки параметра. Эта минимальная граница дисперсии не зависит от способа оценки параметра, она зависит лишь от уровня шума, на фоне которого мы оцениваем параметр. Другими словами, от количества информации, содержащемся в принятом сигнале.
Оптимальные оценки, о которых пойдет речь, наилучшие, так как имеют минимальную дисперсию решения. Эта дисперсия приближается к этой теоретически достижимой границе. Эту дисперсию можно вычислить.
Собственно, в этом основное содержание статьи – указать на возможность вычислить наиболее точную оценку, для которой вычисляется одновременно ее теоретическая точность. Далее мы обсудим свойства этих оценок.
Предельно достижимая точность оценки концентраций и теория информации
Будем рассматривать некий прибор, такой как радиолокатор, телефонный кабель или рентгеновский микроанализатор как черный ящик, канал передачи информации, свойства которого известны (передаточная функция, помехи). На вход этого канала подан сигнал, а на выходе этот сигнал регистрируется на фоне шумов. Систему уравнений концентрации – интенсивности можно тоже рассматривать формально как такой канал.
Мы пытаемся решить обратную задачу, и с помощью системы обработки сигнала оценить сигнал по входу. Оказывается, что этот сигнал может быть восстановлен с точностью, не превышающей некоторой границы, определяемой отношением сигнал – шум зарегистрированного сигнала, а более обще - количеством информации, содержащимся в принятом сигнале. Для любого физика ясно, что только за счет электронной системы регистрации или математической обработки сигнала отношение сигнал/шум по выходу системы обработки сигнала не может быть сделано больше, чем по входу. Как ни крути ручку радиоприемника, для слабого сигнала по входу не получить хорошего качества сигнала по выходу. Ясно, что, расширяя полосу частот усилителя с целью усилить мелкие подробности входного сигнала, с какого-то момента мы начнем усиливать шумы. Это положение послужило отправным пунктом при создании теории передачи информации и кодирования сигналов (Винер, Шеннон, Колмогоров). По каналу связи нельзя передать больше информации, чем содержится по входу канала, а возможность оценки параметров сигнала по выходу системы регистрации определяется отношением сигнал – шум принятого сигнала.
Тогда проблема сводится к поиску наилучших помехоустойчивых алгоритмов кодирования сигналов или наилучших способов оценки параметров обрабатываемых сигналов.
Если точность оценки параметра сигнала характеризовать дисперсией оценки, то эта граничная минимальная дисперсия может быть вычислена при условии знания статистических свойств шума, на фоне которого сигнал зарегистрирован. Граница эта не зависит от способа обработки сигнала. Она называется границей Крамера – Рао. Мы упомянули кратко об этом в разделе «Статистические оценки минимальной дисперсии».
Замечательное свойство оценок максимального правдоподобия – они «почти» достигают эту минимальную границу.
В случае одного скалярного параметра, как это в случае бинарного образца и оценки Зиболда, эта граница может быть просто вычислена по формуле. Этот результат значительно лучше, чем результат Зиболда.
Вычисленный Зиболдом предел обнаружения метода не является предельно достижимым еще и потому, что он использует в вычислениях только один канал наблюдений. Правило проверки, использующее оба спектральных канала, значительно точнее, смотри [9].
Вывод и свойства неравенства Крамера – Рао описаны во многих руководствах по статистическому анализу, например в [33, 34] или [22, Multivariate Linear Regression Model]. Неравенство Крамера – Рао в случае наличия ограничений на параметры приводится в [14].
Замечу, что в вопросе о необходимости общей постановке обратной задачи, объединяющей алгебраическую и статистическую постановку, о которой речь идет в этой статье, я не первооткрыватель. Вопрос время от времени всплывал. Укажу, например, на статью [49].
К сожалению, дальше исследователи не продвинулись. На этот результат Зиболда по-прежнему ссылаются. Программная статья американского национального бюро стандартов[6] опубликована в 2010 году. Она ссылается на упомянутые мной статьи Зиболда и французов 1967 и 1978 годов [3], [5].
Интервальные оценки
Нужно пояснить еще одно очень важное понятие, лежащее в основе наших рассуждений, это различие между точечной оценкой и интервальным оцениванием. Точечной оценкой называется оценка параметра, вычисленная для конкретной реализации случайного процесса. Для следующей повторной реализации процесса эта оценка может отличаться от предыдущей.
При интервальном оценивании речь идет о некотором интервале, которому с некоторой доверительной вероятностью могут принадлежать такие оценки параметров. Чем больше доверительная вероятность, с которой нам требуется получить результат, тем больше этот интервал. Чем меньше дисперсия оценки параметра, тем меньше интервал.
Для вектора параметров речь идет о дисперсионной матрице вектора оценки и области значений, к которой с доверительной вероятностью принадлежат эти оценки, доверительном эллипсоиде в случае нормального распределения.
У математиков выражение «Квадратичная форма в показателе экспоненты нормального распределения распределена по критерию кси-квадрат» имеет характер поговорки. Дальнейшие подробности определений смотри [33].
Понятие интервальной оценки используется в теории проверки статистических гипотез. Если мы предположили, например, что оцениваемая концентрация равна нулю, то ее оценка не должна превышать определенной границы, порога сравнения. Если превысила, то концентрация элемента не равна нулю, с определенной вероятностью элемент присутствует. Обычно речь идет об обнаружении отдельной компоненты при сравнении аналитического сигнала этой компоненты с порогом обнаружения. В многокомпонентном образце речь идет о доверительном эллипсоиде отклонений полученных оценок от предполагаемых истинных значений.
Однако есть одна подробность, на которую до сих пор не обращали внимания физики. Если речь идет об обнаружении отдельной компоненты в многокомпонентном образце при сравнении аналитического сигнала этой компоненты с порогом обнаружения, то эта оцениваемая компонента связана с другими компонентами условиями. Может статься, что в многокомпонентном образце за счет ошибок регистрации других компонент мы получим для них неверные оценки, которые повлияют на величину оценки рассматриваемой компоненты.
Поэтому нужен анализ и оценка всех компонент. Мы обсудим это далее.
«Бесшумные» наблюдения и достаточные статистики
Точно известные условия можно рассматривать как «бесшумные» дополнительные наблюдения с нулевой дисперсией. [7]
Это обстоятельство приводит к вырожденности дисперсионной матрицы шумов эксперимента, а затем к вырожденности дисперсионной матрицы вектора оценок. Некоторые собственные числа этой дисперсионной матрицы будут равны нулю. Тогда доверительный эллипсоид для вектора решения, построенный с помощью этой матрицы, будет иметь для некоторых осей нулевую длину, пропорциональную собственным числам этой матрицы. Можно путем поворота системы координат в пространстве концентраций перейти к новым переменным, линейным комбинациям исходных переменных.
При переходе к новым переменным можно совместить новые переменные с направлением ненулевых осей этого доверительного эллипсоида. Эти новые переменные будут статистически независимы. Их будет меньше, чем исходных концентраций. Логично, их должно быть меньше, так как искомые концентрации связаны условиями. Такое преобразование в статистике называется приведением к главным компонентам. Достаточно проверить принадлежность этих новых переменных их доверительным интервалам. Эти новые переменные называются достаточными статистиками.
Тогда в задаче об интервальной оценке концентраций многокомпонентного образца вместо самих оценок концентраций, как это делается сегодня, именно эти комбинации оценок должны сравниваться с порогами сравнения. Это приводит к специальным процедурам интервального оценивания, сильно отличающимся от процедур, применяемых сегодня в спектрометрии.
Полученные новые независимые переменные можно использовать для формулировки критерия остановки итераций при решении обратной задачи[13].
Эти понятия разъясняются на примере двухкомпонентного образца и модели Зиболда[9].
Приводится правильный алгоритм обнаружения примеси в случае двухкомпонентного образца.
Процедура итераций
Когда я посылал соответствующие статьи для публикации, рецензенты советовали мне не заниматься ерундой, а сосредоточить свои усилия на поиске критерия остановки итераций. Я последовал их совету. Привожу результат.
Как отмечалось выше, оптимальные оценки получаются минимизацией взвешенной суммы наименьших квадратов. Алгоритм поиска минимума квадратичной формы и сопутствующие этому вопросы описаны подробно в литературе [47].
Минимум этого квадратичного функционала может быть найден с помощью метода итераций. В точке минимума производная по искомым параметрам должна быть равна нулю. С целью поиска решения получившихся нелинейных уравнений квадратичный функционал раскладывают в ряд Тейлора около точки начального приближения, получают линейную систему уравнений и решают ее. Получают первое приближение. Подставляют его в уравнения. Повторяют для него процедуру линеаризации функционала и решения системы. Итерации повторяют до тех пор, пока разность двух последующих шагов не станет меньше погрешности вычисления оценки. Чтобы получить относительную погрешность вычисления оценки, относительную погрешность исходных данных умножают на характеристику устойчивости решения системы уравнений, степень обусловленности системы уравнений, число cond. Система уравнений считается хорошо обусловленной, если это число меньше 100[46]. Это классика. Но это грубая оценка.
Рассмотрим статистический критерий остановки итераций.
Упомянутый выше предел точности оценки в неравенстве Крамера - Рао, предельная дисперсионная матрица, может быть вычислена, если нам известны точные значения параметров. Но они нам неизвестны, наша задача их оценить. Но дисперсионная матрица оптимальных оценок асимптотически стремится к этой предельной матрице.
Тогда дальнейшая логика должна быть такова:
На каждом шаге итераций полученную оценку принимают за истинную концентрацию элемента. В этой точке вычисляют граничную дисперсионную матрицу. Эту матрицу принимают за дисперсионную матрицу решения. Для заданной доверительной вероятности с помощью этой матрицы определяется доверительная область, которой должны принадлежать все отклонения оценок от истинных концентраций. Разность между двумя последующими итерациями принимают за такое отклонение.
Осуществляется переход к главным компонентам этой матрицы и новым статистически независимым переменным. Вычисляются оценки этих независимых переменных, их дисперсии и разности оценок на последнем шаге итерации. Если гипотеза о составе образца справедлива, то полученные оценки разностей этих переменных на последнем шаге итерации должны быть внутри своих доверительных интервалов. Итерации останавливают при выполнении критерия принадлежности, а оценки самих концентраций, полученные на последнем шаге итераций, принимают за истинную концентрацию.
Ответ зависит от того, с какой точностью необходим нам результат, с какой доверительной вероятностью. То есть, от того, каков размер этого эллипсоида.
В статистической постановке задачи пространство сходимости алгоритма – это доверительная область, в которой оказываются две последовательные итерации. Для подмножества искомых величин должно выполняться условие нормировки и условие того, что все концентрации больше или равны нулю и меньше единицы как минимум условий.
Я осознаю, что на этом пути много подводных камней, но общее направление мне кажется верным. Подробнее о процедуре итераций смотри[13]
Ошибки и невязки. Критерий обнаружения мешающих факторов
Как отмечалось выше, в эмпирической процедуре итераций большое значение придавалось тому, насколько на последнем шаге итерации сумма найденных концентраций отличается от единицы. Это считалось признаком наличия неучтенных примесей. Но полученное нами решение подчиняется строго условию нормировки. Интуитивно ясно, что мы могли ошибиться в предположении о составе образца или могли быть другие мешающие факторы, ошибки измерений. Как тогда их обнаружить?
Здесь нам надо ввести еще одно понятие.
В статистике и теории оптимизации ошибки и остатки (невязки) - это два тесно связанных понятия, которые легко сбивают с толку. Ошибка (или нарушение) наблюдаемого значения - это отклонение наблюдаемого экспериментального значения от (ненаблюдаемого) истинного (среднего) значения, а остаток наблюдаемого значения (невязки) - это разница между наблюдаемым значением и вычисленным, оценочным значением регистрируемого сигнала, Википедия (верна только английская статья) [48].
Если вычисленные нами оптимальные оценки подставить далее в выражение для суммы квадратов отклонения экспериментальных величин от теоретической модели, минимизацией которого эти оценки были получены, то мы получим остаточную сумму квадратов разностей экспериментальных и вычисленных интенсивностей, или невязки, residue.
В отсутствии «шумов», ошибок эксперимента и модели и если оценки равны истинным концентрациям, а гипотеза о 100% составе верна, то эта сумма должна быть равна нулю.
При учете «шумов» эксперимента эта сумма не равна нулю, остатки для «правильной» гипотезы должны находиться внутри доверительного эллипсоида.
Мы можем вычислить этот доверительный эллипсоид для этой остаточной суммы квадратов, (невязок). Размер этого эллипсоида зависит от того, с какой точностью необходим нам результат, с какой доверительной вероятностью .
В присутствии неучтенных факторов эта сумма квадратов остатков будет существенно отличаться от нуля и не принадлежит более своей доверительной области. Таким неучтенным фактором может являться неучтенная компонента или примесь.
Дальнейший анализ причин обстоятельств, почему невязки столь велики, возможен с помощью, так называемых outliers, выбросов. Если некоторые разности экспериментальных и вычисленных интенсивностей находятся далеко за пределами доверительной области, то это повод для поиска физических причин этого. Методика анализа остатков в задаче линейной регрессии описана исчерпывающе в [44].
Таким образом, и с этим вопросом покончено.
Подробное изложение этого раздела содержится в [13].
Обнаружение элементов и соединений
В предыдущих разделах говорилось об обнаружении одной единственной известной компоненты в двухкомпонентном образце при отсутствии других неизвестных параметров. Это называется проверкой простой гипотезы против простой альтернативы.
Но нас может интересовать более сложная ситуация, такая как наличие или отсутствие в многоэлементном образце с заданной вероятностью химического соединения как совокупности элементов, связанных химической формулой. Такая постановка задачи является новой, еще не рассматривалась.
В работе [8] показано, что если представить образец как совокупность сложных соединений, оксидов, сульфидов или каких-либо еще, то концентрации этих соединений в общей смеси будут линейной функцией исходных концентраций отдельных элементов.
Пусть мы решили уравнения и получили оптимальные оценки. Если отклонения этих оценок от истинных значений, как мы предполагали, распределены нормально, то линейная комбинация таких оценок тоже будет распределена тоже нормально с дисперсионной матрицей, линейно выражающаяся через дисперсионную матрицу самих оценок. И существует доверительный интервал, которому с заданной вероятностью будет принадлежать эта линейная комбинация.
Тогда можно проверять гипотезы о наличии отдельной компоненты или соединения, как наличие или отсутствие линейной комбинации ряда элементов.
Концентрация окисла есть линейная функция концентраций элементов. Окисел отсутствует, если с доверительной вероятностью оценка концентрации окисла лежит ниже порога сравнения. В определении порога сравнения тоже участвуют оценки всех элементов. Подробности приводятся в [13]. Подобная постановка задачи отсутствует в рентгеновской спектроскопии.
Другие радужные перспективы:
Становятся возможными качественно новые постановки задач, не осуществимые ранее. Так, например, при анализе неоднородных, зернистых образцов можно характеризовать размер частиц не только средним размером, но и априорным распределением частиц по размерам. Тогда, максимизируя апостериорное распределение вероятности, как по искомым концентрациям элементов, так и по параметрам среднего размера и дисперсии частиц, мы можем оценивать эти величины (Байесовские оценки). Сама теоретическая физическая модель описания зернистого образца не сильно отличается от описания гомогенного.
Или можно по-новому рассмотреть старую задачу из школьного учебника химии: Какова апостериорная вероятность той или иной эмпирической химической формулы, если концентрации входящих в нее со своими валентностями элементов принадлежат некоторой определенной области. Эта область может быть вычислена нами как доверительная область, которой с заданной доверительной вероятностью принадлежат эти элементы при решении обратной задачи.
Или можно сравнить апостериорные вероятности двух эмпирических химических формул, чтобы решить, какая из них более вероятна.
Предлагаемый подход ставит больше вопросов, чем предлагает готовых решений. Так, например, как определить критерий однородности образца, если при анализе поверхности в каждой точке производится одновременный анализ всех элементов с расчетом принадлежности концентраций этих элементов доверительному эллипсоиду? Что если при выбранной доверительной вероятности поверхность однородна по одной компоненте, но неоднородна по другой? Ответ могут подсказать те, кто занимается анализом поверхностей.
Кстати, в случае многокомпонентного образца экспресс – оценку концентраций не оптимальную, но достаточно хорошую можно получить с помощью феноменологической модели коэффициентов влияния (альфа коэффициентов), обсуждавшейся выше. Ответ получается по формуле, без всяких итераций, сразу для всех элементов, смотри [16]. Отпадает необходимость в процедуре итераций, что во много раз ускоряет анализ.
С другой стороны, регистрируемый сигнал, как случайная величина, даже если поверхность однородна, будет флуктуировать от точки к точке. При заданном качестве проверки однородности являются ли эти флуктуации допустимыми или свидетельствуют о наличии чего-то мешающего? Я пытался ради интереса применить для решения этой задачи статистическую теорию выбросов случайных процессов.
В теории проверки статистических гипотез и принятия решений говорят об ошибках принятия решения или отклонения гипотезы.
Приняв решение о наличии сигнала, мы можем совершить ошибку первого рода, (ложная тревога – следуя терминологии радарного обнаружения целей), считая, что компонента присутствует, когда ее нет. Но если в этой ситуации анализируемый объект все же присутствует, мы можем совершить ошибку (ошибку второго рода, ошибку пропуска сигнала), считая, что его нет, тогда, когда он есть.
В некоторых задачах упомянутые ошибки принятия решений могут иметь различную цену. Так в задаче анализа наркотиков пропуск компоненты или принятие ложного решения о ее наличии имеет другую цену, чем в задаче анализа примеси в пищевых продуктах. Тогда можно говорить о функции стоимости принятия решения.
Я мог бы продолжить перечислять интересные задачи, позволяющие точную постановку и решение. Но, пожалуй, в какой-то момент надо поставить точку. Иначе очерк о рентгеновской спектроскопии превращается в очерк о возможностях статистического анализа. Кроме того, это самые азы статистического анализа. Тут главное начать думать в этом направлении. Арсенал средств безграничен. Хотя автор не считает себя большим специалистом ни в той, ни в другой дисциплине, самое трудное было это постановка физической задачи таким образом, чтобы найти адекватное математическое средство.
Пришлось, например, проделать сущую безделицу, записать химическую формулу с ее химическими индексами в виде матричного равенства. Я считал это настолько очевидным, что попытался найти ссылки на соответствующие работы. Нашел.
Алгебра таких неквадратных матриц применяется с успехом в химии для баланса химических реакций. На языке алгебры записывается тот факт, что количество атомов в левой части химической реакции должно равняться количеству атомов справа после реакции. Точно также записывается баланс масс этих атомов или состоящих из них химических соединений. При неравновесных реакциях выход продуктов реакции описывается вектором концентраций, то есть тем самым вектором, об анализе которого здесь идет речь.
Эта формулировка превратила химию кинетических реакций в математическую дисциплину с очень интересными и бурно развивающимися математическими приложениями. Это актуально в химии реакций газовых смесей, ядерных реакций, биохимии [27, 28].
Правда, коллеги химики сетуют на отсутствие четкой математической методики в рентгеновской спектроскопии, о чем идет речь в этом очерке.
Авторы - химики разработали аналитическую модель выхода химического продукта, за что кто-то из них получил Нобеля. Правда, ссылка на эту работу была датирована лет на десять позже, чем наша с коллегой публикация [26].
Об истории написания этой статьи
В сложившейся ситуации, приведшей к написанию этой статьи, сыграл большую роль господин Случай. По распределению я со студенческой скамьи попал в контору, которая занималась изучением распространения акустических волн под водой, а точнее обнаружением и локацией подводных акустических целей. Там мне пришлось довольно подробно подучить теорию статистических оценок и распознавания статистических гипотез. Это был там рабочий аппарат при исследованиях и разработке приборов.
Мне там не понравилось. И я согласился с предложением моего друга и однокурсника Геннадия Эдельштейна перейти в физический институт, занимавшийся разработкой научной аппаратуры для рентгеновской спектроскопии. Это широкий спектр аппаратуры, начиная с геологии и кончая медициной. Кроме того, туда брали евреев.
Суть моей будущей специализации было обнаружение спектральных пиков на фоне помех и обработка рентгеновских спектров, определение по зафиксированным спектрам состава вещества. Точнее, решение обратных задач. Ну, кроме того, программы управления прибором. Сама физическая теория взаимодействия рентгеновского излучения с веществом штука известная. А теория решения обратных задач и обработки сигналов она всюду как математика одинакова. Так что я должен был только применить имевшиеся знания.
Мое образование завершили курсы по повышению квалификации инженеров, на матмехе ЛГУ, куда я попал по наводке Александра Колотова, моего коллеги, прекрасного физика и математика, впоследствии переводчика, одного из авторов альманахов Берковича [41]. Я прослушал курс математической статистики и регрессионного анализа Солнцева. Там я узнал об алгебре неквадратных матриц и о современных методах решения обратных задач. Я с восторгом принялся за дело. Восторг, конечно, был относительный. Люди моего возраста могут вспомнить программируемые клавишные вычислительные машины «Искра 1256» или программы на перфокартах, когда получаешь на вычислительном центре время ночью, на другом конце города. Этого времени ты долго ждал. Ты ставишь пакет перфокарт на отладку программы, считыватель заедает одну единственную перфокарту, пакет снимают с очереди, и ты опять ждешь неделями. А программы управления прибором с помощью «искра 1256», записанные на магнитофонные компакт-кассеты! Я в те времена мог с закрытыми глазами делать две вещи – чинить машину Запорожец и ЭВМ «Искра 1256».
Сначала мне сопутствовал успех. Приз на конкурсе молодых специалистов, публикация в «Заводской лаборатории» признана публикацией года, доклад на семинаре в Физтехе как предзащита. Правда, я тогда не обратил внимания на заданный там вопрос « По какой специальности я собираюсь защищаться?» Предлагаемый мною метод решения обратной задачи количественного рентгеноспектрального анализа, оценки максимального правдоподобия, как математический метод известны, математическая модель взаимодействия излучения с веществом известны. Что нового, в чем результат? Оценка точности решения? Но такие работы, естественно, тоже имеются [29]. Я тоже сначала не разобрался, в чем суть. Абсурдность такого утверждения была мне очевидна, но формально мой оппонент был прав. В чем тут суть и разница я разобрался значительно позже.
Далее пришло время перестройки, перестали платить зарплату, предприятия закрывались, приватизировались и перестраивались под продовольственные рынки. Стало не до науки, надо было кормить семью. Волею судеб оказался в Германии, работал программистом.
Но было большое желание опубликовать наработанные результаты в каком–либо солидном научном журнале. Стал посылать статьи в редакции физических журналов. Не принимают. Обоснование – кроме плохого знания английского, статья очень сложна математически и не подходит для публикации в физическом журнале. Она не интересна спектроскопистам. Сначала я сердился. Но потом, когда наткнулся на заметку о том, что статью с точно таким же названием, но американского автора отклонила редакция по тем же самым формальным причинам из-за отсутствия новизны, то до меня стало доходить, что такая публикация будет трудна, если вообще возможна. Мой самый первый оппонент был прав.
Я судорожно искал коллег – экспериментаторов, согласных вместе со мной проверить положения предлагаемой теории. Не нашел.
Кроме того, я был убежден на основании совдеповского опыта, что публикация в солидном журнале возможна лишь в соавторстве с каким-либо признанным авторитетом. Такового тоже не нашлось. Те менеджеры от науки, к которым я обращался, очень удивлялись тому, что они являются соавторами сходных по тематике работ.
Исследователи, занимавшиеся улучшением теоретической модели взаимодействия излучения с веществом, ждали от меня расчетов конкретных образцов, подтверждающих, что мои расчеты лучше, чем другие. Хотя предлагаемые оценки минимальной дисперсии являются наилучшими по построению, это не требует доказательств. Это способ вычислений, с физикой он не имеет ничего общего.
Не понятно, что я предлагаю. Новую программу расчетов? Если нет, то что?
Когда статья с названием «Restricted Least Squares Estimator for FP Method in XRFA and MA. Analysis of Solution» была послана в редакцию физического журнала, то статья была отклонена.
Рецензенты советовали мне послать статью в математический журнал, а для физического журнала написать другую статью, разъясняющую понятия первой. Я уже высказался здесь на эту тему.
Или считают, что «Рекомендации IUPAC и ISO имеют, конечно, общее применение, но не служат практическим целям XRF»
Да, по части простоты понятий, с этим плохо. Даже в таком изложении, как это, все не очень просто. Но именно определения IUPAC и ISO служат отправной точкой для дальнейших построений
Он предлагали мне сосредоточиться на проблеме применения обычной итерационной процедуры для решения любых FP уравнений, например, недостаточной конвергенции в некоторых аналитических ситуациях
Но я трактую проблему итераций и критерий сходимости совсем другим способом. В традиционной постановке задачи обосновать критерий сходимости невозможно. Но при статистическом критерии сходимость алгоритма итераций зависит от величины интервала, в который должны попасть две последовательные итерации. Который в свою очередь зависит как от доверительной вероятности, с которой нам нужен ответ, так и от погрешности экспериментальных данных, величины набранной статистики
Что не поняли рецензенты?
Предлагаемая новая постановка задачи основана на трех пунктах. Во-первых, задача трактуется как специальная некорректная задача, для которой должны выполняться точные условия, сформулированные при постановке прямой задачи. Чего нет в традиционной постановке.
Во-вторых, она формулируется как задача нелинейного регрессионного анализа. При этом существенны понятие о пределе достижимой точности оценки и понятие наилучшей оценки максимального правдоподобия, точность которой асимптотически приближается к этому пределу точности.
Возможность вычислить дисперсионную матрицу оценки трудно переоценить. С ее помощью удается «сшить» в единое целое критерий международного химического консорциума IUPA обнаружения малого количества вещества в пробе, с теорией интервального оценивания параметров и проверки статистических гипотез. Критерий международного химического консорциума IUPA позволяет обнаружить с заданным качеством (вероятностью) наличие сигнала от образца. Предлагаемые критерии принятия решений позволяют вместо этого обнаружить сам элемент с требуемой вероятностью.
В-третьих, учет дополнительных условий, таких как стехиометрические соотношения и прочих, с помощью неквадратных матриц не только упрощает и уточняет постановку задачи, но и допускает постановку новых задач, углубляет анализ. Такой формализм позволяет «сшить» постановки задач химии кинетических реакций и рентгеновского спектрального количественного анализа. Это открывает в будущем перспективы применения динамического дистанционного спектрального анализа при контроле кинетических химических реакций.
При этом эти дополнительные условия надо понимать как наши предположения о структуре образца, математические статистические гипотезы, правильность которых надо проверить с помощью анализа. Число таких содержательных постановок задач безгранично.
Как мы видим, что модель шума участвует непосредственно в постановке задачи. Статистические свойства шумов в постулируемой модели зависят от постановки физического эксперимента. Если речь идёт о разовом измерении спектра спектрометром, то шум обусловлен статистикой счета рентгеновских квантов. Именно так поступил Зиболд.
При проведении повторных экспериментов на образце (в целях калибровки аппаратуры или в других целях), включающих изменяющиеся условия измерений (угол отбора излучения, энергия возбуждающего излучения и пр.) можно считать, что модель шумов, кроме погрешности статистики счета, включает погрешности аппаратурных измерений. Шум можно считать некоррелированным, с нулевым средним, с неизвестной дисперсией, которую можно и надо определить в процессе эксперимента.
Судя по возражениям оппонентов, они не разобрались в этом, оставаясь на старых, известных им позициях.
Суть не в формулах, а в постановке физических спектроскопических задач как задач аналитической химии и статистического анализа. Многие, возникающие при этом задачи не под силу одному человеку. Это должен быть коллектив разработчиков. Пока такового не имеется. Рассчитывать на большое число специалистов, обладающих подобными знаниями в различных областях, не приходится.
С Берковичем, редактором ежемесячного литературно-художественного и научно-популярного журнала «Семь искусств» мне повезло больше, чем с другими. Отчаявшись опубликовать свои труды в каком-либо англоязычном солидном журнале, где мне просто не отвечали, я обратился к нему с предложением опубликовать хотя бы очерк в альманахе «Семь искусств», в разделе наука. Он, к моему удивлению, быстро согласился. С проблемой он был знаком, сам тоже занимался этой задачей. Взялся даже написать предисловие к статье. Он предложил избавиться от формул и постараться на пальцах изложить суть проблемы.
«Дерзайте, у Вас все получится!» со свойственным ему оптимизмом сказал он. Но дальше так быстро дело не пошло.
И, слава богу, спасибо, что не опубликовал так быстро результаты. Понимание приходило постепенно. Беркович указал на то, что эта задача принадлежит к классу некорректных обратных задач. Существенную помощь мне оказал обзор Турчина[36] «Использование методов математической статистики для решения некорректных задач».
По ходу дела Беркович предложил проиллюстрировать общую теорию простыми примерами для двухкомпонентного образца. В процессе подготовки такого текста я уяснил для себя многие вещи. Когда я получил результат, то оказался совсем на другом уровне понимания задачи. Это вылилось в отдельные научные статьи.
Почему же дело с дальнейшим развитием этой дисциплины дальше не продвигается? Есть ли за всем этим чей-то сговор? Думаю, что нет. Скорее есть медленный дрейф научно-исследовательской морали в сторону ее ухудшения под воздействием коммерческих факторов. Далее я пытаюсь анализировать возможные причины этого.
Коль метод сулит такие возможности, то почему все это до сих пор не используется? В чем все - таки собака зарыта? Может быть не слишком корректен предлагаемый математический подход? Нет, по свидетельству профессора математической статистики германского университета в Ганновере с точки зрения математики все корректно.
Может для физиков предлагаемый подход сложноват? Нет, аппарат преобразования неквадратных матриц, SVD преобразование, и основанные на нем алгоритмы были неоднократно применены в методе наименьших квадратов при подгонке параметров расчетных спектров под экспериментальные данные. Программы для алгоритмов решения нелинейных систем уравнений и SVD преобразования опубликованы в сети в составе библиотек программ для математики, они составная часть пакетов типа МATLAB.
С физикой тоже все в порядке, формулы вычисления поправки на взаимодействие элементов вместе с необходимыми библиотеками физических констант опубликованы в сети, алгоритмы и программы решения фундаментальных уравнений связи (смотри первую часть статьи) тоже опубликованы. Разработка на их основе комплектной сервисной компьютерной программы на современном уровне не представляет теоретических трудностей. Речь идет только о модификации способа решения уравнений. В чем же дело? Сам описываемый алгоритм получения оптимальной оценки параметров представляет лишь принципиальную канву. При его практическом осуществлении приходится решать множество задач, представляющих лишь технические трудности, которые многократно описаны. Впрочем, самому ничего не нужно придумывать, в сети имеются библиотеки с отлаженными программами или математические пакеты.
Коль речь идет об обнаружении сигнала и оценке его параметров на фоне шума, то нужна соответствующая адекватная математическая постановка задачи, отвечающая современным требованиям, как это происходит в радиолокации, подводной акустике, радиоастрономии и пр.
Мы говорим об упущенной возможности построения целой науки. И это весьма печально, если не преступно. На мой взгляд, науки «Рентгеноспектральный количественный анализ» как единого целого не существует. Ее предстоит создать.
Приведенный список постановок задач можно было бы продолжить. Но и этого, я думаю, достаточно для того, чтобы понять, что речь идет не об отдельных постановках задач, но о способе рассмотрения, последовательном подходе ко всей тематике, о концепции. Вслед за Бормашенко [45] можно сказать «Для того, чтобы разглядеть в физической реальности математические структуры, их необходимо уже знать».
По моим представлениям вся эта дисциплина должна быть поставлена с ног на голову. Этой статьей я хочу зажечь лампочку в головах исследователей и побудить к дальнейшим исследованиям в этом направлении.
О месте предлагаемого подхода к поиску решения (в моем понимании) в ряду других дисциплин.
Регрессионный анализ как часть статистического анализа известен давно. С помощью метода наименьших квадратов строились кривые интерполяции, чтобы найти пропущенные наблюдения или экстраполяции, чтобы предсказать будущие данные. Внимание фокусировалось на точности регрессии, сам выбор кривой регрессии играл подчиненную роль. Это могла быть прямая линия или полином, сплайн или разложение по системе ортогональных функций. Чем меньше степень аппроксимирующего полинома, тем грубее аппроксимация, однако, тем более найденная кривая подходит для применения в схожем повторном эксперименте, обеспечивая ту же самую точность (робастность алгоритма). Чем дальше точки экстраполяции от середины области, по которой строилась регрессия, тем хуже результат.
Этот анализ нашёл сначала применение при построении кривых рождаемости, погодных изменений, урожайности и прочего. Речь шла, прежде всего, о вероятности оцениваемых событий при известном статистическом распределении исходных данных, о дисперсии точечной оценки, о ее смещенности, или об интервальной оценке с заданной вероятностью принадлежности доверительному интервалу [30, 31, 32].
Далее, при прокладке мощных кабелей связи по дну океана между Старым светом и Америкой, при поиске алгоритмов помехоустойчивого кодирования сигналов, при появлении радиолокации во время второй мировой войны, возрос интерес к теории обнаружения сигналов и оценки их параметров [18].
Появилось понятие количества информации и теория передачи информации. Эта наука была продвинута, прежде всего, трудами Колмогорова, Шеннона и Винера. Получили известность при помехоустойчивом отслеживании сигналов фильтр Винера и винеровская фильтрация сигналов, затем рекурсивный фильтр Калмана.
Появилось понятие оптимальной оценки параметров и оптимальных алгоритмов. Была создана теория принятия статистических решений и распознавания гипотез. Потом появилась наука кибернетика как наука о помехоустойчивых системах управления объектами с положительными и отрицательными обратными связями. Ключевую роль при этом играл метод наименьших квадратов решения неквадратных систем уравнений. В рамках статистического анализа трудами Рао, Митра, Мура, Пенроуза была развита теория неквадратных матриц и обобщенного метода наименьших квадратов [7, 23, 24].
Приходится ли в рамках развитой теории иметь дело с плохо обусловленными обратными задачами? Да. Например, пассивная локация целей, когда по шуму, принимаемому антенной, нужно восстановить сигнал, излучаемый целью, обнаружить и отследить ее.
Если матрица системы уравнений плохо обусловлена, то говорят о мультиколлениарности, почти одинаковости строк матрицы. Уравнений как бы не хватает для однозначного поиска решения. В этом случае в статистической теории говорят о главных компонентах дисперсионной матрицы, о функциях, допускающих оценку, линейных комбинациях искомых переменных, допускающих оценку с заданной точностью.
Но понятие некорректной задачи, как мне кажется, отсутствует.
Применяется ли вся эта статистическая теория в физике при решении некорректных обратных задач?
Да, применяется и давно. Я в свое время зачитал до дыр обзор В.Ф. Турчина[36] «Использование методов математической статистики для решения некорректных задач». Он предложил статистические критерии выбора параметров регуляризации в процедуре коррекции. Данный очерк является, по сути, развитием изложенного им подхода. Кроме того, обзоры 70х годов [37, 38, 39].
Применяется ли вся эта теория в рентгеновской спектроскопии при решении обратных задач?
Мне такие работы не известны. За исключением критерия международного химического консорциума IUPAC [20], который определил общее понятие критерия обнаружения малого количества вещества в пробе и статьи Зиболда. Чаще всего постулируют линейную зависимость интенсивности регистрируемого сигнала от малой концентрации компоненты в смысле регрессионного анализа [17].
Этот следующий абзац я вынес бы в преамбулу статьи. Если посмотреть на изложенное в статье в совокупности, то прорисовываются контуры новой дисциплины, не знаю, как ее назвать, «Статистический спектральный анализ», «Статистическая спектроскопия», «Вероятностные методы спектрального анализа»? То, что статистический анализ это независимый метод исследования, понял еще лорд Рамсей, обнаруживший, что дефицит веса газов воздушной смеси лежит за пределами погрешности измерений. Это привело к открытию аргона. Я убежден, что со временем эта предложенная мной программа будет реализована. Но лучше бы сейчас. Поэтому я отчетливо сознаю необыкновенное значение всего изложенного.
Правда, вполне возможно, что я немножечко опоздал со своими оценками, так как в последнее время интенсивно этой наукой не занимался. Гугл не является реферативной системой, и я не нашел таковой онлайн, чтобы понять сегодняшнее состояние. Если все это уже известно, то я буду только рад.
Что вы думаете на эту тему, математики, физики, прибористы – спектроскописты?
Модельная и регрессионная постановки задач в рентгеноспектральном анализе.
Я исключил из рассмотрения в этой статье чисто регрессионные модели типа концентрация – интенсивность или интенсивность – концентрация. Они довольно часто применяются в рентгенофлуоресцентном анализе, смотрите обзор [21].
Не поместил потому, что в предыдущих вариантах статьи, когда я упоминал в обзоре о чисто регрессионных уравнениях или вообще не упоминал о них, рецензенты при поверхностном знакомстве с содержанием статьи тотчас же путали чисто регрессионную модель с предлагаемым статистическим методом решения физических уравнений.
Но, тем не менее, хочу кратко упомянуть в связи с этим одну ситуацию, сложившуюся в рентгеноспектральном анализе. И не только там. Зачастую путают при постановке задач количественного анализа модельную и регрессионную постановки задач.
Условно разделим все математические модели, применяемые в рентгеноспектральном анализе, на три категории.
Первая категория это физические, модельные зависимости. При этом предполагается некий природный физический механизм, который мы можем удачно описать с помощью математической модели. Параметрам этой модели мы придаем физический смысл. Модель является универсальной, не зависит от прибора или лаборатории. Она, подобно моделям электрона или колеблющейся струны, берется из головы. В нашем случае это атомная физика взаимодействия рентгена с веществом.
Вторая категория близка к первой. Мы предполагаем некий природный механизм, физическую зависимость, но не можем ее описать детально с помощью модели. Тогда для части описания такого объекта предлагается некая эмпирическая формула, часто регрессионная зависимость, не противоречащая здравому смыслу. Параметры этой формулы определяются из калибровочного эксперимента, с помощью подгонки расчетных значений под данные измерений на образцах с известным составом. Так, например, была определена с помощью измерений на образцах разной толщины зависимость поглощения рентгеновского излучения от глубины проникновения в образец, а затем аппроксимации этих измерений с помощью полинома регрессии.
Удачной также является феноменологическая модель α коэффициентов, однородной по концентрациям поправки на взаимодействие, которую мы обсуждали в первой части статьи. Коэффициенты влияния α, вычисленные один раз, применяются в дальнейшем в различных лабораториях.
Назовем эти две ситуации фундаментальными математическими моделями взаимодействия излучения с веществом. Именно их я рассматриваю в очерке.
Третий вид зависимостей – это регрессионные зависимости. Они не предполагают никакой природной связи между измеряемыми величинами и переменными параметрами. Расчет привязан к данной лаборатории, то есть к данным условиям анализа. Зависимость измерений от параметров описывается тогда какой-либо произвольно выбранной функцией, чаще всего (но не всегда) линейной или полиномом, коэффициенты определяются из калибровочного эксперимента. Постулируемые в этом случае регрессионные зависимости типа концентрация – интенсивность или интенсивность – концентрация не предполагают никакого физического описания природной связи между измеряемыми величинами и переменными параметрами кроме единственного предположения, что при воспроизведении тех же самых условий эксперимента будут получены те же самые результаты.
Аналогом подобной регрессионной зависимости может служить кривая траектории самолета с целью предсказания будущих значений положения. Чем дальше «вперед» предсказание, тем менее оно точно. Для каждой новой ситуации (подобно траектории самолета) аппроксимация должна быть проведена по новой.
Предположив линейную регрессионную зависимость интенсивности излучения от концентрации и, определив согласно общей методологии регрессионного анализа, ее наклон на совокупности калибровочных образцов, мы тем самым сознательно проигнорировали физику явления и нелинейность зависимости, возникающей из-за наличия взаимодействия элементов в образце.
Но с точки зрения математики такое описание корректно. Неизвестные нам теперь факторы взаимодействия элементов скажутся на погрешности наклона прямой и приведут к загрублению описания. О выполнении уравнения нормировки теперь нет и речи, хотя в реальности это повлияет на результат. Наилучшей модели теперь не существует, все модели линейные и нелинейные (полиномы) относительно равноправны, погрешность, даваемая калибровочной кривой, зависит от многих факторов, в том числе от области предсказания и совокупности образцов калибровки. Если подобного описания достаточно для практических целей, то все корректно. Но физики в этом нет.
Нужно ли оставаться только в рамках физических понятий? Наверное, нет. Ведь наука не религия. Но нужно четко разделять понятия.
Дискуссия с профессором
Вот что мне ответил в дискуссии обо всем выше изложенном известный и авторитетный немецкий профессор, автор десятка монографий и сотен публикаций по методикам применения данной аппаратуры, сотрудник американской фирмы – поставщика рентгеновских спектрометров, когда я отправил ему статью [13] на рецензию, привожу дословный перевод.
«Ваши выводы и методика имеют высокую степень абстракции, я чувствую себя даже слегка перегруженным. Но позвольте мне указать на следующее: При данных вычислительных способностях нормального современного персонального компьютера даже решение ' trial and error' (метод проб и ошибок) было бы возможно в среднем при 10 элементов в спектре, т.е. вычисления продолжают так долго, пока результаты не совпадут с измерением. Можно легко представить себе, что простыми деревьями решений и логикой можно конечно это ускорить существенно. И верьте мне, итерации всегда сходятся, даже при случаях большой нелинейности.
Как я понял, Вы можете при этом теоретически рассчитать погрешность решения.
Однако, уже давно, как я грубо описал, все перешли на численное решение уравнений. Если имеется система уравнений, которую я не могу решить, тогда просто применяются возможности компьютера и ищется численное решение, для каждого набора данных по новой. Ошибки также могут очень точно определены с помощью варьирования модели, при этом измеренные величины варьируются в известных для них пределах неопределенности и исследуется, как изменился результат.
Да, всегда необходимо решать систему уравнений и применять схему итераций. Однако абсолютно все равно как. Важнее правильно сформулировать критерий остановки итерации при поиске решения.
....Я делаю в моей оценке спектров также очень детальный расчет ошибок стохастики измерительного сигнала, далее ошибок при учете сплошного фона и разделения пиков вплоть до матричной коррекции. Интересно, что получается при наложении ошибок в конце. Теоретическая ошибка при решении системы уравнения практически исчезает. Однако, для элемента в пробной матрице, который сильно поглощается, имеют очень большое значение как ошибки коррекции поглощения так и ошибки применяемых массовых коэффициентов поглощения.
Мои результаты анализов будут в лучшем случае 2. 3% относительной ошибки и типично 5. 10%. Это не очень точно, но это практическая правда....
...В одном пункте я не согласен с Вами. Ненормируемые результаты имеют большую важность и являются решающим критерием при оценке результатов анализов... Ненормируемый результат аналитики, свободной от стандартов, превосходен. Конечно, имеет смысл дополнительно тогда вычислять нормируемые результаты в большинстве случаев. Но если в сумме, например, только 59% стоит ... тогда либо какой-то элемент забыли учесть ( пропустили) или линия рентгена ошибочно идентифицирована (предполагается L - излучение вместо K или имеется наложение нескольких элементов). Сумма как составная часть результата тогда весьма существенна для интерпретации результатов анализа.
Однако, при изучении Вашей работы я спросил себя, где Ваша методика вычислений могла бы помочь мне (при решении системы уравнений). Я не мог понять, где наличествующие решения упираются в математические модельные границы и (должны были бы) могли бы заменяться Вашими...
Не надейтесь, что Вы сегодня еще найдете на REM (растровый электронный микроскоп) или на микрозонде много ученых, которые культивируют методику и могли бы интересоваться, таким образом, Вашей работой. Там сидят нажиматели кнопок и кликатели мышкой. Они используют рентгеновскую спектроскопию как средство, чтобы решать свои специальные задачи ... так же как Вы ваш телевизор, чтобы смотреть последние известия. Представьте себе, что однажды на соседнем углу кто-то хочет продать Вам новый телевизионный пульт дистанционного управления, который должен быть очень замечательным, но не имеет никаких клавиш.... Вы не будете слушать, почему он должен быть в принципе лучше, чем ваш .... Вы имеете уже один, который функционирует....»
Далее профессор посоветовал мне сосредоточить свои усилия на поиске критерия остановки процедуры итераций, обсуждавшийся в первой части статьи.
Честно говоря, подобный ответ меня поразил. Меня больше всего поразило то, что все вопросы передоверены вычислительной технике, в которую свято верят. Речь идет не только о конкретном моем оппоненте, но об общей тенденции, описанной в цитате. Это противоречит самим основам физики и математики, как я их понимаю.
Можно вспомнить о машине Тьюринга, которая в принципе эквивалентна с точностью до технических деталей обыкновенной вычислительной машине. Если этой машине поручить доказательство математической теоремы и задать алгоритм вычислений или последовательность логических шагов и критерий остановки алгоритма при достижении правильного результата или отсутствии такового, то можно рассчитывать на успех доказательства.
Но что является правильным, а что ложным решением, или его отсутствием, чтобы задать критерий остановки алгоритма, должен знать человек, а не машина. Нужно определить, что является решением и описать алгоритм, способ получения этого решения. Искать нечто, что не определено точно, не иметь приемлемого критерия остановки алгоритма и применять для этого методы случайного поиска и искусственного интеллекта?...
На первый план оппонент выдвигает критерий целесообразности проведения научных изысканий. Их имеет смысл проводить, если от них ожидается существенный профит. Но кто мог заранее предсказать профит, полученный от открытия электромагнитных волн?
Или как насчет аргумента, что если есть приемлемо работающий алгоритм, то зачем еще один, более лучший?
Оптимальность предлагаемого мною подхода не требует дополнительных доказательств, он оптимален по построению. Но мой оппонент сетует, что мною не представлена конкретная вычислительная программа и результаты расчетов, убедительно демонстрирующие преимущество предлагаемого подхода.
В том то и дело. О какой программе может идти речь? Предлагаемый подход получения решения ставит под сомнение всю существующую на сегодня методику решения подобных уравнений.
Какую из конкурирующих физических моделей и систем поправочных множителей выбрать для расчета? Видимо ту, которая дает наименьшую среднеквадратичную погрешность рассогласования с экспериментальными данными среди рассмотренных моделей в случае подстановки в модель оценки минимальной дисперсии, о которой шла речь в первой части (анализ остатков). «Средняя по больнице температура пациентов» как результат больше не годится. Но определение такой модели – большая работа, которая по силам лишь коллективу исследователей. Меняется вся философия оценки качества полученного решения.
Как мы видели, описание случайных факторов, «шумов» эксперимента является также составной частью постановки задачи, без которых определение понятия решения уравнений невозможно.
И уж вовсе нельзя путать устойчивость решения к вариациям параметров модели со статистической погрешностью решения, как это делает мой оппонент.
Список цитированной литературы
1. Steinbrecher, Stefan. A unified Monte Carlo approach for quantitative standardless x-ray fluorescence and electron probe microanalysis inside the scanning electron microscope. Dissertation, 2004, http://nbn-resolving.de/urn/resolver.pl?urn=urn:nbn:de:bsz:21-opus-13007
2. Kurt F.J. Heinrich. The Golden Age of Microanalysis, Microsc. Microanal. 7, 108–118, 2001, DOI: 10.1007/s100050010067
3. Ziebold T. O., 1967 Precision and sensitivity in electron microprobe analysis. Anal. Chem. 39 8581
4. Ziebold T.O., Ogilvie R.E., Anal. Chem. 1964, v.39, p.322-327
5. Ancey M, Bastenaire F and Tixier R 1978 Microanalysis and scanning electron microscopy. Proc. summer school, St-Martin-d'Heres, France, Sept. 11-16, 1978. Maurice F, Meny L and Tixier R, eds. (Orsay: Les Editions de Physic, 1979, ISBN 2-902731-03-5) 319
6. R B Marinenko and S Leigh “Uncertainties in electron probe microanalysis” 11th European Workshop on Modern Developments and Applications in Microbeam Analysis IOP Publishing IOP Conf. Series: Materials Science and Engineering 7 (2010) 012017 doi:10.1088/1757-899X/7/1/012017
7. Albert, A. (1972) Regression and the Moore-Penrose Pseudoinverse; A.P., N.Y., русский перевод Алберт А. Регрессия, псевдоинверсия и рекуррентное оценивание, М. Наука, 1977. - 224 с
8. Eduard M. Shekhter. (2021). Матричная форма записи соотношений масс в химических соединениях (стехиометрия) применительно к рентгеноспектральному анализу. http://doi.org/10.5281/zenodo.4537689, https://chekhter.de, статьи
9. Eduard M. Shekhter. (2021). Статья Зиболда «Precision and Sensitivity in Electron Microprobe Analysis», 50 лет спустя. http://doi.org/10.5281/zenodo.4540723
10. B. I. Kitov Calculation features of the fundamental parameter method in XRF, X-Ray Spectrometry, 2000; 29: 285–290
11. Limit of detection http://www.chemometry.com/Research/LOD.html
12. Хемометрика, материал из Википедии — свободной энциклопедии http://ru.wikipedia.org/wiki/%D0%A5%D0%B5%D0%BC%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%BA%D0%B0
13. Eduard M. Shekhter. (2021). Метод фундаментальных параметров в рентгеновской спектроскопии как статистическая задача нелинейной регрессии при наличии априорных ограничений. Критический анализ ситуации. http://doi.org/10.5281/zenodo.4553107, https://chekhter.de, статьи
14. Шехтер Э.М. Неравенство Крамера –Рао для оценок с ограничениями и потенциальная точность количественного рентгеноспектрального анализа, https://chekhter.de, статьи
15. Goldstein JI, Newbury DE, Echlin P, Joy DC, Romig AD Jr, Lyman CE, Fiori C, Lifshin E (1992) Scanning Electron Microscopy and X-ray Microanalysis, 2nd ed. New York: Plenum Press
16. Eduard M. Shekhter. (2021). Обобщение формулы Зиболда на многокомпонентный образец. http://doi.org/10.5281/zenodo.4553819, https://www.chekhter.de
17. E. Lifshin, N. Doganaksoy, J. Sirois, R. Gauvin, Microsc. Microanal. 4, 598-604, 1999
18. H. R. Van Trees, Detection, Estimation, and Modulation Theory, part 1, J.W., N.Y., (1968) (есть русский перевод)
19. International Standard, ISO 3534-1, Statistics-Vocabulary and symbols, (1993)
20. IUPAC, Compendium of Chemical Terminology, 2nd Edition (1997)
21. Handbook of Spectrometry: 2nd ed., edited by R.E. Van Grieken and A.A. Marcowicz, M.D. Inc., (2002)
22. Juan M. Rodriguwz-Poo, Computer-aided Introduction to Econometrics, edited by Springer (2002), 350 p., SBN:354044114X
23. G. A. F. Seber, C.J. Wild, Nonlinear Regression, J.W., N.Y., (1989)
24. C.R. Rao, Linear Statistical Inference and Its Application, 2nd ed., J.W., N.Y., (1973)
25. E. Shekhter, Industrial Laboratory, 1986, v. 52, Nr. 5, p.p. 445-449
26. E. Shekhter, G. Edelstein, Industrial Laboratory, 1991, v. 57, Nr. 5, p.p. 536-545
27. Representing Reconstructed Networks Mathematically: The Stoichiometric Matrix, Bernhard Palsson, Lecture #4, September 15, 2003, University of California, San Diego, Department of Bioengineering.
28. The Stoichiometry of Reactions—Introduction, Copyright 2015 by Nob Hill Publishing, LLC
29. R. M. Rousseau, The Rigaku Journal, v. 18, Nr. 2, 2001
30. Кендалл М., Стюарт А., Теория распределений, М.: Наука, 1966. — 588 с.: ил
31. Кендалл М., Стюарт А. Статистические выводы и связи, М.: Наука, Т. 2, 1973. — 899 с.
32. Кендалл М., Стюарт А. Многомерный статистический анализ и временные ряды, М.: Наука, 1976. — 736 с.
33. Крамер Г. Математические методы статистики, М.: Мир, 1975 г. - 648с.
34. Rob Nowak Clayton Scott The Cramer-Rao Lower Bound, https://cnx.org/contents/g433V4cH@4/The-Cramer-Rao-Lower-Bound
35. Ricardo Gutierrez-Osuna L4: Bayesian Decision Theory, http://research.cs.tamu.edu/prism/lectures/pr/pr_l4.pdf
36. В.Ф. Турчин, В.П. Козлов, М.С. Малкевич Использование методов математической статистики для решения некорректных задач, Том 102, вып. 3, 1970 г. Ноябрь
37. Л. А. Xалфин, «О теоретико-информационном подходе к теории спектральных приборов». Труды Всесоюзн. совещ. по теории вероятностей и математической статистике (Ереван), Изд-во АН Арм. ССР, 1960, стр. 187.
38. Л. А. Xалфин «Статистический подход к решению некорректных задач геофизики», Санкт-Петербургское отделение Математического института им.В.А.Стеклова РАН, http://www.mathnet.ru/php/getFT.phtml?jrnid=znsl&paperid=2926&what=fullt&option_lang=rus
39. Раутиан С. Г., «Реальные спектральные приборы», УФН, т. 66, вып. 3, стр. 47, 1958 г., http://ufn.ru/ru/articles/1958/11/d/
40. Леман Э. Проверка статистических гипотез, 2-е изд. испр. — М.: Наука, 1979. — 408
41. http://club.berkovich-zametki.com/?p=4396. Александр сменил физику на литературное творчество. И тоже с успехом
42. https://de.wikipedia.org/wiki/Wiener-Dekonvolution#Herleitung
43. X-Ray Spectrometry: Recent Technological Advances. Edited by K. Tsuji, J. Injuk and R. Van Grieken 2004 John Wiley & Sons, Ltd ISBN: 0-471-48640-X, Chapter 1 Introduction, 1.1 Considering the Role of X-ray Spectrometry in Chemical Analysis and Outlining the Volume, R. VAN GRIEKEN University of Antwerp, Antwerp, Belgium
44. D.C. Montgomery, E.A. Peck, G.G. Vining, Introduction to Linear Regression Analysis, 3 ed., J.W. &S., N.Y., 2001
45. Эдуард Бормашенко. Непостижимая эффективность математики в точных науках, http://7i.7iskusstv.com/y2020/nomer12/bormashenko/
46. COMPUTER METHODS FOR MATHEMATICAL COMPUTATIONS GEORGE E. FORSYTHE MICHAEL A. MALCOLM Department of Computer Science University of Waterloo CLEVE B. MOLER Department of Mathematics and Statistics University of New Mexico PRENTICE-HALL, INC. ENGLEWOODCLIFFS, N . J . 0 7 6 3 2
47. Александров А.Ю., Жук В.В., Камачкин А.М. Лекции по математическому анализу, http://www.apmath.spbu.ru/ru/education/final/question08.pdf
48. Википедия, https://en.wikipedia.org/wiki/Errors_and_residuals
49. Gary L. Long and J. D. Winefordner, Limit of detection. A closer look at the IUPAC definition, Anal. Chem. 1983, 55, 7, 712A–724A, Publication Date: June 1, 1983, https://doi.org/10.1021/ac00258a001
P.S. "Данная статья в сокращенном и переработанном виде была сперва опубликована в журнале "Семь искусств" 21.03.2022"