Пороговая процедура

Эти методы порогового значения представляют собой группу алгоритмов для сегментации цифровых изображений . Сегментация в целом может быть важным шагом в анализе изображения, например, для идентификации объектов на изображении. С помощью методов порогового значения в простых ситуациях можно решить, какие пиксели представляют искомые объекты, а какие принадлежат их окружению. Пороговые методы приводят к бинарным изображениям .

введение

Мотивацией к использованию двоичных изображений обычно является доступность быстрых алгоритмов двоичных изображений, например, для анализа blob ; Сегодня экономия места для хранения играет меньшую роль в приложениях для обработки изображений.

Как и во всех методах сегментации, при использовании метода порогового значения точки изображения - так называемые пиксели - распределяются по разным группам - так называемым сегментам . Изображение, которое нужно сегментировать, имеет форму числовых значений (одно или несколько значений цвета на пиксель). Принадлежность пикселя к сегменту определяется путем сравнения значения серого или другой одномерной характеристики с пороговым значением . Значение серого пикселя - это чистое значение яркости; дополнительная информация о цвете не учитывается. Поскольку эта операция в основном используется независимо для каждого пикселя, метод порогового значения представляет собой так называемый метод пиксельно-ориентированной сегментации.

Методы порогового значения являются одними из самых старых методов обработки цифровых изображений . Известный процесс Оцу, описанный в одноименном разделе, был опубликован в 1979 году Нобуюки Оцу . Однако есть более старые публикации на эту тему. Методы порогового значения могут быть реализованы быстро благодаря их простоте, а результаты сегментации могут быть рассчитаны с небольшими усилиями. Однако качество сегментации обычно хуже, чем при использовании более сложных методов.

классификация

Сегментация изображения обычно является первым шагом в анализе изображения в процессе машинного зрения и происходит после предварительной обработки изображения. Типичная последовательность в системе обработки изображений следующая:

Сцена → получение изображения → предварительная обработка изображения → сегментация (например, метод порогового значения ) → выделение признаков → классификация → утверждение

Сцена представляет собой один или несколько реальных наблюдаемых объектов. С помощью подходящих датчиков создается изображение сцены, обычно фотография или видеозапись . В принципе, однако, источником изображения может служить любой метод визуализации , так что, например, также можно использовать радарное сканирование или рентгеновские изображения . Если изображение не в цифровой форме, оно должно быть сначала оцифровано путем сканирования, например , чтобы иметь возможность обрабатывать его в дальнейшем на компьютере.

Предварительная обработка изображения улучшает изображение, так что следующие шаги могут быть выполнены более эффективно. Это может означать, например, коррекцию яркости, повышение контрастности или резкость краев. Какие операции предварительной обработки являются предпочтительными, зависит от конкретных процедур на следующих этапах. Методы порогового значения обычно чувствительны к изменениям яркости изображения, поэтому компенсация яркости может быть полезной.

На этапе сегментации пиксели изображения разделяются на сегменты, для которых, например, используется метод порогового значения. При последующем извлечении признаков для каждого сегмента определяются определенные свойства - так называемые признаки . Какие это характеристики, во многом зависит от конкретного случая. Примеры включают площадь, эксцентриситет формы или среднее значение цвета.

С помощью характеристик и ранее определенного набора правил или предварительно обученного классификатора каждый сегмент теперь можно отнести к одному из нескольких классов. Интерпретируя этот результат, можно сделать окончательное утверждение, например, при распознавании текста: «Показанный объект - это буква 'f' и никакой другой».

характеристики

Обычно метод порогового значения преобразует исходное изображение в двоичную форму , т.е. формируются ровно два сегмента - что, вероятно, является наиболее распространенным применением этого метода, в идеале - фон и искомые объекты. Назначение двух сегментов (0 и 1) происходит на основе сравнения значения серого g наблюдаемого пикселя с ранее определенным пороговым значением t (на английском языке threshold означает «пороговое значение»). Таким образом, результирующее изображение может быть вычислено с очень небольшими вычислительными усилиями , поскольку для каждого пикселя необходимо выполнять только одну простую операцию сравнения. Соответствующее правило расчета на рисунке : ${\ displaystyle T _ {\ text {global}}}$

{\ displaystyle T _ {\ text {global}} (g) = {\ begin {cases} 0 & {\ text {Fall}} g <t \\ 1 & {\ text {Fall}} g \ geq t \ end {case }}}

Методы порогового значения - это так называемые методы полной сегментации, то есть каждый пиксель назначается сегменту. Они также не имеют перекрытия, поэтому пиксель не назначается нескольким сегментам. В отличие от многих других методов сегментации, методы порогового значения не образуют непрерывных сегментов. Вполне возможно и часто требуется, чтобы несколько пространственно разделенных объектов на изображении, которые имеют одинаковое значение яркости, были объединены в сегмент. На практике также регулярно возникает некорректная сегментация отдельных пикселей в середине объектов, что связано, например, с шумом изображения в выходном изображении . Размер сегментированных объектов может сильно различаться в зависимости от выбора порогового значения.

варианты

Независимо от выбора порогового значения (как описано в одноименном разделе ниже), основной принцип метода порогового значения может применяться различными способами.

В методе глобального порога пороговое значение выбирается глобально для всего изображения. Соответствующее правило расчета уже было указано в разделе « Свойства » выше. Процедуру проще всего вычислить, но она также очень чувствительна к изменениям яркости изображения.

Поэтому методы порогового значения с глобальным порогом успешно используются в промышленных приложениях только для высококонтрастных изображений. Такие изображения возникают, например, при сканировании оригиналов или при съемке в проходящем свете.

Путем определения нескольких пороговых значений глобальный метод может быть изменен таким образом, чтобы сегментирование предоставляло более двух сегментов. Для n сегментов требуется (n-1) пороговых значений t _i :

{\ displaystyle T _ {{\ text {global}} _ {n}} (g) = {\ begin {cases} 0 & {\ text {Fall}} g <t_ {1} \\ 1 & {\ text {Fall} } t_ {1} \ leq g <t_ {2} \\\ vdots & \ vdots \\ n & {\ text {падает}} g \ geq t_ {n-1} \ end {cases}}}

При использовании метода локального порогового значения исходное изображение делится на области, и пороговое значение определяется отдельно для каждой области. Это означает, что подходящее пороговое значение t _i может быть выбрано в каждой области R _{i изображения,} не влияя на качество сегментации в других областях. Правило расчета для каждого пикселя (x, y) :

{\ displaystyle T _ {\ text {local}} (x, y) = {\ begin {case} 0 & {\ text {if}} g (x, y) <t_ {i} \\ 1 & {\ text {if }} g (x, y) \ geq t_ {i} \ end {case}} \ quad \ forall (x, y) \ in {\ text {region}} R_ {i}}

По сравнению с методом глобального порогового значения сложность увеличивается незначительно; поэтому локальный метод также может быть рассчитан с небольшими вычислительными затратами. Восприимчивость к изменению яркости снижается, но может быть смещение на границах областей. В зависимости от количества регионов усилия могут быть слишком высокими, чтобы один человек мог выбрать подходящее пороговое значение для каждого региона. Поэтому рекомендуется автоматическая процедура выбора порогового значения.

Метод динамического порогового значения можно рассматривать как дальнейшее развитие локального метода , который рассматривает окрестность N для каждого пикселя и вычисляет подходящее пороговое значение t (N) на основе этой окрестности . Здесь абсолютно необходима автоматическая процедура выбора порогового значения. Соответствующее правило расчета для каждого пикселя (x, y) :

{\ displaystyle T _ {\ text {dynamic}} (x, y) = {\ begin {cases} 0 & {\ text {if}} g (x, y) <t (N (x, y)) \\ 1 & {\ text {падает}} g (x, y) \ geq t (N (x, y)) \ end {case}}}

Динамический вариант достаточно устойчив к локальным изменениям яркости. Однако здесь значительно возрастают вычислительные затраты, поскольку для каждого пикселя вычисляется новое пороговое значение.

пример

Шумовое изображение
Исходное изображение ...
... и соответствующая гистограмма (логарифмическая шкала).

Образец изображения представляет собой зашумленное изображение в оттенках серого с нечеткими краями, как показано слева. Размытые края здесь означают, что края нечеткие, а скорее переходят от белого фона к черному объекту, а пиксели в краевой области приобретают разные оттенки серого.

Соответствующая гистограмма (справа) помогает выбрать пороговое значение, соответствующее изображению . На гистограмме частота каждого отдельного значения серого указывается соответствующей высокой линией. Таким образом, полоса с различными значениями серого отображается в виде легенды на горизонтальной оси координат, а высота строки над ней указывает относительную частоту появления соответствующего значения серого.

На гистограмме хорошо видны два максимума : темный объект (левый максимум) и светлый фон (правый максимум). Каждое значение серого между двумя максимумами также появляется на изображении, что вызвано шумом на изображении и мягкими краями объекта, где пиксели постепенно принимают различные уровни серого от белого до черного.

Исходное изображение было сегментировано с использованием метода глобального порогового значения; для демонстрации метода результирующее изображение было рассчитано для четырех различных пороговых значений. В результирующих двоичных изображениях, каждое с двумя группами сегментов, каждый пиксель был окрашен в черный (0) или белый (1) цвет в соответствии с его назначением объекту или фону. Точнее: все пиксели со значениями серого меньше порогового значения были окрашены в черный цвет, все пиксели со значениями серого больше или равными пороговому значению были окрашены в белый цвет.

Сегментация с другим порогом
Порог 30
Порог 52
Порог 204
Порог 230

Когда он сегментируется с пороговым значением 30, несколько пикселей, принадлежащих объекту, окрашиваются в белый цвет, то есть сегментируются по фону. Поэтому порог был выбран слишком низким.

С двумя пороговыми значениями 52 и 204 результаты вполне приличные. Это также относится ко всем пороговым значениям между этими двумя значениями. Разницу можно увидеть в том, что объект становится немного больше по мере увеличения порогового значения. Таким образом, выбор порогового значения влияет не только на качество самой сегментации, но и на размеры сегментированных областей. Причиной увеличения площади являются пиксели в краевой области, которые постепенно перекрывают значения серого от белого до черного.

Порог 230 также сегментирует некоторые пиксели фона как принадлежащие объекту. Это показатель того, что он был выбран слишком большим.

Выбор порога

Ключевым моментом во всех методах порогового значения является выбор подходящего порогового значения. Это может быть разумно выбрано человеческим процессором. Однако, поскольку метод локального и динамического порогового значения требует большего количества пороговых значений, рекомендуется использовать автоматический метод определения пороговых значений. Конечно, пороговое значение также может быть определено автоматически с помощью метода глобального порогового значения. Существует большое количество конкретных методов выбора подходящего порогового значения.

Гистограмма является наиболее важным помощником как при ручном, так и при автоматическом определении порогового значения. Локальные максимумы указывают на значения серого или диапазоны значений серого, которые предполагаются в изображении на фоне или от более крупных объектов. В идеальном случае гистограмма является бимодальной , то есть можно распознать два четко разделенных максимума. Простой, но также подверженный ошибкам подход заключается в выборе среднего значения между двумя максимумами в качестве порогового значения. Другой, простой подход - определить значение серого минимума между максимумами в качестве порогового значения. Это, вероятно, позволило бы добиться несколько лучшего разделения.

Если вы обрабатываете изображения из одного и того же источника снова и снова, вы часто можете применить пороговое значение, выбранное один раз, ко всем этим изображениям.

Одним из наиболее сложных методов автоматического определения пороговых значений является метод Оцу, который зарекомендовал себя как стандарт и будет представлен ниже.

Процедура Оцу

Метод Оцу согласно Нобуюки Оцу с 1979 года использует статистические инструменты для решения проблемы наилучшего возможного порогового значения. В частности, используется дисперсия , которая является мерой разброса значений - в данном случае речь идет о разбросе значений серого.

Метод Оцу определяет пороговое значение, при котором разброс внутри классов, определяемых им, является как можно меньшим, но в то же время как можно большим между классами. Для этого формируется частное между двумя отклонениями и ищется пороговое значение, при котором оно является как можно большим (максимальным).

Математическое представление

Начальная точка - это два класса точек ( и ), которые отделены друг от друга на основе искомого порогового значения . - это переменная, которую вы ищете, два класса - это желаемый результат. Далее с помощью метода Оцу определяется мера, в соответствии с которой может быть оптимизировано пороговое значение (и, следовательно, классы). ${\ Displaystyle K_ {0} (т)}$ ${\ Displaystyle K_ {1} (т)}$ ${\ displaystyle t}$ ${\ displaystyle t}$

Пусть вероятность появления значения серого равна 0 <g <G (G - максимальное значение серого). Тогда вероятность появления пикселей двух классов получается с: ${\ displaystyle p (g)}$

{\ displaystyle K_ {0}}

: и :

{\ Displaystyle P_ {0} (t) = \ sum _ {g = 0} ^ {t} p (g)}

{\ displaystyle K_ {1}}

{\ Displaystyle P_ {1} (t) = \ sum _ {g = t + 1} ^ {G} p (g) = 1-P_ {0} (t)}

Если предположить, что два класса (т.е. пороговое значение), сумма этих двух вероятностей, конечно, равна 1.

Если среднее арифметическое от значений серого находится в пределах всего изображения, а также и средние значения в пределах отдельных классов, то отклонения в пределах двух классов , как результат: ${\ displaystyle {\ overline {g}}}$ ${\ displaystyle {\ overline {g_ {0}}}}$ ${\ displaystyle {\ overline {g_ {1}}}}$

{\ displaystyle \ sigma _ {0} ^ {2} (t) = \ sum _ {g = 0} ^ {t} (g - {\ overline {g_ {0}}}) ^ {2} p (g )}

и

{\ displaystyle \ sigma _ {1} ^ {2} (t) = \ sum _ {g = t + 1} ^ {G} (g - {\ overline {g_ {1}}}) ^ {2} p (Г)}

Теперь цель состоит в том, чтобы сохранить как можно более низкую дисперсию значений серого в отдельных классах, в то время как дисперсия между классами должна быть как можно большей. Это приводит к следующему коэффициенту:

{\ displaystyle Q (t) = {\ frac {\ sigma _ {zw} ^ {2} (t)} {\ sigma _ {in} ^ {2} (t)}}}

Разница между классами:

{\ displaystyle \ sigma _ {zw} ^ {2} (t) = P_ {0} (t) \ cdot ({\ overline {g_ {0}}} - {\ overline {g}}) ^ {2} + P_ {1} (t) \ cdot ({\ overline {g_ {1}}} - {\ overline {g}}) ^ {2}}

Разница внутри классов является результатом суммы двух индивидуальных дисперсий:

{\ displaystyle \ sigma _ {in} ^ {2} (t) = P_ {0} (t) \ cdot \ sigma _ {0} ^ {2} (t) + P_ {1} (t) \ cdot \ сигма _ {1} ^ {2} (t)}

Теперь пороговое значение выбрано так, чтобы частное было максимальным. так это сумма, которую вы ищете. Если пороговое значение определяется путем максимизации частного, оно делит наборы точек на оптимальные классы в соответствии с дисперсией. ${\ displaystyle t}$ ${\ Displaystyle Q (т)}$ ${\ Displaystyle Q (т)}$

Проблемы

Проблемы с яркостью
Картинка с градиентом яркости, ...
... связанная гистограмма (линейное масштабирование) ...
... и результат сегментации с пороговым значением 127.

Метод глобального порога очень чувствителен к изменениям яркости изображения. Три изображения демонстрируют эту проблему: исходному изображению (слева) был задан градиент яркости. Гистограмма (средний рисунок) больше не является бимодальной, так как в приведенном выше примере невозможно различить два четко разделенных максимума, но имеется значительно больше, довольно небольших локальных максимумов. Изображение результата (справа) сегментации с пороговым значением 127 несовместимо: в верхнем левом углу целые области фона сегментируются как объект, в то время как объект в правом нижнем углу распознается как фон. Примерно правильная сегментация только в середине изображения.

Применение локального или даже динамического метода пороговых значений могло бы улучшить результат сегментации здесь. Однако последнее, в частности, требует больших вычислительных ресурсов. Кроме того, необходимо убедиться, что все объекты, подлежащие сегментации, встречаются в каждой области, в противном случае автоматически выбранные пороговые значения могут быть вычислены неправильно. Например, если на изображении есть три объекта (и фон), выбираются три пороговых значения для разделения четырех классов. Если только два из трех объектов появляются в области, то третье пороговое значение не может быть правильно определено там. Таким образом, результат сегментации из этого региона не будет хорошо совпадать с результатами из других регионов. Альтернативное решение было бы , чтобы компенсировать яркость на стадии предварительной обработки, например , с помощью коррекции затенения или путем смещения опорного изображения .

В дополнение к градиентам яркости, другие ошибки изображения, которые могут привести к проблемам сегментации, могут быть устранены или уменьшены с помощью соответствующей предварительной обработки изображения. Часто используется удаление шума с изображений или резкость краев. Постобработка также может помочь устранить проблемы сегментации. Таким образом, неправильно сегментированные пиксели могут быть исправлены людьми или с помощью подходящей фильтрации.

В отличие от многих других методов сегментации, метод порогового значения не приводит автоматически к непрерывным сегментам; если имеется много шума, отдельные пиксели почти всегда сегментируются.

Методы порогового значения всегда используют только информацию об одномерном изображении (обычно значение интенсивности или значение серого). Дополнительная информация, например различные цветовые каналы, не оценивается.

Некоторых из этих проблем можно избежать, используя другие, иногда более сложные, методы сегментации .

Приложения

Методы порогового значения очень хорошо подходят для быстрой бинаризации (разделения объектов и фона) равномерно освещенных изображений, например сканированных изображений . Это означает, например, хорошую пригодность для первого шага распознавания текста .

Он включен в качестве функции редактирования во многие программы редактирования изображений , такие как GIMP , ImageJ и IrfanView .

Методы пороговых значений также являются стандартными методами обработки цифровых изображений и включены в эту область в каждой библиотеке программ .

литература

Томас Леманн, Вальтер Обершельп, Эрих Пеликан, Рудольф Репгес: Обработка изображений для медицины . Springer, Berlin / Heidelberg 1997, ISBN 3-540-61458-3 .
Бернд Яне : Цифровая обработка изображений . 5-е издание. Springer, Берлин, 2002 г., ISBN 3-540-41260-3 .
Рафаэль С. Гонсалес, Ричард Э. Вудс: обработка цифровых изображений . Addison-Wesley, Reading MA 1992, ISBN 0-201-50803-6 (английский).
Нобуюки Оцу: метод выбора порога на основе гистограмм уровней серого . В: Транзакции IEEE о системах, человеке и кибернетике . Нью-Йорк, 9.1979, стр. 62-66. ISSN 1083-4419

веб ссылки

Презентация семинара по сегментации (PDF; 900 kB)

Индивидуальные доказательства

↑ Обзор методов определения пороговых значений изображений (английский; PDF; 3,0 МБ)

Эта статья была добавлена в список отличных статей 10 ноября 2006 года в этой версии .

[Schwellenwertbestimmung-1] Обзор методов определения пороговых значений изображений (английский; PDF; 3,0 МБ)

Languages