Visual Perception

by 김현도 (rlaguseh12@gmail.com)

출처 : Perception, Chapter 2, Cognitive Psychology and Its Implication 7th, John R. Anderson.

 

목  차

1.       뇌에서의 Visual Perception

2.       Pattern을 통한 인식

3.       Context를 통한 인식

4.       결론

우리는 다양한 감각을 통해 정보를 받아들이고, 해석하여 세상과 교류한다. 다양한 정보들 중 우리의 뇌는 시각 정보를 처리하는 데 가장 많은 능력을 사용한다. Visual perception은 시각 정보를 처리하여 물체의 존재를 발견하고, 그 물체가 무엇인지 알게 되는 두가지 과정으로 이루어져 있다. 앞의 과정에서는 빛정보를 신경신호로 변환하고, 그 신호를 3d로 변환한 후에 각 물체를 분리한다. 후의 과정에서는 pattern과 context를 이용해서 각 물체가 어떤 것인지 판단한다.

 

  1. 뇌에서의 Visual Perception

시각 정보 처리

수정체와 유리체를 통과하여 망막에 빛이 전달되면서 시각 자극이 처음 전달된다. 시신경은 이 자극을 뇌의 visual cortex로 전달한다. 이때, 양쪽 눈의 왼쪽 시각 정보는 우뇌로, 오른쪽 시각 정보는 좌뇌로 전달된다. Visual cortex는 이 정보를 물체가 어떤 것인지, 어디에 있는지 두가지 방법으로 받아들인다. Visual cortex에서는 여러 종류의 시세포들이 시각 정보를 부호화 한다. 빛에 반응하는 on-off cell, 어둠에 반응하는 off-on cell, 빛의 경계에 반응하는 edge detector, 빛의 선에 반응하는 bar detector들이 결합하여 시각 정보를 부호화 한다.

깊이, 표면 지각

세계는 3D로 구성되어 있지만 인간이 눈을 통해서 받아들이는 시각 정보는 2D로 구성되어 있다. 2D정보를 3D로 바꾸기 위해서 뇌는 texture gradient, stereopsis, motion parallax를 사용한다. Texture gradient는 동등한 간격을 두고있는 물체는 같은 거리에 있다고 여겨지는 것이다. Stereopsis는 두 개의 눈에 들어온 서로 다른 정보를 합치면서 생기는 입체감이다. Motion parallax는 물체의 움직임을 통해서 3D정보를 제공한다.

그림 1. Example of texture gradient

(Gibson, J. J. (1950). The perception of the visual world.)

물체 지각

인간은 4가지 gestalt principles를 이용해서 물체를 구분한다. 첫 번째 원리는 근접한 물체를 그룹화 하는 것이다. 두 번째 원리는 비슷하게 보인 물체를 그룹화 하는 것이다. 세 번째 원리는 좋은 연속성을 보이는 물체를 그룹화 하는 것이다. 마지막 원리는 정보가 없는 부분을 좋은 형태가 되도록 채우는 것이다. 이 원리에 반하는 시각 정보를 접하게 되면 그 정보를 해석하는데 어려움을 겪는다.

그림 2. gestalt principles of organization

(http://www.rhsmpsychology.com/Handouts/Gestalt_grouping.htm)

 


 

 

  1. Pattern을 통한 인식

시각 정보를 처리하고, 각 물체들을 분리하는 과정이 끝나면 각 물체가 어떤 것인지를 결정한다. 이 과정에서 Template-matching model, feature analysis가 사용된다.

Template-matching model

Template-matching은 경험을 통해 물체에 대한 다양한 템플릿을 미리 저장해 놓고 새로운 물체를 볼 때 저장된 템플릿과 일치하는지 확인하고, 일치하면 같은 물체라고 생각하는 것이다. 이때, 템플릿과 비슷하더라도 위치, 크기, 방향, 모양이 다른 물체는 다른 물체라고 생각한다.

Feature analysis

Feature analysis는 물체의 특징을 통해 물체를 분석하는 것으로, 수직선, 수평선, 대각선, 곡선 등의 간단한 특징들을 조합해서 물체가 어떤 것인지를 결정한다. Template-matching보다 간단하고, 더 유연하게 결정할 수 있는 특성을 가지고 있다. 하지만, 비슷한 특징을 가진 물체를 같은 물체로 착각하는 경우도 발생한다.

복잡한 물체 인식

Feature analysis를 사용하면 간단한 물체는 인식할 수 있지만, 복잡한 물체를 인식할 때 문제가 발생한다. 복잡한 물체를 인식할 때는 물체를 component로 나누고, component를 조합하야 물체를 인식한다. 색, 질감, 세세한 부분은 의사결정에 영향을 미치지 않는다. 물체의 component중 일부가 손실되거나 component의 중간 중간이 끊어져 있어도 물체를 인식할 수 있다. 두가지 시각정보 결함 중, 시각 정보가 짧게 주어질 때는 전자를 더 잘 인식하고, 시각 정보가 길게 주어질 때는 후자를 더 잘 인식한다.

 

 

 

 

  1. Context를 통한 인식

Context는 물리적 시각정보와 함께 사용되어 물체를 인식할 때 영향을 미친다. Context를 통해 perception을 판단하는 것을 top-down processing이라 하고, 반대의 경우를 bottom-up processing이라 한다.

그림 3. Context를 통한 인식 예시 문장

Massaro의 FLMP(fuzzy logical model of perception)모델

Massaro에 의하면 contextual 정보와 visual 자극은 독립적으로 결합된다.

p(c)=c를 c로 판단할 확률

L(c)=문자 c 의 시각 정보

C(c)=문자 c의 context정보

Change blindness

화면의 변화와 망막의 변화가 동시에 발생하면 인간은 물체의 변화를 발견하지 못한다.

그림 4. EBS 다큐프라임 – 인간의 두 얼굴, 착각의 진실

(https://www.youtube.com/watch?v=owJg0ixm92A)

  1. 결론

인간은 visual perception을 통해 세상을 본다. Visual perception은 시각정보를 받아들이고, 물체를 판단하는 과정을 거친다. 빛 에너지가 망막을 통해 전달되면, 그 정보를 신경신호로 변환하고, 2d정보를 3d모델로 변환한 하고 물체의 존재를 찾아낸다. 그 후 찾아낸 각 물체를 pattern매칭과 context매칭을 사용해서 물체가 어떤 것인지를 판단한다. 이 과정들은 우리가 의식하지 못하는 사이에 일어난다.