우리는 모두 그 불길한 AI 이미지를 본 적이 있습니다. 화장대 앞에 서 있는 여성의 놀랍도록 사실적인 초현실적 초상화입니다. 조명은 화려하고 디테일은 날카롭습니다. 하지만 그 유리를 보세요. 반사가 잘못된 방향을 보고 있습니다. 아니면 완전히 다른 사람이거나, 가장 소름 끼치는 것은 그녀의 뒤통수를 반사하고 있는 것입니다.
AI “뱀파이어 효과”에 오신 것을 환영합니다.
현대 AI 이미지 생성기는 인간 최고의 예술가에 필적하는 질감을 그릴 수 있지만, 중학교 수준의 기본 물리학에서는 자주 실패합니다. 그림자가 태양을 향해 있고, 반사가 기하학을 거스르며, 빗방울이 불가능한 각도로 떨어집니다.
초당 수백만 개의 매개변수를 계산할 수 있는 기계가 거울이 어떻게 작동하는지 이해하지 못하는 이유는 무엇일까요? 그 답은 빛을 시뮬레이션하는 것과 그림을 위조하는 것 사이의 흥미로운 차이에 있습니다.
1. 화가 대 물리 엔진 (2D 환상)
반사 오류를 이해하려면 서로 다른 컴퓨터 프로그램이 이미지를 생성하는 방식을 살펴봐야 합니다.
현대 비디오 게임을 생각해 보세요. 게임은 레이 트레이싱이라는 기술을 사용합니다. 게임 엔진은 진정한 3D 세계를 구축하고 가상의 “태양”을 하늘에 배치하며, 물, 유리, 거울에서 반사되는 수백만 개의 가상 광선의 정확한 경로를 수학적으로 계산합니다. 반사는 프로그램된 광학 법칙을 물리적으로 따르기 때문에 완벽합니다.
AI 이미지 생성기(표준 확산 모델과 같은)는 레이 트레이싱을 사용하지 않습니다. 3D 공간이 없습니다. 그들은 실제로 “빛”이 무엇인지 모릅니다. AI 모델은 본질적으로 평평한 2D 사진만 연구한 천재적이고 눈먼 화가입니다. 통계적 확률을 기반으로 색상 픽셀의 격자를 배열하여 이미지를 생성합니다. 그것은 “반짝이는 유리 픽셀”이 보통 “얼굴 픽셀” 옆에 간다는 것을 알지만, 왜 그런지는 이해하지 못합니다. 그것은 현실의 기본 구조를 이해하지 않고 현실의 질감을 모방하고 있습니다.
2. 거울 문제: 기하학은 용서가 없습니다
거울은 가혹한 주인입니다. 3D 공간의 완벽하고 수학적으로 엄격한 1:1 반전을 요구합니다. 확률적 추측에 능한 AI 모델은 엄격한 규칙을 싫어합니다.
“거울을 보고 있는 남자”라는 프롬프트를 AI에 입력하면 AI는 순차적으로 처리합니다:
- 남자를 그립니다: 전경에 남자의 뒤통수를 그립니다.
- 거울을 그립니다: 벽에 반짝이는 직사각형을 그립니다.
- 거울을 채웁니다: AI의 학습 데이터에 따르면 거울에는 보통 얼굴이 포함됩니다. 그래서 통계적으로 직사각형 안에 얼굴을 생성합니다.
AI는 기억 속에 숨겨진 남자의 3D 모델을 가지고 있지 않기 때문에, 그의 특정 얼굴의 정면이 어떻게 생겼는지 실제로 알지 못합니다. 그것은 단지 프롬프트를 기반으로 그럴듯한 얼굴을 환각합니다. 이로 인해 일치하지 않는 신원, 잘못된 눈맞춤 또는 물리적으로 불가능한 시야각이 발생합니다.
AI에게 거울은 반사 표면이 아닙니다. 그것은 그저 얼굴 맛 픽셀로 채워야 하는 벽의 별도 그림 액자일 뿐입니다.
3. 다중 태양 우주 (그림자 오류)
물리 엔진의 부재는 AI가 그림자에 그토록 어려움을 겪는 이유도 설명합니다.
복잡한 거리 풍경의 AI 생성 이미지를 자세히 살펴보면 종종 “다중 태양” 오류를 발견할 수 있습니다. 현실 세계에서는 모든 그림자의 끝에서 그림자를 만드는 물체를 지나는 선을 그리면, 그 모든 선은 결국 하나의 점(광원)에서 수렴할 것입니다.
AI 이미지에서 그림자는 종종 완전히 무작위 방향을 가리킵니다. AI는 사과 아래에 어두운 그림자가 있어야 하고, 건물 옆에 그림자가 있어야 한다는 것을 알고 있습니다. 하지만 그것은 이러한 물체들을 전역적으로가 아닌 지역적으로 처리합니다. 그것은 사과가 보통 어떻게 보이는지에 기반하여 사과의 그림자를 그리고, 건물이 보통 어떻게 보이는지에 기반하여 건물의 그림자를 그리며, 그들이 정확히 같은 태양에 의해 비춰지고 있다는 사실을 전혀 인식하지 못합니다.
4. 물리학을 고칠 수 있을까요?
연구자들은 이 한계를 뚜렷이 인식하고 있습니다. 최근 학술 프로젝트(새로 개발된 “MirrorVerse” 데이터셋과 같은)는 AI 모델이 수학적으로 완벽한 수천 개의 합성 3D 거울 이미지를 특별히 훈련시켜 기하학에 대한 이해를 강제로 주입하려고 시도하고 있습니다.
그러나 이것은 매우 복잡한 임시 해결책에 불과합니다. 확산 모델이 진정한 3D 물리학을 시뮬레이션하기보다는 픽셀 확률을 추측하여 작동하는 한, 수학이 너무 복잡해지면 가끔 실수를 할 것입니다.
AI 설계자들이 3D 비디오 게임 엔진의 공간 추론과 확산 모델의 창의적 자유를 어떻게 융합할지 알아내기 전까지, 물리 법칙은 AI 우주에서 단지 “제안”에 불과할 것입니다.
