인간과 기계의 시력의 간극을 메우다

자료실
기타
작성자
인사이트캠퍼스
작성일
2020-04-08 15:54
조회
47

Bridging the gap between human and machine vision

인간과 기계의 시력의 간극을 메우다


* 이 기사는 MIT News에 작성된 Jennifer Chu의 글을 번역하였습니다.

연구원들은 인간의 시력이 물체의 변화하는 관점에 어떻게 반응하는지 연구함으로써 보다 강력한 기계 시력 아키텍처를 개발한다.

몇 피트 떨어진 곳에서 한 번도 만난 적이 없는 사람을 잠깐 본다고 가정해 보자. 몇 걸음 뒤로 물러서서 다시 보라. 그녀의 얼굴을 알아볼 수 있겠나? "그래, 물론이지."라고 여러분은 아마 생각하고 있을 것이다. 만약 이것이 사실이라면, 예를 들어, 특정 얼굴 같은 물체의 단일 이미지를 본 우리의 시각 시스템은 물체의 위치와 규모의 변화에도 불구하고 그것을 강하게 인식한다는 것을 의미할 것이다. 반면에 우리는 바닐라 딥 네트워크와 같은 최첨단 분류기가 이 간단한 테스트에 실패할 것이라는 것을 알고 있다.

다양한 변형 범위 하에서 특정 얼굴을 인식하기 위해서는 신경 네트워크가 다른 조건 하에서 얼굴의 많은 예를 가지고 훈련되어야 한다. 암기를 통해 불변성을 달성할 수 있지만 하나의 이미지만 사용 가능하면 할 수 없다는 얘기다. 따라서, 인간의 시력이 어떻게 이 놀라운 업적을 이끌어낼 수 있는지를 이해하는 것은 기존의 분류기를 개선하려는 엔지니어들과 관련이 있다. 또한 신경과학자들이 심층 네트워크를 가진 원시 시각 시스템을 모델링하는 데에도 중요하다. 특히 생물학적 시력이 보여주는 일회성 학습의 불변성은 심층 네트워크와는 다소 다른 계산 전략이 필요할 가능성이 있다.

전기공학 및 컴퓨터공학 분야의 MIT 박사 후보 Yena Han과 Nature Scientific Reports트의 동료들이 쓴 "Scale and translation-invariance for novel objects in human vision"이라는 제목의 새로운 논문에서 그들이 어떻게 이 현상을 더 세심하게 연구하여 새로운 생물학적으로 영감을 받은 네트워크를 만드는지에 대해 논의하고 있다.

"인간은 심층 네트워크와는 달리 아주 적은 예에서 배울 수 있다. 이것은 시력 시스템의 공학과 인간의 시력이 실제로 어떻게 작동하는지 이해하는 데 있어 엄청난 의미와는 큰 차이가 있다."라고 공동저자인 Tomaso Poggio(Center for Brains, Minds and Machines (CBMM) 소장)과 MIT의 Eugene McDermott 뇌인지과학 교수가 말했다. "이 차이의 주요 이유는 영장류 시각 시스템이 스케일, 이동 및 기타 변환에 대한 상대적 불변성이다. 이상하게도, 이것은 AI 커뮤니티에서 대부분 무시되어 왔는데, 부분적으로는 정신물리학적 자료가 명확하지 않았기 때문이다. Han씨의 연구는 인간의 시력의 기본적인 불변성에 대한 견고한 측정을 확립했다."

새로운 연구는 경험과 암기에서 내재적 계산과의 불변성을 구별하기 위해 일회성 학습에서 불변의 범위를 측정했다. 언어에 익숙하지 않은 인간에게 한글 자극을 제시하여 일회성 학습 과제를 수행하였다. 이 문자는 처음에는 하나의 특정 조건 하에서 단일 시간으로 제시되었으며 원래 조건과 다른 특정 조건 또는 위치에서 실험되었다. 첫 번째 실험 결과는, 여러분이 추측한 것처럼, 인간은 이 소설적인 물체에 단 한 번의 노출 후에 상당한 규모의 불변 인식을 보였다는 것이다. 두 번째 결과는 물체의 크기와 배치에 따라 위치 불변의 범위가 제한된다는 것입니다.

다음으로, Han씨와 그녀의 동료들은 이 인간의 성능을 재현하기 위해 고안된 심층 신경망에서 비교 가능한 실험을 했다. 이러한 결과는 간이 물체를 불변적으로 인식하는 것을 설명하기 위해 신경망 모델이 내장된 스케일 불변성을 명시적으로 포함시켜야 한다는 것을 암시한다. 또한, 시야의 중심에서 멀어질수록 모델 뉴런의 수용 필드가 증가함으로써 인간 시력의 제한된 위치 불변성이 네트워크에서 더 잘 복제된다. 이 아키텍처는 일반적으로 사용되는 신경망 모델과는 다르며 이미지는 동일한 공유 필터를 사용하여 동일한 해상도로 이미지를 처리한다.

"우리의 연구는 다른 관점으로 물체의 뇌 표현에 대한 새로운 이해를 제공한다. 그것은 또한 AI에 시사하는 바가 있는데, 그 결과는 심층 신경망을 위한 좋은 건축 설계에 대한 새로운 통찰력을 제공하기 때문이다."라고 CBMM 연구원이자 이 연구의 주요 저자인 Han씨가 말했다.

Han씨와 Poggio는 이 실험에서 Gemma Roig와 Gad Geige와 함께 했다.

번역 - 핀인사이트 인턴연구원 김영현

원문 보러가기 >

http://news.mit.edu/2020/bridging-gap-between-human-and-machine-vision-0211

 
전체 0

전체 572
번호 썸네일 제목 작성자 작성일 추천 조회
공지사항 [공지사항] 코로나바이러스감영증-19 예방을 위한 강의장 방역 안내
[공지사항] 코로나바이러스감영증-19 예방을 위한 강의장 방역 안내
[공지사항] 코로나바이러스감영증-19 예방을 위한 강의장 방역 안내
인사이트캠퍼스 | 2020.03.05 | 추천 0 | 조회 758
인사이트캠퍼스 2020.03.05 0 758
공지사항
비밀글 파이썬으로 배우는 블록체인 구조와 이론 (위키북스)
finweb | 2019.07.05 | 추천 0 | 조회 14
finweb 2019.07.05 0 14
569 딥러닝을 활용한 금융 시계열 분석 - 2
딥러닝을 활용한 금융 시계열 분석 - 2
딥러닝을 활용한 금융 시계열 분석 - 2
인사이트캠퍼스 | 2020.05.25 | 추천 0 | 조회 36
인사이트캠퍼스 2020.05.25 0 36
568 퀀텀 컴퓨팅의 실용화 방안
퀀텀 컴퓨팅의 실용화 방안
퀀텀 컴퓨팅의 실용화 방안
인사이트캠퍼스 | 2020.05.18 | 추천 0 | 조회 92
인사이트캠퍼스 2020.05.18 0 92
567 딥러닝을 활용한 금융 시계열 분석 - 1
딥러닝을 활용한 금융 시계열 분석 - 1
딥러닝을 활용한 금융 시계열 분석 - 1
인사이트캠퍼스 | 2020.05.18 | 추천 0 | 조회 42
인사이트캠퍼스 2020.05.18 0 42
566 동적 자산 배분과 유니버셜 포트폴리오
동적 자산 배분과 유니버셜 포트폴리오
동적 자산 배분과 유니버셜 포트폴리오
인사이트캠퍼스 | 2020.05.14 | 추천 0 | 조회 124
인사이트캠퍼스 2020.05.14 0 124
565 2020년 최고의 인공지능 및 머신러닝 소프트웨어 및 프레임워크 Top 20
2020년 최고의 인공지능 및 머신러닝 소프트웨어 및 프레임워크 Top 20
2020년 최고의 인공지능 및 머신러닝 소프트웨어 및 프레임워크 Top 20
인사이트캠퍼스 | 2020.05.13 | 추천 0 | 조회 136
인사이트캠퍼스 2020.05.13 0 136
564 자주 묻는 머신러닝 인터뷰 질문 및 답변 50선
자주 묻는 머신러닝 인터뷰 질문 및 답변 50선
자주 묻는 머신러닝 인터뷰 질문 및 답변 50선
인사이트캠퍼스 | 2020.05.11 | 추천 0 | 조회 153
인사이트캠퍼스 2020.05.11 0 153
563 좋은 vs 나쁜 액티브 펀드 관리 : 3 가지 지표
좋은 vs 나쁜 액티브 펀드 관리 : 3 가지 지표
좋은 vs 나쁜 액티브 펀드 관리 : 3 가지 지표
인사이트캠퍼스 | 2020.05.06 | 추천 0 | 조회 133
인사이트캠퍼스 2020.05.06 0 133
562 그녀는 돈의 보스: 여성 온라인 투자의 4대 트렌드
그녀는 돈의 보스: 여성 온라인 투자의 4대 트렌드
그녀는 돈의 보스: 여성 온라인 투자의 4대 트렌드
인사이트캠퍼스 | 2020.05.06 | 추천 0 | 조회 114
인사이트캠퍼스 2020.05.06 0 114
561 변동성 측정의 이해
변동성 측정의 이해
변동성 측정의 이해
인사이트캠퍼스 | 2020.05.06 | 추천 0 | 조회 138
인사이트캠퍼스 2020.05.06 0 138
560 새로운 재료를 찾는 데 있어 최적화를 촉진하는 신경망
새로운 재료를 찾는 데 있어 최적화를 촉진하는 신경망
새로운 재료를 찾는 데 있어 최적화를 촉진하는 신경망
인사이트캠퍼스 | 2020.04.29 | 추천 0 | 조회 117
인사이트캠퍼스 2020.04.29 0 117
559 2020년 멋진 오픈 소스 소프트웨어 5개
2020년 멋진 오픈 소스 소프트웨어 5개
2020년 멋진 오픈 소스 소프트웨어 5개
인사이트캠퍼스 | 2020.04.29 | 추천 0 | 조회 134
인사이트캠퍼스 2020.04.29 0 134
558 AI가 속아 넘어갈 수 있을까?
AI가 속아 넘어갈 수 있을까?
AI가 속아 넘어갈 수 있을까?
인사이트캠퍼스 | 2020.04.29 | 추천 0 | 조회 75
인사이트캠퍼스 2020.04.29 0 75
557 블록체인이 채택되면서 협업이 새로운 경쟁인가?
블록체인이 채택되면서 협업이 새로운 경쟁인가?
블록체인이 채택되면서 협업이 새로운 경쟁인가?
인사이트캠퍼스 | 2020.04.29 | 추천 0 | 조회 84
인사이트캠퍼스 2020.04.29 0 84
556 간단한 전자 상거래 웹사이트 스크래핑
간단한 전자 상거래 웹사이트 스크래핑
간단한 전자 상거래 웹사이트 스크래핑
인사이트캠퍼스 | 2020.04.29 | 추천 0 | 조회 119
인사이트캠퍼스 2020.04.29 0 119
555 디지털 화폐 – CBDC를 발행하는 데에 무엇이 필요한가?
디지털 화폐 – CBDC를 발행하는 데에 무엇이 필요한가?
디지털 화폐 – CBDC를 발행하는 데에 무엇이 필요한가?
인사이트캠퍼스 | 2020.04.27 | 추천 0 | 조회 153
인사이트캠퍼스 2020.04.27 0 153
554 2020년 가장 해 볼만한 인공지능 및 머신러닝 프로젝트 20선
2020년 가장 해 볼만한 인공지능 및 머신러닝 프로젝트 20선
2020년 가장 해 볼만한 인공지능 및 머신러닝 프로젝트 20선
인사이트캠퍼스 | 2020.04.20 | 추천 0 | 조회 371
인사이트캠퍼스 2020.04.20 0 371
553 Netflix가 Druid를 실시간 이해에 사용하여 고품질 체험을 보장하는 방법
Netflix가 Druid를 실시간 이해에 사용하여 고품질 체험을 보장하는 방법
Netflix가 Druid를 실시간 이해에 사용하여 고품질 체험을 보장하는 방법
인사이트캠퍼스 | 2020.04.13 | 추천 0 | 조회 86
인사이트캠퍼스 2020.04.13 0 86
552 미디어 파이프를 사용한 모바일 장치의 실시간 3D 객체 탐지
미디어 파이프를 사용한 모바일 장치의 실시간 3D 객체 탐지
미디어 파이프를 사용한 모바일 장치의 실시간 3D 객체 탐지
인사이트캠퍼스 | 2020.04.09 | 추천 0 | 조회 63
인사이트캠퍼스 2020.04.09 0 63
551 Open Images V6 - 현지화된 서술 특성 제공
Open Images V6 - 현지화된 서술 특성 제공
Open Images V6 - 현지화된 서술 특성 제공
인사이트캠퍼스 | 2020.04.09 | 추천 0 | 조회 60
인사이트캠퍼스 2020.04.09 0 60
550 외형 변경, 자유 로밍 소프트 로봇 제작
외형 변경, 자유 로밍 소프트 로봇 제작
외형 변경, 자유 로밍 소프트 로봇 제작
인사이트캠퍼스 | 2020.04.09 | 추천 0 | 조회 48
인사이트캠퍼스 2020.04.09 0 48