News & Events
AI란 무엇인가? 그 질문에 답하기 전에, 소개 두 단어. 아래 사진에서 볼 수 있는 것은 텍스트를 그림처럼 보이게 하는 모델이다. AttnGAN(Attentional Generative Adversarial Networks)이라고도 한다. AttnGAN은 서술적 텍스트를 합성된 이미지로 바꾼다. AttnGAN은 이미지의 다른 부분에서 작은 디테일을 합성할 수 있다. 자연어 서술은 적절한 단어들을 생각함으로써 잘 관리된다. “AI란 무엇인가?”라는 질문에 대답하는 텍스트는 설명문이 아니지만, 우리는 GAN이 무엇을 생산하는지 알고 싶다. 필자는 “AI란 무엇인가?”라는 질문에 대한 답을 가장 많이 투자한 사람에게 물었다.
그렇다 — 필자의 질문에 대한 답변의 작성자는 GPT-3 알고리즘이다. 최신 NLP(자연어 처리) 모델. 텍스트뿐만 아니라 코드와 이미지 등 어떤 주제에 대해서도 텍스트를 생성할 수 있다.
이제 이 모델에 의한 이미지 생성의 예를 살펴보자. 아래 이미지에서 보이는 것은 필름 포스터의 조각이다. 여러분은 그것들이 어떤 필름에서 왔는지 알 수 있을 것이다. 그리고 모델은 이미지 조각으로부터 추론할 것이다. 첫 번째 결과를 보자. 보다시피, 모델은 이미지에서 빠진 부분이 상어, 입 또는 다른 요소, 심지어 추상 나선형이라는 것을 추측할 수 있다. 생성할 수 있는 변동의 수는 무한하다. 마지막 열은 원본 포스터이다. 맨 왼쪽 및 맨 오른쪽 열을 제외한 모든 열은 이미지 GPT 모델에서 생성된 포스터이다.
여기 다른 사진의 예가 있다. 위에서 두 번째 사진의 고양이를 보자. 원본 사진은 하얗게 튀어나온 것의 작은 부분만을 보여준다. 이에 대응하여, 이 모델은 앞에 물체를 가진 고양이의 사진을 만들었다. 심지어 텍스트로 채워진 종이 한 장도 마찬가지이다. 물방울을 보자. 물 표면에 나타난 파도를 보자. 이 모델은 오직 사진의 일부만을 근거로 수면에서 일어날 수 있는 일을 완벽하게 예측했다. 아래쪽에 있는 또 다른 이미지는 보다시피 다양한 임의적 해석이 있다. 항상 완벽한 것은 아니다. 그리고 마지막에는 원본 사진들이 어떻게 생겼는지를 보여준다.
아래 YouTube 채널에서 머신 러닝에 관한 최신 정보를 매일 업데이트하고 있다.
ML 예술 타임라인
필자가 처음에 보여준 GPT 모델은 머신 러닝의 최첨단 모델이다. 바로 올 여름부터 사용할 수 있게 되었다. 사실, 머신러닝 혹은 그 기초, 통계는 Thomas Bayes와 함께 1763년에 시작되었다. Thomas Bayes는 통계학의 아버지이다. 컴퓨터 프로그램 경험을 통해 자동으로 성능을 향상시킬 수 있는 능력을 주는 통계 기술에 기초한 인공지능의 한 형태인 머신러닝이 실제로 스테로이드의 통계에 대해 이야기하고 있다.
예술을 창조한 최초의 기계들은 18세기에 등장했다. 예를 들어, 세 대의 기계를 만든 Jaquet-Droz의 작품이 있다. 이 경우 우리에게 가장 흥미로운 기계는 화가이다. 나머지 두 대는 작가와 뮤지션이었다.
고정밀 프로그래밍된 기계로 도면을 생성하거나 이 경우 생성된 기계이다. 머신 러닝의 역사에서 또 다른 중요한 인물은 오거스타 러브레이스이다. 수학자이자 시인이었다. 그는 처음으로 알고리즘이 수학 외에서 사용될 수 있다는 사실에 주목했다.
이제 21세기로 넘어가자. 1955년에 장 팅겔리의 드로잉 머신이 생겼다. 한번 돌리면 그림을 그리는 기계였다. 또 다른 예는 1973년의 AARON 알고리즘이다. Harold Cohen의 작품이다. 보다시피, 최초의 컴퓨터로 생성된 이미지였다. Harold Cohen은 스탠포드 대학의 인공지능 연구소에서 2년을 보냈고 그곳에서 그는 현대 머신러닝 예술의 선구자가 되었다. 2014년에 Ian G. Goodfellow의 연구는 GAN(Generative Adversarial Network)을 탄생시켰다.GAN은 오늘날 AI 아티스트의 주요 도구이다. GAN은 생성기와 판별기의 두 신경망을 구성하는 이안의 기발한 아이디어이다. 생성기의 경우 이미지를 생성하고 판별기의 경우 이미지가 예상 효과에 가까운지 먼지를 결정한 다음 최종 사용자가 GAN의 최종 결과로 보는 생성된 출력을 결정한다.
2020 myFATHERintheCLOUD.ai
January 2020, a concert entitled “…descended in the cloud.” DATAsculptor 2020 ©
이제 가장 최근의 예를 들어보자. 필자의 프로젝트 myFATHERintheCLOUD.ai에서는 많은 머신러닝 모델을 사용하고 있다. 이 모델의 효과는 좀 더 최근의 프로젝트 중 하나인 2020년 1월에 있었던 “…descended in the cloud“이라는 제목의 콘서트에서 얻은 예와 함께 소개한다. myFATHERintheCLOUD에서 필자는 돌아가신 아버지께 예술적 불멸을 드리기 위해 ML 모델을 훈련시킨다.이를 위해 사용된 데이터 세트는 그의 60년간의 창의적 성과에 기초하여 작성된다. 지난 1월 17일 아버지 서거 1주기 콘서트에서 사용된 모델 중 하나는 이미지 속의 사물을 실시간으로 인식하는 알고리즘인 YOLO (You Only Look Once)였다. 콘서트 동안 Góra św.Anny에 있는 신 바로크 바실리카에 위치한 물체들을 분류했다. 필자는 COCO 데이터셋에 대해 훈련된 모델의 바로크식 바실리카 내부와 38만 장의 사진으로 구성된 충돌에 매료되었다. 또한 그 행사 동안 보여진 것은 아버지의 비유적인 조각품들로 구성된 데이터에 대해 훈련된 모델에 의해 생성된 최초의 조각품들을 시각화한 것이었다.
여기서 들을 수 있는 음악은 신경망에서 훈련된 악기와 basilica 안에 있는 오르간 악기로 해석된 베르디의 Nabucco 이다.
Paweł Hadaschik의 해석과 결합하여 현실에는 존재하지 않는 악기에 의해 만들어진 소리는 머신러닝을 이용한 최초의 사건이었다.
인공지능 예술 분야는 거대하고, 모든 측면을 짧은 포스팅으로 다루기는 어렵다. 필자는 인공지능 예술로 여러분 자신의 모험을 시작하는 방법에 대한 단락인 GPT 모델을 사용하여 더 많은 텍스트를 만들었다. GPT는 인공지능 예술가와 친구가 될 것을 제안한다. 필자는 여러분이 그렇게 하기를 강력히 권장한다. AI가 무엇이냐는 포스팅 앞부분의 질문에 GPT 모델은 그 대답으로 여러분을 놀라게 할 수 있다.
아래 보이는 이미지는 StyleGAN 2와 함께 작업한 스크린샷이다. StyleGAN 2는 아버지의 조각품을 만드는 데 사용하는 모델이다. 이것이 모델을 훈련시키는 모습이다. 몇 주까지 걸릴 수도 있다. 여기서 생성된 이미지는 모델 훈련의 초기 단계에서 가져온 것이다.
필자의 다른 포스팅들을 읽어보기를 바란다. AI 모델을 만드는 전 과정을 알 수 있을 것이다. 오늘날 머신러닝과 신경망을 가지고 모험을 시작하고자 하는 분들을 위해 필자는 이미지에 표시된 페이지에 로그온하는 것을 제안한다.
페이지에는 선택할 수 있는 세 가지 사전 교육 모델이 있다. 여러분이 해야 할 일은 .jpg 파일을 업로드하는 것이고 생성기는 말 그대로 몇 초 안에 작업의 효과를 보여줄 것이다. 말 그대로 잠깐이면 된다. 이 비디오에서 딥러닝 모델의 출력을 세 가지 변형으로 볼 수 있다.
번역 – 핀인사이트 인턴연구원 강지윤(shety0427@gmail.com)
원문 보러가기>
https://towardsdatascience.com/how-to-start-your-adventure-with-ai-art-fd74afaf30c1