이전 글 ‘생성형 AI 시대의 도래’에서 이미지 생성 AI인 미드저니에 대해 일부 다뤘다.
이미지 생성 AI는 GANs(Generative Adversarial Networks)을 기반으로 동작하는데 GANS는 2014년 Ian Goodfellow에 의해 처음 소개되었습니다. GANs의 기본 아이디어는 두 개의 신경망, 즉 생성기(Generator)와 판별자(Discriminator)를 경쟁시켜서 작동하게 하는 것으로 두 네트워크는 서로를 개선시키는 "게임"을 통해 학습하는 방식으로 이미지 생성, 스타일 전송, 이미지 고해상도화, 이미지 증강 등으로 데이터를 생성, 변환시키는 서비스로 예술가, 디자이너, 작가 등이 이미 많은 분야에서 사용되고 있다.
이번 글에서는 미드저니에 대해 어떻게 사용되고 어디에 사용하는지에 대해 다루고자 한다.
미드저니 가입과 사용법은 많은 Youtube와 블로그에서 자세히 다루고 있으니 그곳에서 검색해 보기를 권해드립니다. 여기서는 기본적인 이미지 생성, 우리의 상상을 더해서 만들어지는 과정을 보여주고자 한다.
1.이미지 생성
- 먼저 ‘귀여운 푸들 강아지’를 미드저니에 영어로 입력해 보면 다음과 같이 이미지가 기본 이미지로 생성된다.
(Prompt cute poodle puppy —ar 1:1)
2. 이미지에 상상을 더하기
- 검은색 귀여운 푸들 강아지가 하얀 거실 바닥을 뛰어다닌다 스타일은 하야오 애니메이션 스타일로
(Prompt A cute black poodle puppy runs on the white living room floor. The image is Hayao Miyazaki-style anime type, so I wish it had a clear picture. --ar 1:1)
위의 예시는 가장 간단한 창작예 일뿐이다.
숙련된 전문가는 이러한 이미지를 어렵지않게 만들어 낼 수 있을 것이다. 그러나 시간과 노력이 필요하다. 위의 이미지 생성에 단 1분이면 가능한 것이다. 그리고 각자 자기만의 아이디어만 있으면, 키워드 나열만으로도 독창적인 작품을 만들어 낼수 있는 것이다.
미드저니는 다양한 명령어와 파라미터를 제공하여 각자의 상상력으로 애니메이션, 수채화, 유화, 사진, 3D, 일러스트, 텍스쳐, 패턴, 그림책 등 우리의 상상력이 있다면 모든 것을 만들어 낼 수 있다.
그렇다면 미드저니는 이제 인간이 만들어 오던 창작의 세계를 완전히 대체하는 것인가에 대한 물음은 아직은 아니다고 말할 수 있다. 위의 예처럼 단순한 명령이 아니라 각 사람마다 좀더 세밀하고 정확한 명령어를 만들어 내면 만들어지는 제품의 퀄리티는 완전히 다르게 된다. 이렇게 본다면 미드저니는 우리에게 창작이 이미지를 그리는 기술이 아닌 자신의 경험, 성향, 표현력, 상상력으로 대체해 전문가에게는 보다 유용한 툴이고 초보자들에게는 접근하기 어려운 창작의 세계에 보다 쉽게 접근할 수 있는 길을 열어 준다고 해야 할 것이다.
미드저니를 사용하는 이유는 아래와 같은 이유일 것이다.
위의 Prompt는 사람의 언어를 그대로 표현한 것으로 미드저니의 Prompt와는 조금 차이가 있다. 우리 자연어를 미드저니가 번역해 Prompt를 생성하는데 그 사이의 표현할 수 없이 미묘함이 존재한다.
만약 ChatGPT에 아까와 같은 ‘검은색 귀여운 푸들 강아지가 하얀 거실 바닥을 뛰어다닌다 스타일은 하야오 애니메이션 스타일로’ Prompt 만들어 달라고 하면 다음과 같은 프롬프트를 4개 정도 만들어 준다. 이것을 미드저니에 대입해 보면 다음과 같은 이미지가 만들어진다..
Prompt 1:
/imagine prompt: A black adorable poodle puppy running on a white living room floor, the puppy's curly fur contrasting with the pristine floor, modern furniture subtly placed with a comfy sofa, bright and playful with a sense of innocence, Photography, shot with a Canon EOS 5D Mark IV with a 50mm lens, --ar 16:9 --v 5
Prompt 2:
/imagine prompt: A black cute poodle puppy frolicking on a white marble living room, sunrays illuminating the puppy's playful actions, indoor plants and a grand chandelier hanging above, serene and heartwarming, a pure celebration of joy, Illustration, watercolor on fine paper, --ar 16:9 --v 5
이처럼 우리가 만들어내는 자연어보다 ChatGPT는 좀 더 사실적이고 구체적인 Prompt를 만들어 주기에 그 결과를 바탕으로 우리의 상상력을 무한대로 확장 가능하고 이를 통해 다양한 작품들을 창작할 수 있는 것이다.
예술과 기술의 교차점에서 탄생한 미드저니는 기계 지능과 인간 창의성 사이의 격차를 해소해 가는AI로써 이것은 단순 AI 플랫폼인 단순 도구가 아니다. 이것은 인간의 생산성을 높일 뿐만 아니라 비교할 수 없는 정밀도와 혁신을 제공하고 있는 것이다. 그러나 아직 미드저니는 베타버전이고 아직 개발이 계속 진행되고 있고 몇 가지 고려해야 할 사항도 있다.
데이터 의존성: 출력 품질은 입력 데이터에 크게 좌우됨에 따라 품질 신뢰성 확보 필요
윤리적 우려: AI가 오해의 소지가 있거나 부적절한 콘텐츠를 생성할 위험이 있음
기술적 장애물: 활용이 커짐에 따라 광범위한 컴퓨팅 리소스가 필요
그럼에도 미드저니는 패션, 광고, 엔터테인먼트, 애니메이션, 출판, 디자이 등 광범위한 범위에서 사용을 늘려나가고 있고 GhatGPT와 결합되어 점점 복잡하고 난해한 작업들을 쉽게 만들어 가고 있어 이미지 생성 AI 분야에서 관심이 핵이 되고 있다.
ChatGPT 확장 프로그램 추천 (0) | 2023.09.28 |
---|---|
ChatGPT 플러그인 추천 (1) | 2023.09.27 |
ChatGPT! AI 활용을 위한 최고의 가이드 (0) | 2023.09.21 |
생성형 AI 시대의 도래 (1) | 2023.09.18 |
2024년 주요 IT 트렌드 (2) | 2023.09.15 |