44
일러스트만의 매력과 실무에서의 일러스트 알아보기
45

예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기

2023.10.10

예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


최근에 ChatGPT 열풍과 더불어 생성형 AI에 대한 관심이 뜨겁습니다. 과학뿐만 아니라 인문, 의료, 예술 등 다양한 분야에서 생성형 AI가 활약하고 있습니다. 이번에는 생성형 AI 중에서 이미지 생성형 AI에 대한 이야기, 어떻게 활용되는지, 이용 방법, 한계점 등을 살펴보려고 합니다.



생성형 AI, 그리고 이미지 생성형 AI에 대해


생성형 AI는 이용자의 요구에 따라서 글을 작성해 주고, 음악을 작곡하고, 디지털 아트 등을 능동적으로 생성해 내는 역할을 수행함으로써 인간의 창의적 영역까지도 대신할 수 있게 되었습니다. 현재 다양한 분야에서 서비스를 제공하고 있습니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


이미지 생성형 AI는 텍스트에서 이미지를 생성하는(text-to-image) AI입니다. 이용자가 구현하고자 하는 이미지를 짧은 문장으로 입력하기만 하면 1분 내외로 원하는 이미지를 만들어 줍니다.

이미지 생성형 AI 초기에는 2015년 구글의 딥드림 생성기, 2016년 마이크로소프트의 넥스트 렘브란트, 2017~2019년 럿거스 대학 팀의 AICAN 같은 시도가 비교적 초기에 시도된 이미지 생성 AI라면, 그 후 GPT-3를 활용하기 시작한 2021년 1월의 달리(DALL-E), 2021년 10월의 디스코디퓨전(Disco Diffusion), 2022년 3월의 미드저니(Midjourney), 2022년 4월의 달리2(DALL-E 2), 2022년 8월의 스테이블디퓨전(Stable Diffusion)이 출시되었습니다.

이미지 생성형 AI는 기술자 세계에서만 알려지다 전세계적으로 관심사가 된 계기가 있습니다. 2022년 8월 26일, 미국 콜로라도주에서 열린 미술전에서 디지털 아트 부분 수상작으로 ‘스페이스 오페라 극장’이 수상하게 되었습니다. 이 작품은 추후 이미지 생성형 AI인 미드저니(Midjourney)로 만들어낸 결과물로 알려지면서 언론에 대대적으로 보도되었고 이후 이미지 생성형 AI에 대해 대중의 관심이 쏠리기 시작했습니다. 이 계기로 생성형 AI가 전 세계적으로 관심을 받게 되었습니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


생성형 이미지 AI는 어떻게 활용되고 있을까?


1. AI로 작업한 코스모폴리탄 미국판 표지


예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


2022년 6월 코스모폴리탄 편집자는 이미지 생성형 AI 달리2(DALL-E 2)를 이용해 Karen X. Cheng이라는 디지털 아티스트와 협력하여 잡지 표지를 만들었습니다. AI를 활용해 디자인한 세계 최초의 잡지 표지로 화제가 되었습니다.



2. AI로 작업한 코카콜라 광고


예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


2023년 3월 코카콜라 광고를 AI를 활용해 선보였습니다. Electric Theatre Collective의 VFX 팀과 Blitzworks 회사가 만나 영상, 디지털 효과 및 AI를 혼합하여 광고를 제작하였습니다.



3. AI로 작업한 마블 히어로 X 나이키 운동화


예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


미국의 파울 파슨스라는 디자이너가 2022년 11월부터 이미지 생성형 AI ‘미드저니(Midjurney)’ 활용해 마블 히어로들을 나이키 운동화로 표현한 이미지를 제작하여 화제가 되었습니다.



4. AI로 작업한 해리포터 딥페이크 영상


예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


‘데몬플라잉폭스’라는 유튜버가 이미지 생성형 AI ‘미드저니(Midjurney)’, 목소리 추출하는 AI ‘일레븐랩스’, 비디오 생성 AI ‘DID’ 등을 활용해 영상을 제작하여 화제가 되었습니다.
이 영상은 영화 ‘해리포터’ 주인공들이 발렌시아가 컬렉션을 입고 패션쇼를 하는 영상으로, 유튜브 공개 2주 만에 조회 수 420만 회를 넘겼을 만큼 큰 화제가 되었습니다. 그리고 이와 관련된 밈들도 쏟아지고 있다고 합니다.



이미지 생성형 AI 이용방법: 미드저니


미술전에서 1등 수상도 하고, 새롭게 5.2 버전이 출시되면서 이미지 품질이 높아졌다고 평이 난 이미지 생성형 AI 미드저니의 이용 방법에 대해서 이야기하고자 합니다. 이미지 생성형 AI를 이용할 때 필요한 것은 프롬프트(명령어)가 필요합니다. 프롬프트(명령어)는 생성형 AI에게 어떤 행동을 해야 하는지 설명하여 결과를 도출할 수 있게 하는 입력값입니다. 예를 들어 “a cup of coffee”로 프롬프트를 입력하게 되면 관련된 이미지들을 생성해 줍니다. 프롬프트는 좀 더 명료한 문장일수록 좋은 결과물을 얻어낼 수 있습니다. 길게 쓴다고 해서 더 좋은 결과물이 나오는 것은 아닙니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


미드저니는 타 이미지 생성형 AI와 다르게 음성, 채팅, 화상 통화 등을 지원하는 메신저 앱 ‘디스코드’ 앱을 통해 이미지를 생성할 수 있습니다. 그렇기 때문에 이용자 간 생성한 작품을 서로 공유하면서 이용할 수 있습니다.



1.기본 프롬프트 입력 방식


디스코드 가입 후 미드저니 채널을 가입합니다. 채팅창에 들어가면 다른 이용자가 생성한 이미지들을 볼 수 있습니다. 하단 입력 필드에 “/”를 입력 후, imagine를 선택합니다. 그리고 텍스트 프롬프트(명령어)를 입력하면, AI가 이미지를 생성해 줍니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


2.고급 프롬프트 입력 방식


더 나아가 미드저니 프롬프트 입력 시 기본 프롬프트 말고 ‘고급 프롬프트’ 입력 방식이 있습니다. 이미지 프롬프트, 파라미터를 활용한 프롬프트가 있습니다.

이미지 프롬프트는 이미지 URL을 프롬프트에 추가하면, AI가 구성 및 스타일, 색상을 참고할 수 있습니다. 우선 미드저니 에서 이미지를 업로드하고 이미지 링크 복사 후 프롬프트 입력 필드에 링크를 붙여넣기 합니다. 그 후 기본 프롬프트를 입력하여 이미지를 생성합니다. 저는 빈센트 반 고흐 작품 이미지와 “vase with flowers” 기본 프롬프트를 입력하여 테스트를 진행하였습니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


파라미터 프롬프트는 이미지의 비율, 모델, 업스케일러, 배제 변수 등을 상세히 변경할 수 있습니다. 저는 파라미터 프롬프트 기능 중 이미지 비율을 적용해 보았습니다.
이미지 비율 사용법은 기본 프롬프트 입력 뒤에 --aspect <비율> , 또는 --ar <비율>을 입력합니다.
저는 기본 프롬프트 “vase with flowers” 입력 후 뒤에 “--ar 3:5”를 파라미터 값을 입력하여 테스트를 진행하였습니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


3.blend 기능을 활용한 입력 방식


최대 5개의 이미지까지 혼합해서 이미지를 생성해 줍니다. 하단 입력 필드에 “/”를 입력 후, blend를 선택합니다. 그리고 원하는 이미지들을 첨부 후, AI가 이미지를 변형시켜 생성해 줍니다. 저는 앵무새 사진과 알폰스 무하 작품을 blend시켜 보았습니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


자세한 규칙은 미드저니에서 제공한 가이드를 확인하시길 바랍니다.



이모션글로벌에서는 이미지 생성형 AI를 어떻게 활용할까요?


이모션에서도 이미지 생성형 AI를 활용하고 있습니다. 그리고 앞으로도 AI에 대해 적극적으로 탐구하고 활용할 예정입니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


프로젝트 내 필요한 이미지를 AI를 통해 생성하여 작업을 진행하였습니다. 이미지 생성뿐만 아니라 이미지 내 부분적 요소를 AI를 통해 부분 생성 작업을 진행하기도 하였습니다.



이미지 생성형 AI의 한계점


이미지 생성형 AI가 만능 AI처럼 일을 해내도, 한계점이 있습니다. 그중 하나는 사람 손 묘사입니다. 사람 손에 대해 이미지를 생성하게 되면 간혹 손가락이 4개가 되거나 6개가 되거나 뒤틀린 모양으로 그려내기도 합니다. 손을 잘 못 그리는 이유는 ‘과도한 데이터 학습량’ 때문이라고 합니다. 사람 손은 양손을 깍지 끼거나 악수하는 모습, 주먹진 모습 등 손의 형태가 다양해서 훨씬 학습이 어렵다고 합니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


그리고 ‘글자’가 들어간 이미지를 생성할 경우에도 잘 못 그려냅니다. 명확하게 나오기보다는 뭉뚱그려 인식해서 이미지를 생성합니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


또한 AI의 편향성, 저작권, 책임 등에도 개선점이 필요하다는 평가들이 있습니다. 편향성 같은 경우 이미지 생성 AI 세계에서는 백인 남성이 주로 CEO를 이루고 있고, 검은 피부를 가진 남성 대부분이 범죄를 저지르고, 검은 피부를 가진 여성은 햄버거를 만들고 있는 편향성 세계를 보여줍니다.

하단 이미지는 Leonardo Nicoletti와 Dina Bass에 의해 조사되었습니다. AI가 생성한 사람들의 5,100개의 이미지로 각 이미지에 대해 얼굴 피부를 평균 계산하여 조사되었다고 합니다.

AI가 생성한 사람들을 분석하면 고임금 직업은 대부분 밝은 피부색을 가진 사람들이 대부분 이였고, 어두운 피부색을 가진 사람들은 대부분 저임금 직업으로 이미지가 생성되었다고 합니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


하단 이미지는 AI가 생성한 직업과 성별에 따라 분류하였습니다. 여성은 대부분 사회복지사, 패스트 푸드 노동자, 캐셔, 선생님 등의 저임금 직업에서 대부분 이미지가 생성되었고, 남자는 의사, 판사, CEO, 엔지니어 등 고임금 직업분야에서 대부분 이미지가 생성되었습니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


저작권 같은 경우 기존 화가 화풍을 무단으로 학습해 지적재산권을 침해하여 소송전이 열리기도 하였습니다. 게티이미지는 AI 모델 '스테빌리티 AI'(Stability AI) 상대로 소송을 제기하였습니다. 스테빌리티 AI가 게티이미지의 이미지를 인공지능 모델에 학습시키면서 광범위하게 베꼈다고 주장합니다.



예술과 창의성의 영역에 들어선 이미지 생성형 AI에 대해 알아보기


글을 마치며


지금까지 이미지 생성형 AI에 대해 알아보았습니다. 엄청난 속도로 생성형 AI는 발전하며 우리들의 주변에 스며들고 있습니다. 현재도 지속적으로 여러 논란 속에 있는 생성형 AI지만, 그에 따라 세계 각국에서 AI에 대한 활용과 규제에 대해 광범위한 논의가 진행되고 있다고 합니다.
앞으로의 한계점들을 개선해 나가 더 발전된 모습의 생성형 AI가 기대가 됩니다.




출처




이모션글로벌 사이트 배너

유세리Deputy Leader
CD1본부e·motion
45
44