인공지능으로 그림 그리는 시대

2022. 10. 28. 02:20생활속의 IT

 

 

인공지능이 그림 그리는 시대

최근 몇 년 사이 컴퓨터 공학이나 학문 단계에 있던 인공지능이 갑작스럽게 대중화되고 있다.

게임이나 3D 연산 등을 처리하던 그래픽 카드의 GPU(Graphics Processing Unit)를 활용해 CPU의 연산을 처리하는 GPGPU(General-Purpose computing on GPU) 기술이 등장하면서 인공지능 개발 속도가 빨라졌다.

게다가 GPU가 대중적인 것이다 보니 인공지능 개발 역시 보편화하기 시작했다.

 

DALL-E는 현재 150만 명 이상이 하루 200만 개 이상의 이미지를 생산해내고 있으며, 단순히 이미지를 조합해내는 단계를 넘어 원본의 경계를 넘어서는 방식의 이미지를 제공한다.

이를 시작으로 오픈 AI 기반의 ‘크래용(craiyon)’이나 이미지 생성 인공지능 ‘스테이블 AI’ 기반의 ‘미드저니(Midjourney)’, 소설 및 애니메이션을 생성하는 ‘노블.AI’까지 각양각색의 서비스가 등장하기 시작했다.

대다수 서비스는 횟수 제한 무료 혹은 유료로 제공되지만, 시작 단계임에도 단어 몇 개나 문장 몇 개로 수준 급의 결과물을 만들어낼 수 있어서 업계에 큰 파장을 일으키고 있다.

 

올해 8월, 미국 ‘콜로라도 주립 박람회 미술대회’의 디지털아트 부분에 출품된 ‘스페이스 오페라 극장’ 작품은 출품자인 제이슨 M. 앨런이 직접 그린 것이 아니며 ‘미드저니’라는 인공지능 프로그램을 통해 그려져서 주목을 받았다. 

 

메타(前 페이스북)은 지난 9월 29일(현지 시각), 텍스트에서 비디오를 만들어내는 인공지능까지 공개했다.

‘Make-A-Video’는 단 몇 단어 또는 텍스트를 추론해 존재하지 않는 형태의 동영상을 생성해내고, 실제로 존재하는 비디오를 입력하면 이를 토대로 유사한 다른 형태의 비디오를 만들어내기도 한다. 앞서 DALL-E나 미드저니와 다르게 시험 단계의 성격이 강하며 완성도가 떨어지지만, 인공지능이 지금 기술로도 충분히 동영상으로 구현될 수 있음을 보여준다.

 

 

그런데 국내에서도 카카오가 AI 이미지 생성기를 내놓았다.

가벼운 모바일용 앱이지만 국내 기업이 상용 서비스로 출시한 것은 이번이 처음이라 한다.

 

▶'비 디스커버'(B^DISCOVER) APP(앱)이란?

카카오브레인인공지능(AI) 모델 '칼로'를 활용해 그림을 그리는 모바일 애플리케이션(앱) '비 디스커버'(B^DISCOVER)를 출시했다.

 

카카오브레인은 지난 2017년 김범수 카카오 창업자가 AI 서비스 개발 의지를 가지고 인재를 영입, 문을 연 곳이다.

카카오브레인은 올 중순부터 본격적으로 칼로를 이용해 삼성전자와의 갤럭시 아트북 제작이나 자체 제작 티셔츠 디자인 등 이벤트를 진행했고, 이번에 본격 서비스를 시작하게 됐다.

앱을 실행하고 그림으로 그리기를 원하는 키워드와 그림 유형(유화, 수채화, 만화, 색연필 등)을 선택하면 약 5초 만에 그림이 완성된다.

키워드와 스타일(유화, 수채화, 연필, 네온, 일러스트 등), 배경 화면, 시간대, 색조 등을 차례로 선택하면 약 5초 만에 그림이 완성된다. 카카오브레인의 칼로는 1억8000만장의 텍스트-이미지 데이터셋을 학습, 다양한 이미지를 만들어 낸다.
앱은 구글 플레이스토어와 애플 앱스토어에서 무료로 내려받고 사용할 수 있다.

이 앱은 현재 시험 단계인 알파 버전이며, 추후 정식 버전이 출시되면 일부 기능은 유료화될 것으로 알려졌다.

 

▶기존에 나온 AI 이미지 생성기와의 차이점은?

기존에 나온 AI 이미지 생성기에 비교해 장점은 모바일용 앱으로 가볍게 출시했다는 점이다.

복잡한 과정 없이 누구나 언제나 손쉽게 이미지를 만들어낼 수 있으며, 다수의 최종 결과물 중 하나를 선택할 수 있다.

생성한 이미지를 휴대폰에 다운로드하거나 SNS로 공유하는 것도 가능하다.

최종 생성 이미지에는 비 디스커버로 제작했다는 프레임이 붙는다.

갤러리 기능도 있어 다른 사용자가 만든 이미지를 둘러볼 수 있다.

텍스트 프롬프트에서 3D 이미지를 만들어주는 구글의 '드림퓨전'이나 영상을 넘어 비디오까지 제작해주는 '페나키' 등에 비교할 수준은 아니지만, 이제까지 나온 이미지 생성 AI 중 사용자 접근성과 편의성이 최고다.  

 

▶문제점은?

인공지능의 품질은 데이터를 가공하는데 쓰이는 매개 변수를 얼마나 크고 효율적으로 운용하는가에 있다.

사용할 데이터가 적으면 그만큼 조합 가능한 수가 적어 품질은 떨어지고, 데이터가 많으면 그만큼 빠르게 발전한다.

AI도 결국 인간이 그린 그림을 통해 학습하는 과정을 거쳐야 하는데, 이 학습하는 그림의 저작권에 대한 논란이 이어지고 있다.

 

창작자인 AI가 저작권 가져야 한다고 보는 이들도 있고, AI는 사람이 아니기 때문에 그 AI의 개발자에게 저작권이 귀속된다는 이들과 명령어를 입력한 이용자에게 그 저작권이 있다고 보는 사람들도 있다.

아직 인공지능의 저작권과 관련한 법제화가 제대로 되어있지 않기 때문에 이 논란의 끝은 미지수다.