애플, 이미지 편집 최적화된 생성 AI ‘MGIE’ 출시

애플, 이미지 편집 최적화된 생성 AI ‘MGIE’ 출시



애플이 이미지 편집에 최적화된 인공지능(AI) 모델 ‘MGIE(MLLM-Guided Image Editing)’를 출시했다. 자연어 명령으로 다양한 이미지 편집이 가능한 획기적인 도구라는 평가다.

벤처비트는 6일(현지시간) 애플이 자연어 명령을 기반으로 이미지를 편집할 수 있는 오픈 소스 AI 모델 MGIE를 출시했다고 보도했다. 이 모델은 포토샵 스타일 수정, 사진 최적화, 로컬 편집 등 다양한 편집을 텍스트 프롬프트로 처리해 낸다.

MGIE는 애플과 캘리포니아대학교(UC) 산타바바라 연구진의 협업 결과다. 논문은 AI 분야 최고 권위 국제 학회인 ICLR에서 승인, 발표됐다.

MGIE는 텍스트와 이미지를 모두 처리할 수 있는 멀티모달언어모델(MLLM)을 사용한다. 먼저 사용자 입력으로 ‘표현 지침’을 도출할 수 있다. 예를 들어 ‘하늘을 더 파랗게 만드십시오’라는 입력을 주면, MGIE는 ‘하늘 영역의 채도를 20% 증가시키십시오’라는 명령을 생성할 수 있다. 그 다음 MLLM을 사용해 새로 생성된 표현 지침을 픽셀 수준의 편집 내용을 안내하는 ‘잠재 표현(latent representation)’으로 변환하고, 최종적으로 확산 모델을 기반으로 편집된 이미지를 생성한다.



MGIE 개요 (사진=애플)


▲자르기, 크기 조정, 회전, 뒤집기 등 일반적인 포토샵 스타일 수정 ▲밝기, 대비, 선명도, 색상 균형 등 이미지의 전반적인 품질 최적화 ▲얼굴, 눈, 머리카락, 옷 등 특정 영역 개체 편집 등 품질을 향상할 뿐만 아니라 전반적인 사용자 경험 향상이 가능하다.

현재 MGIE는 깃허브에서 오픈 소스 프로젝트로 제공되며, 허깅페이스에서 호스팅되는 웹 데모를 통해 온라인으로 MGIE를 체험할 수 있다.

사용하기 쉽고 유연하게 커스터마이징할 수 있도록 설계됐다는 것이 장점이다. 사용자는 이미지를 편집하기 위해 자연어 명령을 입력하면, MGIE가 파생된 명령어와 함께 편집된 이미지를 생성한다. 또 사용자는 MGIE에 피드백을 제공해 편집 내용을 수정하거나 다른 편집을 요청할 수 있다. MGIE는 이미지 편집 기능이 필요한 다른 애플리케이션이나 플랫폼과도 통합할 수 있다.

간단한 색상 조정부터 복잡한 개체 조작까지 다양한 편집 시나리오에 대응할 수 있는 실용적이고 유용한 도구로, 사용자가 소셜 미디어, 이커머스, 교육, 엔터테인먼트, 예술 등 개인적 또는 전문적인 목적을 위해 이미지를 생성, 수정, 최적화하는 데 도움을 줄 수 있다는 평가다.

한편 애플은 지난해 10월 7B·13B의 멀티모달 모델 ‘페렛’에 이어 이번 모델도 오픈 소스로 공개했다. AI 연구에 본격적으로 뛰어 들며 눈에 띄는 관련 논문을 잇달아 선보이고 있다.


Apple releases ‘MGIE’, a revolutionary AI model for instruction-based image editing





출처 :https://www.clien.net/service/board/news/18576965?od=T31&po=0&category=0&groupCd=

Scroll to Top