플럭스, 새로운 오픈소스 이미지 생성 AI
알림
|
페이지 정보
작성일
2024.08.08 10:30
본문
스테이블 디퓨전 출신이 설립한 독일 스타트업 블랙 포레스트 랩(Black Forrest Labs)이 오픈소스 이미지 생성 AI ‘플럭스(Flux)’를 선보였습니다. 복잡한 장면, 사람의 특징 등을 표현하는 데 있어 뛰어나다고 합니다. 특히 그동안 이미지 생성 AI의 약점 중 하나였던 사람의 손을 만드는 데 탁월합니다.
플럭스는 멀티모달과 병렬 확산 트랜스포머 블록을 결합한 하이브리드 아키텍처를 기반으로 구축됐습니다. 최대 120억 개의 파라미터까지 확장할 수 있습니다. 회전식 위치 임베딩(rotary positional embeddings)과 병렬 주의 레이어(parallel attention layers)를 도입하여 모델의 기능을 더욱 향상시켰습니다. 업체 측은 화질, 신속한 응답성, 출력 다양성 측면에서 미드저니 6.0, 달리 3 등과 같은 기존 모델보다 우수한 성능을 보였다고 밝혔습니다.
다만 해상도를 높이고 이미지를 수정하는 데 필요한 업스케일링, 인페인팅 기능을 지원하지 않습니다. 프롬프트 민감도도 높습니다. 원하는 결과를 얻기 위한 프롬프트에 어려움을 겪을 수 있습니다. 실제 사실이나 시나리오를 정확하게 반영하는 결과를 생성하지 못할 수도 있습니다.
포스팅 전문 및 관련 정보 : https://naver.me/FioLvO2X
댓글 0