Sand.ai с отворен код Основен стек за генериране на аудио-видео за три дни

AI стартиращата компания Sand.ai отвори своя основен стек от технологии за генериране на аудио-видео в продължение на три последователни дни в GitHub.

Изданията включват: • daVinci-MagiHuman, мултимодален генериращ модел с 15B параметър • MagiAttention v1.1.0, модул за разпределено внимание • MagiCompiler, унифицирана рамка за компилиране на обучение и изводи

пясък 2.png

Sand.ai е основан от бившия учен от Microsoft Research Asia Cao Yue, като членовете на екипа преди това са допринесли за разработването на Swin Transformer.

Компанията се фокусира върху авторегресивни модели на света и вече е пуснала модели като Magi-1 (видео генериране) и GAGA-1 (аудио-визуално поколение).

sand3.png

Инициативата с отворен код има за цел да сподели напредъка в архитектурата на модела, изчислителната инфраструктура и рамките за компилиране, допринасяйки за основната инфраструктура за генериране на видео.

Източник: Minds in AI

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin