Стартап Stability AI представил новую ИИ-модель Stable Audio Open Small, предназначенную для генерации стереозвука прямо на мобильных устройствах. По заявлениям разработчиков, это самый быстрый аудиогенератор на рынке – он создаёт 11 секунд аудио менее чем за 8 секунд на смартфоне.
Модель разработана в партнёрстве с компанией Arm, известной своими чипами для смартфонов и планшетов. В отличие от аналогов вроде Suno и Udio, которые обрабатывают запросы только в облаке, Stable Audio Open Small способен работать полностью оффлайн, открывая новые сценарии для музыкантов, разработчиков игр и мобильных приложений.
Размер модели составляет 341 миллион параметров. Она оптимизирована для процессоров Arm и подходит для генерации коротких музыкальных фрагментов: ударных, инструментальных вставок и звуковых эффектов. Stability подчёркивает, что модель обучалась исключительно на открытых и свободных библиотеках – Free Music Archive и Freesound , что снижает риски, связанные с авторскими правами. В отличие от Suno и Udio, которые, как утверждается, используют защищённый контент, Stable Audio Open Small юридически безопасна.
Однако модель имеет и ограничения: она понимает только английские запросы и не способна создавать реалистичный вокал или треки высокого качества. Кроме того, Stability предупреждает, что качество результата зависит от жанра и музыкальной направленности – обучение преимущественно велось на западной музыке, что повлияло на стиль вывода.
Документация на Hugging Face описывает технические детали и ограничения модели. Также указаны условия использования: продукт можно использовать бесплатно для исследований, хобби и компаний с выручкой менее $1 млн в год. Всем остальным потребуется платная лицензия Stability .
Stable Audio Open Small – новый шаг Stability AI на фоне непростой реорганизации. После финансовых проблем и смены руководства компания обновила правление, куда вошёл режиссёр Джеймс Кэмерон, и выпустила ряд новых генеративных моделей изображений.
Публичные демо-модули и примеры звучания можно найти в оригинальном релизе .