继聊天机器人ChatGPT和AI视频模型Sora之后,进军OpenAI即将推出其新的音乐AI音乐模型。据悉,模型该项目正与茱莉亚音乐学院的进军学生合作,进行音乐乐谱的音乐标注,以提供训练数据。模型
OpenAI内部讨论中提到,进军用户可以通过输入文本和音频提示词,音乐生成符合需求的模型音乐,例如为特定声乐曲目添加吉他伴奏。进军这项技术将使用户能够为短视频轻松添加AI生成的音乐配乐,用户在Sora生成的模型TikTok风格视频中,可以快速搭配动感的进军背景音乐,并分享到正在开发的音乐AI社交平台,这将降低内容创作的模型门槛。
OpenAI目前已拥有超过8亿活跃用户,音乐模型的发布预计将增强其AI生态系统并提升用户的参与度。不过,音乐模型是否将与ChatGPT或Sora整合,还是作为独立应用尚不明确,OpenAI对此未作评论。
音乐模型的应用不仅限于个人娱乐,还将支持商业化发展,广告公司可以使用此模型创造广告的歌词和旋律。OpenAI在音乐领域的探索早在2019年便已有迹可循,当年其推出的MuseNet能结合多种乐器生成不同风格的乐曲。2020年,OpenAI发布了会“唱歌”的Jukebox模型,但这两者并未与ChatGPT或Sora整合,由于技术限制,其生成的音乐与人类创作仍有差距。
全球AI音乐竞速正在加速。5月,谷歌推出第二代音乐制作模型Lyria,强调其可应用于广告配乐,这与OpenAI的商业目标相契合。同时,初创公司Suno和Udio的AI音乐生成产品已实现商业化,Suno的年经常性收入达1.5亿美元,较去年增长近四倍。
中国的AI音乐模型也在快速崛起。字节跳动的豆包大模型团队去年推出了音乐生成模型家族Seed-Music。阿里在今年初开源了音乐生成模型InspireMusic,目标是创造集音乐生成、歌曲生成和音频生成于一体的工具。昆仑万维在3月发布的Mureka O1,是全球首款音乐推理大模型,在多项性能上超越Suno V4。腾讯AI Lab在6月开源了SongGeneration大模型,着重解决音质、音乐性和生成速度三个共同问题。9月,MiniMax推出的Music1.5实现了在人声自然性、编曲层次、歌曲结构等方面的多项突破。
本文转载自“财联社AI daily”,作者:朱凌;XM外汇官网编辑:王秋佳。