如果音乐生成AI能参考上下文，进行重新生成，那可用性就真的很强了

2024-04-18 AI生成 SUNO 人工智能天工skymusic 中文AI音乐

目前的AI生成音乐，虽然效果也很惊艳，但随机性太强，要出一首质量在水平线之上的歌，需要大量的随机生成，然后从里面挑（这个过程一般被玩儿AI的人称之为抽卡）。
但实际情况是，生成出来的歌大概率会有一部分非常令人惊艳，如果AI生成了一首我们觉得大体上满意的歌，存在局部瑕疵需要修改，现有的第一梯队的音乐生成AI并没有这种对局部进行修改的能力。而单独对这一段存在瑕疵的歌曲进行重新生成，它又没办法和其他部分的旋律保持风格的一致性。
所以AI生成音乐，当下亟待解决的一个问题是，在能参考风格的前提下，脑补缺失部分音乐的能力。
这是什么意思呢？举个例，一首两分钟的歌，其中一分半钟质量都可以，而有半分钟质量不太好，这个时候，如果我们可以手动告诉AI，哪一段有问题，需要重新生成，它能知道这一段有问题的歌前后部分的旋律，并生成一段新的旋律，还能和这前后的旋律在情感基调上保持连贯，那就真的令AI音乐大有可为了。
就像SD的controlnet那样，把一个东西从玩具提升为生产力工具。

下一篇

天工skymusic，还没开始创作，这就结束了？

记录个人所思所感，it、人工智能、动画制作、虚拟现实 QQ群：369072404

快捷方式固定到任务栏 comfyui obsidian 字体字体不显示流式输出 print AI生成 python解释器 nginx php windows 删除表删除旧表 Django Hyper-V nextjs 前端服务启动不了 WinNAT 端口占用对齐欧拉至矢量 vector substract 几何节点 blender 模型管理新增添加虚拟桌面切换桌面快捷键快捷键代码块注释快速选择代码块 VSCode 自我纠错人工智能大语言模型 SUNO 天工skymusic 中文AI音乐音乐大模型天工3.0 天工音乐音乐生成 ai 用户权限宝塔 PostgreSQL 数据库 wifi linux triton CLIP 模块未找到 pip升级 pypi 信号槽 signal slot 自定义组件 qtdesigner QT设计师 pyside6 自定义节点只输出首字母元组 bodyBytes 响应请求头响应头 flutter 乱码 marvelous designer MD gizmo 屏幕坐标系动画骨骼重定向动作映射全流程无可供烘焙自定义属性 cuda不可用无法拖拽文件 txt 文本文档注册表右键没有新建文本文档命令行解释器 CMD bash 命令行 shell 终端 powershell 平台 requirements 依赖冲突 requirements.txt 右手坐标系坐标系 VR 传感器虚拟现实 3D软件 AI 旋转顺序默认布局自定义布局样条线参数系数 factor geometry proximity 点线面几何接近查看器预览器 viewer sqlite3 sqflite_common_ffi utf-8 flutter doctor cmdline-tools 路径安卓开发 android SDK路径环境变量注释快捷键解决BUG 复现BUG 排查问题屏幕录制界面重构监视 riverpod 列表排序控制柄调试定位异常 exception dart 必填项有状态组件 git 隐藏的git vscode 捕捉鼠标 Listener 调试器 widget tree Widget Inspector python版本 python 屏幕取词 VScode 配置音频流采样率 VAD 切割对半切割 3D建模 pip 装不上模块 LINK1104 无法打开文件 ninja编译报错 VS冲突 cuda-nvcc CUDA 自定义文本框回车发送消息 pyqt6 uic.exe 编译工具的坑 llm llama2 AutoGPTQ 管理员权限 cmd edge浏览器闪烁光标浏览器设置同步可编辑状态 wasnodesuit 图像遮罩复合 pytorch CPU版换成GPU版文件读写 3D模型生成 shap-e sikulix 查找图标图像识别 if作用域缩进跟随路径摄像头布尔 raycaster 拾取不准确 threejs 底层代码判断图层相同物体重叠时抖动拖拽摄像机方向摄像机滑块编译检查弱类型渲染多画面声音自动播放动画循环正则表达式 regexp 控制权旧文章归档 UTF-8 GBK 字符编码辉光 bloom 图形渲染 JAVA 真正重启才生效 windows睡眠 java servlet tomcat Gridea ejs 自动摘要 javascript react mysql nodejs

渝ICP备20006994号-1 | RSS