AI音频生成图像_AI音生图是什么_AI音生图怎么实现

一个名叫「Music To Image」应用程序在Hugging Face社区横空出世后，直接热度飙升，冲上了本周热搜榜，让人们看到了「音生图」的潜在可能性。

简而言之，只要上传一段音乐，它就能根据音乐旋律和歌词，生成一张对应意境的图片。

玩法也十分简单，只需在页面上拖拽或者上传一段音频文件，支持MP3/WAV等常见音频格式，AI会直接调用AI绘画工具Stable Diffusion的API接口，进行下一步的「文生图」动作。

将音频发送到LP-Music-Caps以生成音频字幕，然后使用Llama2大模型将其转换为说明性图像描述，最后运行Stable Diffusion XL以从音频生成图像！

注意：音频仅能推理前30秒。

相关工具推荐

由科大讯飞推出的一款先进的人工智能产品，它具备多项核心能力，包括多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力以及多模态输入和表达能力。

百度出品的AI大模型聊天机器人，中文名是文心一言，英文名是ERNIE Bot。

美图公司最新推出的AI商业设计类工具，基于其在图片处理、素材领域的积累，引入人工智能大模型能力，支持AI文生图、AI海报、AI试衣、AI商品图设计、AI图像消除、AI PTT制作、AI智能抠图等多种功能。

美图公司出品的一个AI绘画创作工具平台，提供文生图、图生图，以及用户自主训练绘画大模型。

Canva是一款在线平面设计工具，旨在为用户提供简单、易用的设计解决方案。

一款功能强大的AI内容创作全能型网站，提供了AI智能写作、照片数字人制作、AI短视频制作、AI换脸和AI写真等功能。