WavJourney根据文本提示生成音频
WavJourney根据文本提示生成音频
【WavJourney:根据文本提示生成音频,可生成引人入胜的音频故事情节、个性化的声音、逼真的演讲、情感共鸣的音乐作品和身临其境的音效】《WavJourney - a Hugging Face Space by Audio-AGI》
demo
https://huggingface.co/spaces/Audio-AGI/WavJourney?continueFlag=22d463803a5e9fe20c66258db2d14df1
Github: github.com/Audio-AGI/WavJourne
AIGC音乐
开源TTS(文本生成语音)模型集合
开源TTS(文本生成语音)模型集合
开源TTS(文本生成语音)模型集合
XTTS - https://huggingface.co/coqui/XTTS-v2?continueFlag=22d463803a5e9fe20c66258db2d14df1
YourTTS - https://github.com/Edresson/YourTTS?continueFlag=22d463803a5e9fe20c66258db2d14df1
FastSpeech2 - https://github.com/DigitalPhonetics/IMS-Toucan?continueFlag=22d463803a5e9fe20c66258db2d14df1
VITS - https://huggingface.co/docs/transformers/model_doc/vits?continueFlag=22d463803a5e9fe20c66258db2d14df1
TorToiSe - https://github.com/neonbjb/tortoise-tts?continueFlag ...
OpenVoice:多功能即时声音克隆技术
OpenVoice:多功能即时声音克隆技术
OpenVoice is a multi-functional real-time voice cloning technology developed by the MyShell team. It can clone the voice of the original speaker and generate speech in various languages by providing a short audio sample.
It has the following advantages:
High-precision voice cloning:
It can highly restore the reference voice, supporting speech generation in multiple languages and accents.
Flexible voice style control:
It allows fine adjustments to the emotions and accen ...
Meta开源了AI 音频生成工具 AudioCraft
Meta开源了AI 音频生成工具 AudioCraft
AudioCraft
Meta开源了AI 音频生成工具 AudioCraft,包含 3 个模型:
MusicGen 文本生成音乐
AudioGen 文本生成音频
EnCodec 损失更少的音频压缩
AudioGen的demo:felixkreuk.github.io/audiogen
MusicGen在🤗HuggingFace 上的测试地址(在线Demo):
https://huggingface.co/spaces/facebook/MusicGen?continueFlag=22d463803a5e9fe20c66258db2d14df1
AIGC音乐
Riffusion:基于Stable Diffusion的实时音乐生成
Riffusion:基于Stable Diffusion的实时音乐生成
【Riffusion:基于Stable Diffusion的实时音乐生成,输入歌词和声音提示即可创作音乐】“Riffusion - Stable diffusion for real-time music generation”
https://www.riffusion.com/?continueFlag=22d463803a5e9fe20c66258db2d14df1
模型生成语音
模型生成语音
Pinokio已经支持在本地使用MyShell 的 OpenVoice语音模型生成语音了。
https://pinokio.computer/?continueFlag=22d463803a5e9fe20c66258db2d14df1
Amphion
Amphion
Amphion:一个开源的音频、音乐和语音生成整合工具包。
支持如下功能:
文本转语音(TTS):高性能,支持主流模型及架构,可生成自然的声音。
歌声转换(SVC):可将某人歌声转换成其他人歌声,内置张学友、陈奕迅、王菲等已训练好的声音。
文本转音频(TTA):可通过文本提示,生成逼真的声效、语音以及音乐,类似于 AudioLDM。
GitHub:github.com/open-mmlab/Amphion
以上功能均可在 HuggingFace 上使用。
地址:huggingface.co/amphion
demo https://huggingface.co/spaces/amphion/singing_voice_conversion
在线生成音乐的项目和工具
在线生成音乐的项目和工具
AIGC与声音和音乐相关的在线Demo
歌手换声 A的声音换成B歌手的。
https://huggingface.co/spaces/amphion/singing_voice_conversion
根据提示词生成音乐, 基于Stable Diffusion
https://www.riffusion.com/?continueFlag=22d463803a5e9fe20c66258db2d14df1
根据提示词生成音乐
https://huggingface.co/spaces/Audio-AGI/WavJourney?continueFlag=22d463803a5e9fe20c66258db2d14df1
Meta facebook 公司的根据提示词生成音乐
https://huggingface.co/spaces/facebook/MusicGen?continueFlag=22d463803a5e9fe20c66258db2d14df1
AI换衣服OOTDiffusion
AI换衣服OOTDiffusion
OOTDiffusion:一个高度可控的虚拟服装试穿开源工具
测试了下,效果真的很不错😋
可以根据不同性别和体型自动调整,和模特非常贴合。也可以根据自己的需求和偏好调整试穿效果
OOTDiffusion支持半身模型和全身模型两种模式。
项目:
https://github.com/levihsu/OOTDiffusion?continueFlag=bce9ec7a1b53c96a82251a0fbd34b5f8
Demo:
https://ootd.ibot.cn/?continueFlag=bce9ec7a1b53c96a82251a0fbd34b5f8
WeChatMsg 微信聊天管理工具
WeChatMsg 微信聊天管理工具
【WeChatMsg —— 微信聊天管理工具】
项目地址:https://gitee.com/lc044/WeChatMsg
WeChatMsg 是一款开源的微信聊天管理工具。
🍉功能:
还原微信聊天界面
● 🗨文本✅
● 🏝图片✅
● 🐻❄️表情包✅
● 拍一拍等系统消息✅
导出聊天记录
● sqlite 数据库✅
● HTML (文本、图片、视频、表情包、语音、文件、系统消息)✅
● CSV 文档✅
● TXT 文档✅
● Word 文档✅
分析聊天数据,做成可视化年报 (急需前端大佬提供优质模板)


