OpenAI官方的撰写提示秘籍
OpenAI官方的撰写提示秘籍
官网:platform.openai.com/docs/guides/prompt-engineering/six-strategies-for-getting-better-results
▶策略1:清晰的指令
情景:用户想要在Excel中计算一列数字的总和。
较差的提问:“如何在Excel中加数字?”
更好的提问:“如何在Excel中自动计算一列金额的总和,并将总数显示在名为‘总计’的右侧列中?”
说明:第二个提问更清晰、具体,使模型能够提供更精确的回答。
▶策略2:使用外部工具
情景:用户需要计算一个复杂的数学问题。
传统方法:直接问模型这个数学问题的答案。
改进方法:指导模型使用Python代码来计算答案,例如使用三个反引号(```)包围Python代码。
说明:使用外部工具(如Python代码执行)可以提高计算的准确性。
▶策略3:分解复杂任务
情景:用户需要对一篇长文档进行总结。
传统方法:直接要求模型一次性总结整个文档。
改进方法:将文档分成多个部分,逐个总结,然后将这些小总结合并成一个完整的总结。
说明:将复杂任务分解成多个简单的子任务 ...
Prompting Guide
Prompting Guide
Prompting Guide
项目:www.promptingguide.ai
Git:github.com/dair-ai
最近的更新:
在 GitHub 有 40K ⭐️
全球超过 250 万学习者
添加了 Gemini、Mistral 7B 和 Phi-2 的全面提示指南
Prompt chaining技术的新指南
函数调用的新指南
用于 RAG、函数调用和其他提示技术入门的 Python notebooks
宣布设立一个新章节来记录和发现新的LLM研究成果;这是一项正在进行的工作,未来几周会有大更新
现在有 13 种翻译版本
计算机自学指南
计算机自学指南
Github榜首:北大学神整理最全面的计算机自学指南。这是一个系统的自学计算机的最优路径,北大新科的学长给我们做的很完美的不断迭代的CS学习规划。从必学工具、数学基础、软件基础等,由浅入深的带你走入计算机科学的领域。Computers are not magic! 这里就让我给你讲一下我学习浏览的感受。PKUFlyingPig大神的学习路径附在这里,github.com/PKUFlyingPig/cs-self-learning 小伙伴们请登录GitHub给大神点赞和收藏
AI神器及下载地址
AI神器及下载地址
《动手学深度学习》
《动手学深度学习》
推荐收藏(要学习哦)《动手学深度学习》
zh.d2l.ai
每个章节都是可以直接运行的 Jupyter 记事本,可以在本地直接运行,也可以克隆到 Google Colab 在云端运行。
推荐收藏(要学习哦)《动手学深度学习》
zh.d2l.ai
每个章节都是可以直接运行的 Jupyter 记事本,可以在本地直接运行,也可以克隆到 Google Colab 在云端运行。
开源的一个文档管理系统 Paperless-ngx
开源的一个文档管理系统 Paperless-ngx
它能够将你的纸质文档转换成在线可搜索的文档,并进行分类和索引,方便随时搜索查阅。
GitHub:github.com/paperless-ngx/paperless-ngx
主要有如下特性:
通过 OCR 技术自动扫描处理文档,同时能添加可搜索和可选文本。
能够利用标签、类型等多种方式来管理和分类文档,可利用机器学习技术自动分类。
文档保存为 PDF 格式,并同时保留未更改的原始文件。
支持识别超过 100 多种语言。
支持多种文件类型,如 PDF 文档、图像、纯文本文件或各类办公文档等。
界面美观、提供全文搜索功能、邮件处理功能。
有强大的多用户权限系统,支持全局权限和针对单独文档设置权限。
AnimateAnyone
AnimateAnyone
刚发现摩尔线程前几天复原了阿里的单图跳舞项目并且已经开源训练代码,你可以训练自己的AnimateAnyone模型。
有个基于摩尔线程开源的版本制作了 ComfyUI 节点,并且提供了基础的工作流。
现在可以在ComfyUI中非常简单的让单图跳舞了。
https://github.com/chaojie/ComfyUI-Moore-AnimateAnyone
AnyText(AI生成或者编辑图片中的文字)
AnyText(AI生成或者编辑图片中的文字)
阿里发布的AnyText了解一下!可以用AI生成或者编辑图片中的文字,且与图片风格保持一致。支持中文(毕竟自己人的研究)
AnyText: Multilingual Visual Text Generation And Editing(多语言视觉文本生成和编辑)
项目:github.com/tyxsspa/AnyText
论文:arxiv.org/abs/2311.03054
演示:modelscope.cn/studios/damo/studio_anytext
论文摘要:
基于扩散模型的文本到图像最近取得了令人瞩目的成就。尽管当前的图像合成技术非常先进,能够生成高保真度的图像,但当聚焦于生成图像中的文本区域时,仍然可能会泄露出真相。
为了解决这个问题,我们引入了 AnyText,一种基于扩散的多语言视觉文本生成和编辑模型,专注于在图像中渲染准确且连贯的文本。
AnyText 包含一个具有两个主要元素的扩散管道:辅助潜在模块和文本嵌入模块。前者使用文本字形、位置和蒙版图像等输入来生成用于文本生成或编辑的潜在特征。后者采用 OCR 模型 ...
AIGC 生成音乐
AIGC 生成音乐
宇航员骑马奔驰,配什么BGM比较飒?这活交给AI试试!
输入文本“宇航员骑大马”,秒速生成一段1分钟的音频:
emmm……听起来好动感!
是的没错,AI可以基于文字提示生成音乐!
上面这段演示视频,基于Deforum Stable Diffusion的Colab页面代码修改而来。
这只新项目的名字叫Mubert API,已在Github开源,获得1000多的标星。
推特上也有不少人已经用Mubert API生成音频,来给自己的视频配乐了。
Mubert API大概的工作流程是这样的:
音乐人谱曲后上传→AI进行风格分类→用户输入文本→AI用demo组曲→生成个性化音乐
也就是说,虽然Mubert API在进行text-to-music的工作,但是AI负责的部分,只有两个步骤:
分类demo + 根据提示文本组合demo成曲。
简而言之,最后生成的音乐,是由真人谱曲、AI组曲。
AIGC音乐
GPT-SoVITS
GPT-SoVITS
在 GitHub 上刚开源的一款适用于中文语音克隆的工具:GPT-SoVITS。
仅需提供 5 秒语音样本,1 分钟完成声音克隆并训练出高质量的 TTS 模型!
GitHub:github.com/RVC-Boss/GPT-SoVITS
目前已获得 1.1k Star,看到很多人对其评价为目前最强中文语音克隆工具。
特征:
★ 零样本 TTS:输入 5 秒语音样本并体验即时文本到语音转换。
★ Few-shot TTS:仅用 1 分钟的训练数据即可微调模型,以提高语音相似度和真实感。
★ 跨语言支持:用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。
★ WebUI工具:集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。


