安全书 - 安全书

发表于2024-03-14|linux

如何配置一个rsync服务如何配置一个linux上的rsync服务要在Linux上配置rsync服务，您需要执行以下步骤：安装rsync：在终端中执行以下命令以安装rsync： sudo apt-get install rsync 配置rsync服务：打开rsync配置文件，可以使用任何文本编辑器来编辑该文件： sudo nano /etc/rsyncd.conf 在配置文件中添加以下内容： [module_name] path = /path/to/folder # 要同步的文件夹路径 comment = My Rsync Module uid = username # 可选：以指定用户身份运行rsync服务 gid = groupname # 可选：以指定组身份运行rsync服务 read only = false # 可选：设置为true以只读模式启用rsync服务 4. 保存并关闭文件。 5. 创建一个系统用 ...

高级增加检索LlamaIndex

发表于2024-03-14|AIGCRAG

高级增加检索LlamaIndex 高级检索增强生成（RAG）技术解决了原始RAG管道的局限性。最近一项关于RAG的调查将先进的RAG技术分为检索前、检索和检索后优化。最新文章概述了先进的RAG技术： 🦙 预检索包括滑动窗口、增强数据粒度、添加元数据或优化索引结构等技术，如句子窗口检索。 🦙 检索包括优化嵌入模型（例如，微调）或混合搜索等高级检索技术 🦙 后期检索包括重新排序或提示压缩。我们还使用LlamaIndex实现了一个简单的RAG管道，然后使用以下方法将其增强为高级RAG管道： *语句窗口检索（作为检索前的优化） *混合搜索（作为检索优化） *重新排序（作为检索后优化） Paper: https://arxiv.org/pdf/2312.10997.pdf Jupyter Notebooks: https://github.com/weaviate/recipes/tree/main/integrations/llamaindex/retrieval-augmented-generation

AI按理说应该最擅长理工，为啥先冲击文艺行业？

发表于2024-03-14|AIGCweibo

AI按理说应该最擅长理工，为啥先冲击文艺行业？这个问题的可能答案会是什么呢？文艺行业确实是首先被波及的行业，这是因为AI应用已经在这个行业达到及格线，而且“AI容错率”高并且“人力AI成本差”大导致的。目前阶段，这样的行业就是非常利于AI应用的行业。 AI应用及格线我们先谈下AI应用的特殊之处。某项AI技术是否能应用，跟AI技术的应用效果关系比较大，而且这种关系还不是线性的，而是非线性的。就是说，干一件事情，如果AI的准确率如果达不到一个门槛值，比如80分，那么这项AI技术就是完全不可用的，而不是说50分的技术有50分的用处，90分的技术有90分的用处，所以是非线性的，必须要达到门槛数值，也就是及格线，才能应用，而且往往这个及格线是比较高的。就是说AI在某个行业应用，要么0分，要么一定超过及格线比如80分。大模型以及AIGC这波技术进展，和之前几波比如“深度学习”那波是不太一样的，之所以和之前不太一样，一方面跟大模型确实在很多方面效果好有关系，在很多方面超过了应用的及格线，以前没超过及格线的时候，它尽管还行，但是应用得分就是0，就是不可用的。现在很多行业可以用AI了，从不可能到 ...

Gradio

发表于2024-03-14|AIGCGradio

用Gradio实现一个调用一个REST API，访问的的API地址是http://10.211.6.6:8081/gelf，参数a=1,b=2，返回字段有3个field1, field2, field3, 三个字符的类型都是字符串类型，返回3条数据,结构如下： filed1, filed2,field3 a,b,c, d,e,f h,i,j 用Gradio交结果分页显出来，用二维表格的形式显示，给同具体体Gradio实现的Python代码下面是使用Gradio实现的Python代码： import gradio as gr import requests def rest_api_call(): url = "http://10.211.6.6:8081/gelf" params = {"a": 1, "b": 2} response = requests.get(url, params=params) data = response.json() return data def display_results(pag ...

常用的AIGC网站

发表于2024-03-14|AIGC

常用的AIGC网站 GROQ Perplexity 70B 服装转换ootd 视频风格化 Animate Style - 动画风格 Animate Style 2 - 动画风格2 Cute Animate Style - 可爱动画风格 Pop Art Style - 波普艺术风格 Pixel Style - 像素风格 Origami Style - 折纸风格 Pixar Style - 皮克斯风格 Ink Painting Style - 水墨画风格 Pencil Style - 铅笔画风格

长文本能力会不会杀死RAG

发表于2024-03-14|AIGCrag

长文本能力会不会杀死RAG 随着 Gemini 超100万上下文的推出，推特上关于长文本能力会不会杀死RAG的讨论还是挺多的。围绕 RAG vs 长文本的成本的讨论还比较多，例如图1，但也有说法认为，长文本的成本会慢慢下降。看到一个还不错的长推特评论，来自 Snorkel AI 首席执行官Alex Ratner（注：请自行判断其观点可信度）：「简要看法： RAG 仍将用于复杂的生产系统较长的上下文模型将占用较简单/预生产的用例无论如何，关键的一步仍然是–根据良好的数据调整LLM 系统。 RAG仍将用于复杂的生产系统正如许多人指出的那样，从成本、延迟和规模的角度来看，RAG仍然是胜出的。更持久的是：RAG方法是模块化的。因此，对于更复杂、规模化和/或生产环境，RAG可能会继续存在。较长的上下文模型将吞噬较简单/预生产的用例然而，长上下文模型肯定会占用大量的简单用例和预生产开发（今天的很多AI）。特别是考虑到 post-transformer（例如 SSM 架构）的进展情况… 关键步骤仍然是在良好的数据上调整LLM系统无论是微调/ ...

llamaindex-cli rag

发表于2024-03-14|AIGC

llamaindex-cli rag Llama Index隆重推出了RAG CLI，一个极其简单的命令行工具，允许您对本地计算机上的任何文件进行 RAG。倒是一个可以在本地体验RAG的好项目！#知识科普接龙# 索引包括 glob 模式的任何文件， llamaindex-cli rag --files "./docs/**/*.rst 要搜索，只需执行 llamaindex-cli rag --question “What is LlamaIndex?”` 使用我们的 IngestionPipeline 和 QueryPipeline 抽象构建，可实现高效、高性能的数据索引和检索。该指南还向您展示了如何根据自己的需求自定义逻辑！博客文章： blog.llamaindex.ai/introducing-the-llamaindex-retrieval-augmented-generation-command-line-tool-a973fa519a41 文档：docs.llamaindex.ai/en/stable/use_cases/q_and_a/rag_cli.h ...

Langchain与RAG

发表于2024-03-14|AIGCweibo

Langchain与RAG https://tnblog.net/hb/article/details/8200#LangChain调用

gpt4all

发表于2024-03-14|gpt4all

gpt4all pip install gpt4all Embeddings 翻译成中文为“嵌入”，是指将一个数据集或模型的特征值映射到一个更小的向量空间内的过程。在计算机自然语言处理领域中，Embeddings 通常被用来表示文本、图像或其他数据类型的特征，并使得模型能够更好地理解这些特征。️Embeddings翻译成中文，翻译成计算机自言语言处理的专业词汇️ from gpt4all import GPT4All, Embed4All text = 'The quick brown fox jumps over the lazy dog' embedder = Embed4All() output = embedder.embed(text) print(output) https://docs.gpt4all.io/gpt4all_python_embedding.html#gpt4all.gpt4all.Embed4All.__init__ ~/.username/.cache/gpt4all/ggml-all-MiniLM-L6-v2-f16.bin git clone ...

如何用LangChain对正篇PDF进行润色

发表于2024-03-14|AIGCweibo

如何用LangChain对正篇PDF进行润色要使用LangChain对正篇PDF进行润色，可以按照以下步骤进行操作：首先，将正篇PDF文件转换为可编辑的文本格式。可以使用OCR（Optical Character Recognition）软件或在线服务来实现这一步骤。OCR可以将PDF中的文字提取出来，并保存为可编辑的文本文件。登录LangChain的平台或使用LangChain提供的API，上传转换后的文本文件。LangChain是一种人工智能驱动的语言处理平台，可以对文本进行自动润色和校对。使用LangChain提供的功能来润色文本。LangChain具有多种功能，例如语法纠错、词汇替换、句子重组等。根据需要选择适当的功能来改进文本质量和流畅度。完成润色后，将修订后的文本重新保存为一个新的文件。最后，将新生成的文本文件转换回PDF格式。可以使用PDF编辑器或在线转换服务将修订后的文本重新保存为PDF文件。请注意，LangChain是一个虚构的名称，在实际操作中可能需要使用其他类似的语言处理工具或服务来完成对正篇PDF的润色。如何用LangC ...