「 AI 」 四月 14, 2024
无外网环境部署 AgentFabric 及使用 AgentFabric 构建的 Agent
文章字数 8.8k 阅读约需 8 mins.
- 目标:在纯内网环境完成基于 ModelScope-Agent 的可定制化的 Agent 的构建和发布
- 前提:需在有外网环境提前下载好所需内容
在可以访问外网的环境中,准备一个工作目录(如:/data/work
),在这个目录下进行后续操作。
1. 拉取镜像
拉取 ModelScope-Agent 镜像,镜像中已经安装好所需依赖。
docker pull registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope-agent:v0.3....
查看全文
「 AI 」 一月 28, 2024
HumanEval-X
文章字数 25k 阅读约需 23 mins.
HumanEval-X 是 清华大学 KEG 实验室 THUDM 在 CodeGeeX 系列多语言代码生成模型中提供的一套评价标准。
使用了与 HumanEval 相似的评价方式,不同的是,除 Python
外还包含了 C++
、Java
、JavaScript
、Go
及 Rust
语言的手写样本,可对上述语言的代码生成能力进行评价:
接下来,我们以评估 StarCoderBase-7B 模型的 Java 代码生成能力为例,简单介绍一下 HumanEval-X
的用法。
先来看下数据集,引用 如何...
查看全文「 AI 」 十月 14, 2023
一种从 🤗HuggingFace 下载模型的方法
文章字数 8.2k 阅读约需 7 mins.
无法直接从 HuggingFace 下载模型时,可借助此仓库,使用 GitHub Actions 构建一个 Docker 镜像,在镜像中用 huggingface_hub 下载好所需模型,再将镜像推送至 Docker Hub,最后以下载镜像方式曲线下载模型。
当前可用模型可见仓库 tags,仓库 tag 对应镜像 tag,如:
下载 codet5-small tag 对应的镜像命令为:
docker pull alphahinex/hf-models:codet5-small
镜像中包含的模型...
查看全文「 AI 」 九月 17, 2023
【译】可视化神经机器翻译模型(Seq2seq 模型的注意力机制)
文章字数 10k 阅读约需 9 mins.
- 原文地址:https://jalammar.github.io/visualizing-neural-machine-translation-mechanics-of-seq2seq-models-with-attention/
- 作者:Jay Alammar
注意: 下面的动画是视频。轻触或(使用鼠标)悬停在它们上,可获得播放控件,以便在需要时暂停。
序列到序列(Sequence-to-sequence)模型是一种深度学习模型,在诸如机器翻译、文本摘要和图像标题生成等任务中取得了许多成功。...
查看全文「 AI 」 七月 23, 2023
让 AI 辅助编写内部代码
文章字数 25k 阅读约需 23 mins.
在 用 PaddleNLP 结合 CodeGen 实现离线 GitHub Copilot 和 GitHub Copilot 开源替代品 —— FauxPilot 中,我们分别使用 PaddleNLP 和 FauxPilot 将 CodeGen 模型代理为可通过 HTTP 请求访问的接口,并通过 VS Code 插件在 IDE 中获得与 GitHub Copilot 类似的 AI 辅助编码能力。
但不论是这种方式也好,或者是 GitHub Copilot,能够辅助编写的都是通用代码,无法辅助编写内...
查看全文「 AI 」 六月 18, 2023
GitHub Copilot 开源替代品 —— FauxPilot
文章字数 7k 阅读约需 6 mins.
用 PaddleNLP 结合 CodeGen 实现离线 GitHub Copilot 介绍了使用 PaddleNLP + CodeGen 实现类似 GitHub Copilot 服务端的方式,客户端在 VSCode 中使用了 FauxPilot 插件。
FauxPilot 插件原本是对接 FauxPilot Server 的,通过 FauxPilot Server 也可以实现 GitHub Copilot 服务的功能,并支持多显卡加载 CodeGen 模型,可解决单卡显存不足又想加载大模型的问题...
查看全文