Tag: LLM - Alpha Hinex's Blog

「 AI 」三月 15, 2026

【转】如何调用Github Copilot订阅的Chat Completions API

文章字数 6k 阅读约需 5 mins.

原文地址：https://skae.top/p/copilot-api/
原文作者：^薄荷布丁^

这篇文章教你怎么自己编写代码，把你的Github Copilot订阅的API接出来用。

大致流程是：

发起 Device Flow 请求，获取device_code和user_code（XXXX-XXXX）。
在浏览器访问 https://github.com/login/device，输入`user_code`。
轮询换取access_token（ghu_开头的 token）。
用access_token...

查看全文

「 AI 」一月 03, 2026

《从零构建大模型》书摘

文章字数 26k 阅读约需 23 mins.

豆瓣评分 9.3

本书中的所有代码示例均可在Manning出版社的官方网站(https://www.manning.com/books/build-a-large-language-model-from-scratch)和GitHub(https://github.com/rasbt/LLMs-from-scratch)上找到

https://magazine.sebastianraschka.com

https://sebastianraschka.com

• [PAD]（...

查看全文

「 BOOK 」十月 12, 2025

《图解大模型：生成式AI原理与实战》书摘

文章字数 60k 阅读约需 55 mins.

豆瓣评分 7.4

GitHub仓库(https://github.com/HandsOnLLM/Hands-On-Large-Language-Models)

1.2 语言人工智能的近期发展史

1.2.2 用稠密向量嵌入获得更好的表示

如果两个词各自的相邻词集合有更大的交集，它们的词嵌入向量就会更接近，反之亦然。

1.2.3 嵌入的类型

有许多类型的嵌入，如词嵌入和句子嵌入，它们用于表示不同层次的抽象（词与句子）。

词袋模型在文档层面创建嵌入，因为一个嵌入表示的是整个文档。相比之下，word2vec...

查看全文

「 AI 」五月 25, 2025

基于对话补全接口的问答能力评估

文章字数 9k 阅读约需 8 mins.

LLM Evaluator 是一个跨平台的命令行工具，旨在帮助用户评估基于兼容 OpenAI API 对话补全接口的大语言模型（或智能体、RAG 流程）对于有标准答案的问题的回答能力。

基本工作流程为：

llm-evaluator 通过配置文件读取待评估的问题及标准答案，评估标准可选，默认为本质含义一致，可设置为 = 表示必须与标准答案完全一致；
调用候选模型对话补全接口，获得候选模型对待评估问题的回答；
使用评估提示词组装问题、标准答案和候选模型回答的内容，交由评估模型对回答进行评估；
评...

查看全文

「 AI 」五月 11, 2025

一些短期免费调用 DeepSeek-V3-0324 等模型 API 的方法

文章字数 17k 阅读约需 15 mins.

AI
LLM

有哪些可以短期免费调用 DeepSeek-V3-0324 等模型 API 的方法？

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324?inference_api=true&inference_provider=sambanova&language=sh

https://huggingface.co/settings/tokens

curl https://router.huggingface.co/sambanova/v1/chat...

查看全文

「 AI 」二月 16, 2025

可本地部署使用的大模型显存资源估算工具

文章字数 3.5k 阅读约需 3 mins.

🤗 Model Memory Calculator 是 🤗 Accelerate 库提供的一个模型显存计算工具，可估算模型训练或推理时所需的显存大小。

但目前该在线工具无法正常使用，即使使用默认的模型名称，也会报在 Hub 中无法找到该模型：

在该 space 的 discussions 中也有不少人遇到了此问题。

本文提供一种本地化部署运行此工具的方法，还可通过指定 HF_ENDPOINT 避免无法访问 Hugging Face 的问题。

直接部署 https://huggingface.co...

查看全文

「 AI 」四月 14, 2024

无外网环境部署 AgentFabric 及使用 AgentFabric 构建的 Agent

文章字数 8.8k 阅读约需 8 mins.

目标：在纯内网环境完成基于 ModelScope-Agent 的可定制化的 Agent 的构建和发布
前提：需在有外网环境提前下载好所需内容

在可以访问外网的环境中，准备一个工作目录（如：/data/work），在这个目录下进行后续操作。

1. 拉取镜像

拉取 ModelScope-Agent 镜像，镜像中已经安装好所需依赖。

docker pull registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope-agent:v0.3....

查看全文