OTHERS 九月 28, 2024

比较两个相似 PDF 文件的内容差异

文章字数 3.5k 阅读约需 3 mins.

本文给出两个比较相似 PDF 文件内容差异的方法,
《Understanding DeepLearning (5 August 2024)》
《Understanding DeepLearning...

查看全文

AI 六月 02, 2024

Vanna 离线环境部署

文章字数 7k 阅读约需 6 mins.

Vanna 是一个 MIT 许可的开源 Python RAG(Retrieval-Augmented Generation)框架,可以用来以对话形式与 SQL 数据库交互。

Vanna 提供两种使用方式:

  1. 代码调用,如 vn.ask("What are the top 10 customers by sales?")
  2. 基于 Flash 的 Web 应用

工作原理

Vanna 的工作原理与通常的 RAG 原理类似,即:

  1. 先将数据库表的元数据信息、DDL 语句、SQL 查...
查看全文

PYTHON 五月 19, 2024

使用 modelscope 在离线环境部署模型服务关键点

文章字数 8k 阅读约需 7 mins.

在 ModelScope 的 本地启动服务 文档中,介绍了使用 modelscope server 发布模型服务的方法。
简单来说,就是执行如下命令:

modelscope server --model_id=qwen/Qwen-7B-Chat --revision=v1.0.5

但在离线环境中使用上述命令时,可能会遇到各种问题。本文以使用 modelscope 最近的(2024-04-27)发布版本 v1.14.0 为例,介绍在离线环境中部署模型服务的关键点。

共有如下五个关键点需要注意:

  1. 模...
查看全文

PYTHON 五月 12, 2024

识别旋转验证码图片角度

文章字数 6.2k 阅读约需 6 mins.

简单聊聊旋转验证码攻防 中介绍了一些旋转验证码的攻防思路,并提供了 rotate-captcha-crack 实现。

README 文档的 Prepare 部分提到需要支持 CUDA10+ 的设备(GPU),经实测,在 Windows CPU 环境下也可使用,且性能基本满足需求。

为在 Windows CPU 环境执行 test_captcha.py 脚本验证旋转角度预测效果,以及通过 server.py 发布 HTTP 服务,需对仓库中代码进行以下 调整

diff --git a/rotate_captcha_...
查看全文

PYTHON 三月 10, 2024

全国中小学信息技术创新与实践大赛(NOC)Python 在线练习

文章字数 1k 阅读约需 1 mins.

收集到的一些 NOC Python 真题和模拟题

在线练习地址:https://alphahinex.github.io/NOC

欢迎纠错和补充习题

题库文件 noc.js,题目格式:

{
    "question":"[多选]下面哪些代码可以往列表 ls 中添加元素?",
    "image":"noc/mock27.png",
    "choices":["A.ls.append()","...
查看全文

PYTHON 二月 25, 2024

小米 4A 千兆版路由器禁 ping

文章字数 11k 阅读约需 10 mins.

小米路由器的官方固件中并不支持设置禁 ping。

本文借助 OpenWRTInvasion 利用 Root Shell 漏洞实现小米4A千兆版路由器禁 ping。

OpenWRTInvasion 是一个可以获得小米路由器 Root Shell 权限的工具,支持多种路由型号和固件版本,也有一些写明 不支持的型号和固件版本

以小米4A千兆版路由器为例,分为国内版、国际版,还有 v1、v2 版本,可参照 这里 区分不同版本。

未写明支持或不支持的版本,也有能成功的可能,比如下面的过程是在 小米4A千...

查看全文

AI 一月 28, 2024

HumanEval-X

文章字数 25k 阅读约需 23 mins.

HumanEval-X 是 清华大学 KEG 实验室 THUDMCodeGeeX 系列多语言代码生成模型中提供的一套评价标准。

使用了与 HumanEval 相似的评价方式,不同的是,除 Python 外还包含了 C++JavaJavaScriptGoRust 语言的手写样本,可对上述语言的代码生成能力进行评价:

接下来,我们以评估 StarCoderBase-7B 模型的 Java 代码生成能力为例,简单介绍一下 HumanEval-X 的用法。

先来看下数据集,引用 如何...

查看全文

PYTHON 一月 14, 2024

JupyterLab 实战

文章字数 11k 阅读约需 10 mins.

Project Jupyter (/ˈdʒuːpɪtər/) 是一个旨在开发跨多种编程语言的交互式计算的开源软件、开放标准和服务的项目。

Project Jupyter 已经开发和支持了交互式计算产品 Jupyter Notebook 和 JupyterLab。

Jupyter Notebook 是经典的 Notebook 交互界面,JupyterLab 是下一代的 Notebook 交互界面。

本文主要介绍 JupyterLab 环境搭建,包括远程密码访问及添加 Kernel 以支持其他语言...

查看全文

AI 十二月 31, 2023

HumanEval

文章字数 7.1k 阅读约需 6 mins.

HumanEval 是 OpenAI 用来评估大语言模型生成代码能力的工具,包括手写的 164 个 python 编程问题及解答的 jsonl 格式数据,以及执行评估的脚本。

先来看下数据集,下面是 HumanEval.jsonl.gz 中的一条数据:

{
    "task_id": "HumanEval/0",
    "prompt": "from typing import List\n\n\ndef has_close_elements...
查看全文
0%