AI 三月 01, 2026

MedImageInsight Image Encoder 过程分析

文章字数 15k 阅读约需 14 mins.

浅析 Embedding 模型 中,我们分析了 MedImageInsight 的 Text Encoder,本文将继续基于 lion-ai/MedImageInsights 版本(以下简称 MI2...

查看全文

AI 二月 08, 2026

【转】【图解AI:动图】各种类型的卷积,你认全了吗?

文章字数 8.4k 阅读约需 8 mins.

卷积(convolution)是深度学习中非常有用的计算操作,主要用于提取图像的特征。在近几年来深度学习快速发展的过程中,卷积从标准卷积演变出了反卷积、可分离卷积、分组卷积等各种类型,以适应于不同的场景,接下来一起来认识它们吧。

卷积核(Kernel):卷积操作的感受野,直观理解就是一个滤波矩阵,普遍使用的卷积核大小为3×3、5×5等;

步长(Stride):卷积核遍历特征图...

查看全文

AI 一月 25, 2026

浅析 Embedding 模型

文章字数 11k 阅读约需 10 mins.

MedImageInsight 中,介绍了由微软发表,第三方发布的医学图像嵌入模型,本文将以其中的 Text Encoder 为例,浅析 Embedding 模型的工作原理。

Embedding 模型是一种将高维数据(如文本、图像等)转换为低维向量表示的模型。通过这种转换,模型能够捕捉数据的语义信息,使得相似的数据在向量空间中距离更近。

lion-ai/MedImageInsights 中的 Text Encoder 为例(其使用的分词器只支持英文),输入 ["lumbar spine...

查看全文

AI 一月 11, 2026

torch.nn.Embedding 中 max_norm 的作用

文章字数 7.7k 阅读约需 7 mins.

https://docs.pytorch.org/docs/stable/generated/torch.nn.Embedding.html#torch.nn.Embedding

nn.Embedding(num_embeddings, embedding_dim) 可以看成是一个查表词典

  • num_embeddings 行,每一行是一个 embedding_dim 维的向量。
  • 输入是索引(比如单词 ID、类别 ID),输出是对应行的向量。

max_norm 的作用:

给这个“词典...

查看全文

AI 十二月 21, 2025

MedImageInsight

文章字数 7.3k 阅读约需 7 mins.

MedImageInsight: AN OPEN-SOURCE EMBEDDING MODEL FOR GENERAL DOMAIN MEDICAL IMAGING 论文中提出了一个用于医学图像的开源嵌入模型:MedImageInsight。该模型采用类似 CLIP 的双塔架构,一个塔是图像编码器,另一个塔是文本编码器:

MedImageInsight 在未经微调的情况下,即可在分类、图像检索、报告生成等多种医学图像任务中表现出色:

该论文主要作者来自微软相关团队,在网络上搜索 MedImageInsight...

查看全文

AI 十一月 30, 2025

内网环境在 RAGFlow 中使用 MinerU

文章字数 9.4k 阅读约需 9 mins.

本文可作为 使用教程:如何在 RAGFlow 中使用 MinerU 的补充,介绍如何在内网环境下配置 MinerU 解析器以供 RAGFlow 使用。

  1. 已通过 docker 的形式在内网环境部署 RagFlow
  2. RAGFlow 版本 >= v0.21.1
  3. 有内网环境 pip 源

.env 文件中添加如下内容:

MINERU_EXECUTABLE=/ragflow/uv_tools/.venv/bin/mineru
MINERU_MODEL_SOURCE=local

其中 MINERU_MODEL_SO...

查看全文

AI 七月 20, 2025

Dify 知识库迁移

文章字数 7.2k 阅读约需 7 mins.

迁移 Dify 中单个知识库的参考方案,不同 Dify 版本表结构可能略有差异。

# 待迁移的知识库 id
dataset_id = 'xxxxxx'

# 源数据库租户
# select tenant_id, created_by, embedding_model_provider, embedding_model from datasets where id='{dataset_id}';
source_tenant_id = 'xxxxxx'
... 查看全文

AI 六月 29, 2025

用 TEI 部署向量嵌入和重排模型,并在 Dify 中使用

文章字数 21k 阅读约需 19 mins.

TEI(Text Embeddings Inference)是 Hugging Face 提供的一个服务框架,用于部署和运行文本嵌入模型,以及序列分类模型(重排模型)。它支持多种模型格式,性能优异,并提供了 RESTful API 接口,方便与其他应用集成。

Benchmark for BAAI/bge-base-en-v1.5 on an Nvidia A10 with a sequence length of 512 tokens:

CPU 环境部署

最新 1.7 版本 CPU 镜像可能存...

查看全文

AI 六月 22, 2025

Ilya Rice: How I Won the Enterprise RAG Challenge

文章字数 53k 阅读约需 48 mins.

https://abdullin.com/ilya/how-to-build-best-rag/

In this guest blog post Ilya Rice describes the approach that helped him build the best RAG and win in the Enterprise RAG Challenge. He took first place in both prize categories and on SotA leaderboard...

查看全文
加载更多
0%