AI 一月 25, 2026

浅析 Embedding 模型

文章字数 11k 阅读约需 10 mins.

MedImageInsight 中,介绍了由微软发表,第三方发布的医学图像嵌入模型,本文将以其中的 Text Encoder 为例,浅析 Embedding 模型的工作原理。

Embedding ...

查看全文

AI 一月 25, 2026

浅析 Embedding 模型

文章字数 11k 阅读约需 10 mins.

MedImageInsight 中,介绍了由微软发表,第三方发布的医学图像嵌入模型,本文将以其中的 Text Encoder 为例,浅析 Embedding 模型的工作原理。

Embedding 模型是一种将高维数据(如文本、图像等)转换为低维向量表示的模型。通过这种转换,模型能够捕捉数据的语义信息,使得相似的数据在向量空间中距离更近。

lion-ai/MedImageInsights 中的 Text Encoder 为例(其使用的分词器只支持英文),输入 ["lumbar spine...

查看全文

MAC 一月 18, 2026

在 Mac 不包含隐藏文件打包

文章字数 10k 阅读约需 10 mins.

在 Mac 上无论使用命令行工具,还是右键菜单打包、压缩文件,在其他操作系统打开时,都会看到一些隐藏文件,例如:

Mac 文件系统中包含如下内容:

$ tree -a
.
├── .DS_Store
├── file1
├── file2
├── file3
└── test
    ├── .DS_Store
    ├── file1
    ├── file2
    ├── file3
    └── test
        ├── .DS_Store
        └── test

3 directories, 9 files
# 打包
$ tar -...
查看全文

AI 一月 11, 2026

torch.nn.Embedding 中 max_norm 的作用

文章字数 7.7k 阅读约需 7 mins.

https://docs.pytorch.org/docs/stable/generated/torch.nn.Embedding.html#torch.nn.Embedding

nn.Embedding(num_embeddings, embedding_dim) 可以看成是一个查表词典

  • num_embeddings 行,每一行是一个 embedding_dim 维的向量。
  • 输入是索引(比如单词 ID、类别 ID),输出是对应行的向量。

max_norm 的作用:

给这个“词典...

查看全文

DATABASE 十二月 28, 2025

【转】解析 MySQL CTE:WITH 与 WITH RECURSIVE

文章字数 9.5k 阅读约需 9 mins.

在开发过程中,发现在 MYSQLMapper 文件中会用到 WITH 关键字,有一些疑问:为什么要用WITHWITH RECURSIVE ?是什么?有何区别?

MySQL8.0 开始支持 WITH 语法,即:Common Table Expressions (CTE),公用表表达式

CTE 是一个命名的临时结果集合,仅在单个 SQL 语句(selectinsertupdate...

查看全文

AI 十二月 21, 2025

MedImageInsight

文章字数 7.3k 阅读约需 7 mins.

MedImageInsight: AN OPEN-SOURCE EMBEDDING MODEL FOR GENERAL DOMAIN MEDICAL IMAGING 论文中提出了一个用于医学图像的开源嵌入模型:MedImageInsight。该模型采用类似 CLIP 的双塔架构,一个塔是图像编码器,另一个塔是文本编码器:

MedImageInsight 在未经微调的情况下,即可在分类、图像检索、报告生成等多种医学图像任务中表现出色:

该论文主要作者来自微软相关团队,在网络上搜索 MedImageInsight...

查看全文

PYTHON 十二月 14, 2025

DICOM 数据字典

文章字数 34k 阅读约需 31 mins.

DICOM(Digital Imaging and Communications in Medicine,医学数字成像和通信)是一种用于存储和传输医学影像数据的国际标准。

自从 1985 年首次发布以来,DICOM 标准已经经历了多次修订和扩展,以适应不断发展的医学影像技术和需求。当前最新版本为 2025e,历史版本可见 历史版本各版本多种文件格式归档

DICOM 数据字典定义了 DICOM 文件中使用的各种数据元素及其属性。以下是一些常见的数据元素及其含义:

标签 (Tag) 名...
查看全文

IDE 十二月 07, 2025

离线环境 JetBrains 远程开发

文章字数 11k 阅读约需 10 mins.

本文以 PyCharm 纯离线模式官方文档 为例,对其中一些不太清晰的地方进行补充说明,可作为使用 JetBrains IDE 在离线环境进行远程开发的指引。

  • 服务器均无法连接互联网
  • 一台或多台远程开发服务器(拥有本地机器中不具备的源码、运行时环境、GPU 等)
  • 一台 HTTP 服务器(可以与远程开发环境使用相同服务器)
  • 本地机器(无需安装 IDE,本例中即为无需安装 PyCharm)
  • 有可联网环境,能下载必须资源,并传输至离线环境
名称 描述 最终放置位置
JetBrains...
查看全文

AI 十一月 30, 2025

内网环境在 RAGFlow 中使用 MinerU

文章字数 9.4k 阅读约需 9 mins.

本文可作为 使用教程:如何在 RAGFlow 中使用 MinerU 的补充,介绍如何在内网环境下配置 MinerU 解析器以供 RAGFlow 使用。

  1. 已通过 docker 的形式在内网环境部署 RagFlow
  2. RAGFlow 版本 >= v0.21.1
  3. 有内网环境 pip 源

.env 文件中添加如下内容:

MINERU_EXECUTABLE=/ragflow/uv_tools/.venv/bin/mineru
MINERU_MODEL_SOURCE=local

其中 MINERU_MODEL_SO...

查看全文

SPRING 十一月 23, 2025

【转】自定义SpringBoot默认MVC配置?好几个坑,这篇文章必须珍藏

文章字数 14k 阅读约需 13 mins.

前些天,在项目实践过程中出现了一个奇怪的状况,Spring Boot 的参数绑定失效了。而起因只是因为同事把参数上的 @RequestParam 注解去掉了。我们都知道,如果参数名称和 Controller 的方法名相同时,根本不需要 @RequestParam 注解的,Spring Boot 会自...

查看全文
加载更多
0%