Recently in Linux世界 Category

随着大语言模型(LLM)和 AI 应用的爆发式增长,一种新型数据库悄然成为 AI 基础设施的核心组件----向量数据库(Vector Database)

传统数据库的局限

传统关系型数据库擅长精确匹配:WHERE name = 'Alice'。但面对以下场景时力不从心:

  • 以图搜图:找出"视觉上相似"的图片

  • 语义搜索:用一句话找出"含义相近"的文档

  • 推荐系统:找出"行为上相似"的用户

这类问题的本质是相似性搜索,而不是精确匹配。

向量与嵌入(Embedding)

AI 模型(如 BERT、CLIP、text-embedding-ada-002)可以将非结构化数据转化为高维浮点数向量,称为 Embedding:

 "今天天气真好" → [0.12, -0.87, 0.34, 0.91, ...]  # 768 维

语义相近的内容,其向量在空间中的距离也更近。相似性搜索就转化为了近似最近邻(ANN, Approximate Nearest Neighbor)搜索问题。

向量数据库的核心能力

 原始数据 → Embedding 模型 → 向量 → 向量数据库存储 → ANN 查询 → Top-K 结果
能力说明
高效 ANN 搜索亿级向量毫秒级返回
多种索引支持IVF、HNSW、DiskANN 等
标量过滤向量搜索 + 条件过滤组合查询
水平扩展分布式存储与查询

Fedora 44 release

过完了五一假期,发现Fedora 44已经按计划发布了,没有跳票。
Fedora 44采用了GNOME 50,引入了仅限 Wayland 的性能增强、改进的分数缩放以及可变刷新率(VRR)支持 。
主要变化包括全面迁移到 DNF5 以加快包管理速度,引入 NTSYNC 内核模块以提升 Windows 游戏性能,以及更新开发者工具如 GCC 16 和 Ruby 4.0。
可以体验了,筒子们,☺

好久没有更新Movable Type 版本了,五一期间闲下来,顺便给升级了一下,8.0.2-> 9.1.1。

OrbStack 数据恢复完整指南

概述

本指南记录了从OrbStack备份镜像文件(data.img.raw)中恢复Docker卷和容器的完整过程。

恢复内容

  • ✅ Docker卷:fedora4cnangel (2.2GB)

  • ✅ 容器:fedora43 (基于自定义Fedora 43镜像)

  • ✅ 用户配置、开发环境和历史数据

其他可用卷

备份中还包含以下卷(未恢复):

  • elasticsearch_certs (28KB)

  • elasticsearch_esdata01 (6.2MB)

  • elasticsearch_kibanadata (4KB)

Milvus 2.6 安装

背景

Milvus官方提供了单进程版本安装方式和K8s(milvus-operator)的安装方式,但这种方式往往不利于生产环境的部署。

Milvus从2.6.0开始,其角色进行了大幅度调整,其架构由:

milvus_architecture.png

演化成:

milvus_architecture_2_6.png

其部署方式也发生了变化。

写这篇文章希望能够细化到Milvus的部署和配置信息,并将Milvus相关依赖明细化,避免黑盒方式使用。

本篇文章会针对Milvus的多角色分布式安装部署进行一一说明。

fedora43 发布

新的发布人杰夫·斯帕莱塔公告了这一消息,敢于尝新的伙伴们赶紧去试试吧

fedora42即将发布

随着神舟十九的飞船返回,fedora42也即将发布。

linux要分裂了?fedora41发布

一些边界不断打破,是促进创新还是倒退?

Fedora Linux 41 默认为命令行包管理工具 DNF 的新主要版本。此版本更快、更小,并且需要更少的支持包。这消除了容器和内存受限系统对"microdnf"的需求----现在,可以跨容器、服务器、桌面和设备使用相同的 DNF。

Fedora Workstation 41 基于 GNOME 47。请阅读 Fedora Workstation 41 的新功能 了解详情。特别是对于命令行用户,Fedora41已将默认终端更改为 Ptyxis。它更轻量级,但也有一些不错的新功能。(如果用户需要 GNOME Terminal 提供的一些灵活性,它仍然存在。)

另外,目前还提供了几个重要的发布日错误修复和安全更新。如果用户从早期的 Fedora Linux 版本升级,将获得它们作为其中的一部分。对于新安装,请务必尽快检查并应用更新。

当打开以https开头的网页时,如果其图片、js或接口是http协议,正常浏览器是打不开该网页的。

clickhouse 数据损坏的跳过方法

Clickhouse服务器强制关闭、异常断电、以及数据拷贝时等,导致Clickhouse数据损坏,服务无法启动,提示:

<Error> Application: DB::Exception: Suspiciously big size (4 parts, 1.05 GiB in total) of all broken parts to remove while maximum allowed broken parts size is 1.00 GiB. You can change the maximum value with merge tree setting 'max_suspicious_broken_parts_bytes' in <merge_tree> configuration section or in table settings in .sql file (don't forget to return setting back to default value): Cannot attach table `ads`.`xxx_tbl` from metadata file /var/lib/clickhouse/store/

需要在/etc/clickhouse-server/config.d配置中增加max_suspicious_broken_parts.xml文件,内容如下:

<?xml version="1.0"?>
<yandex>
     <merge_tree>
         <max_suspicious_broken_parts>1000</max_suspicious_broken_parts>
         <max_suspicious_broken_parts_bytes>2147483648</max_suspicious_broken_parts_bytes>
     </merge_tree>
</yandex>

然后启动Clickhouse即可:

systemctl start clickhouse-server.service

Monthly Archives

Pages

Powered by Movable Type 9.1.1

About this Archive

This page is an archive of recent entries in the Linux世界 category.

C/C++ is the previous category.

我和Perl is the next category.

Find recent content on the main index or look in the archives to find all content.