V2EX › yjhatfdu2 的所有回复 › 第 1 页 / 共 8 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 2 3 4 5 6 7 8

❮

❯

8 天前

回复了 ahdw 创建的主题 › Local LLM › 闲置 16GB M1 Pro MBP 跑大模型

这个问题我在 omlx 上遇到过，似乎是你设置的上下文大小，不是比较整数的值，比如你填个 32768 或者 65536 试试

2 月 5 日

回复了 inyfee 创建的主题 › 程序员 › 从之前的反重力账号不能用了之后，我试用了一个星期的 kimi k2.5，评价是不好用

我都用的 opencode 连接官方的收费 API ，试下来 K2.5 是不如 M2.1 的。K2.5 慢、轴、蠢，反复错误修复不正确，而且关于任务的理解就很不到位。M2.1 虽然也不算出色（和 GPT5.2 、opus 比），但是快、基本可以正确

2 月 2 日

回复了 uuundefined 创建的主题 › 程序员 › 谷歌号风控了，深度体验了下 k2.5。还是很垃圾啊

确实垃圾，看了下我在 moonshot 居然还有余额，用的官方的 API 接 opencode ，又慢又蠢而且反复出错，根本不如 M2.1 ，当然都远不如 gpt-5.2-codex 和 claude

1 月 27 日

回复了 Loser110 创建的主题 › 程序员 › PHP 网站重构， Rust/ Python + PostgreSQL + astro+solid，大家觉得怎么样子

当然是考虑一下新一代的 next.js ，新一代的 php😅

1 月 26 日

回复了 MagicCoder 创建的主题 › 程序员 › 拥抱 PostgreSQL 支持 UI 配置化

@MagicCoder duckdb 的 pg_duckdb 插件并不是很适合。首先，你还是需要 pg ，pg 需要单独部署，不能集成到应用里面，作为轻量化的，必然增加了部署的复杂度。第二，pg 需要部署 pg_duckdb 插件需要自行编译或者使用特定的发行版，还是有一定复杂度的。第三，pg_duckdb 主要是方便使用 pg 访问、查询外部 parquet 等文件，或者联合 pg 本地表进行分析查询。但是还是需要走 pg 的协议、parser 等，也没法直接写入 duckdb 自己的库，对于现在这个场景降低了性能，提高了复杂度。

1 月 26 日

回复了 MagicCoder 创建的主题 › 程序员 › 拥抱 PostgreSQL 支持 UI 配置化

@MagicCoder clickhouse 性能上也是可以的，但是部署维护复杂，稍微老点的版本对于 update/delete 效率非常低，资源消耗也是很高。duckdb 适合直接平替 sqlite ，单机模式下很适合。当然你这里如果需要初始化也做的非常快，还是需要做一些工程优化的，如果是 duckdb 直接使用 golang 的驱动，使用 appender 接口进行写入，这个场景也就 20-30w 行一秒，我是尝试了直接使用 go-parquet ，每个线程独立直接写入 parquet 文件，最后再用 duckdb 执行 sql 直接导入，后续再使用 go 的 database/sql 接口写入增量数据，这样才能做到初始化的极速、后续处理的方便。

1 月 26 日

回复了 MagicCoder 创建的主题 › 程序员 › 拥抱 PostgreSQL 支持 UI 配置化

我看了下，你这里用了大量的维度表、预聚合、分表来提高性能，其实用 duckdb 性能足够，单机 10 亿条都用不着干这些事。可以极大的简化后端，减少存储占用和提高解析和写入速度

1 月 26 日

回复了 MagicCoder 创建的主题 › 程序员 › 拥抱 PostgreSQL 支持 UI 配置化

然后使用 create table access_log as select * from 'parquet_out/*.parquet'; 创建 duckdb 的表并导入 parquet 的所有数据，耗时 20 秒，之后查询可以再快一倍，最终 duckdb 存储 7000 多万条记录占用硬盘 1.9G ，原始 access.log 一共 11G

1 月 26 日

回复了 MagicCoder 创建的主题 › 程序员 › 拥抱 PostgreSQL 支持 UI 配置化

试了下，使用 golang 并行解析 11G 的 nginx accesslog ，同样适用 ip2region 解析地理位置，解析 useragent 字段，8 个线程，写入 parquet 文件，在我 m1max 老机器上可以在 40 秒左右完成。然后使用 duckdb 直接查询，7000 多万条数据，根据状态码 group by count 聚合大概 0.11 秒，还是非常适合这个场景的，整个 dashboard 尤其是只分析时间段的，应该秒级全出。
select count(*),status from 'parquet_out/*.parquet' group by status;
┌──────────────┬────────┐
│ count_star() │ status │
│ int64 │ int32 │
├──────────────┼────────┤
│ 16455120 │ 200 │
│ 420 │ 413 │
│ 58349130 │ 404 │
│ 261330 │ 400 │
│ 8310 │ 500 │
│ 60 │ 408 │
│ 3540 │ 501 │
│ 3537120 │ 405 │
│ 90 │ 403 │
│ 7230 │ 206 │
│ 15630 │ 304 │
│ 4980 │ 499 │
├──────────────┴────────┤
│ 12 rows 2 columns │
└───────────────────────┘
Run Time (s): real 0.112 user 0.937740 sys 0.047321

1 月 26 日

回复了 MagicCoder 创建的主题 › 程序员 › 拥抱 PostgreSQL 支持 UI 配置化

@dog82 估计是便于分析聚合吧，不过存 pg 也确实是效率有点低了，我做的话可能会考虑存 parquet 文件用 duckdb 分析，这样文件可以存文件系统也可以存 s3 ，比较灵活，体积也非常小，10G 文件做到分钟级解析我也有信心

1 月 26 日

回复了 MagicCoder 创建的主题 › 程序员 › 拥抱 PostgreSQL 支持 UI 配置化

为什么不用 duckdb 呢？和 sqlite 一样是进程内数据库，但是是列存分析型数据库性能超强，存储效率也会比 pg 和 sqlite 高很多，存储体积小，也基本支持 postgresql 的语法，估计时间可以进一步缩短好几倍。

1 月 14 日

回复了 woodfizky 创建的主题 › PostgreSQL › 适配信创数据库的人的精神状态 be like

你的 pg 可能也是信创的，result_1 反正我的 pg 是 1 ，而且怎么看也应该是 1

1 月 13 日

回复了 wenerme 创建的主题 › 程序员 › 做了个 mcp-cli 对标 claude code 的 mcp-cli，欢迎尝试

建议加上 OpenAI Codex 的,主要是在~/.codex/config.toml

2025 年 12 月 10 日

回复了 ArmsZ 创建的主题 › 问与答 › ConfyUI 云电脑推荐

自己下载安装 comfyui ，然后去 hf 下载对应的模型，挺简单，我 m1max 也能跑 zimage ，不要用整合包

2025 年 11 月 26 日

回复了 arnoldnuo 创建的主题 › Python › 为什么 Python 的包管理这么难用，比 node 的 npm 难用一万倍，每次进入项目都要手动执行一下 conda activate xxx，难道就没有默认的 Python 项目级别的依赖吗？

conda 太傻逼了，用了小心给你发律师函

2025 年 11 月 19 日

回复了 shendaowu 创建的主题 › 数据库 › 数据库性能测试的要点有哪些？

@CEBBCAT 这个回答一看就没有看 OP 的原问题，原问题是描述了一个具体的场景的，而且明确是 postgresql ，而这个回复十分的通用甚至没有回答正文的内容，只能回复”数据库性能测试的要点有哪些？“，而且标点格式十分规范，英文标注，引号的使用，十分像不是很高级的 AI

2025 年 11 月 19 日

回复了 shendaowu 创建的主题 › 数据库 › 数据库性能测试的要点有哪些？

主要还是看你的业务需求，按照实际使用情况，设计测试用例，然后使用测试工具测试。比如你的场景可以按照预期的标签数量、写入查询的比例，并且适当放大，然后用 pgbench 等来压测，观察 cpu 、内存、IO 、连接数之类的压力。另外，还可以用 explain analyse 来详细分析单个查询是不是比较科学，有没有优化空间。顺便，#2 这样分段这么清楚，说的这么清楚但是不贴合问题的，一眼 AI

2025 年 11 月 19 日

回复了 shendaowu 创建的主题 › 数据库 › 数据库性能测试的要点有哪些？

@CEBBCAT 一看就是 LLM

2025 年 11 月 19 日

回复了 shendaowu 创建的主题 › 数据库 › 标签系统内容最大标签数放开到很大（比如三万）对性能影响有多大？

考虑用 roaringbitmap 实现

2025 年 11 月 5 日

回复了 grzhan 创建的主题 › 远程工作 › [回复抽红包] [上海|长春|合肥|Remote+海外出差] Agentic 研发工程师

支持一下

1 2 3 4 5 6 7 8

❮

❯