V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  misdake  ›  全部回复第 1 页 / 共 15 页
回复总数  281
1  2  3  4  5  6  7  8  9  10 ... 15  
9 天前
回复了 ComplexPug 创建的主题 程序员 关于一个经典海量数据的问题
@misdake 分布式的话就是每台机器只负责某些 bucket ,最后一步每个机器自己先求 topk ,然后汇总。
9 天前
回复了 ComplexPug 创建的主题 程序员 关于一个经典海量数据的问题
我感觉吧,应该是全局总共只有 2048 个 bucket ,依靠 word 的 hash 来 index ,每个 bucket 里是 hashmap 维护这个 hash 的那些单词的词频。
说白了就是类似于一个大的 concurrent hashmap 的实现,分组加锁或分组搞无锁队列来支持多线程更新。每个小文件读完,就遍历小文件的词频累加。
整个 2048bucket 结构对外暴露的其实是单个的 hashmap<word, 频数>。最后一步是这个 hashmap 遍历 kv 搞 topk 。
11 天前
回复了 Curiosity777 创建的主题 Java 请教一个 Java8 stream 应用问题
这种东西应该是实现一个能够累加的迭代器,输出一个累加值(还可以提供当前值)的流
-r 写在-i 前面试试
@misdake 或者 View - Appearance - Navigation Bar - Top
@drymonfidelia NavigationBar 靠右的那些控件上右键,navigation bar - top 。虽然和以前不是完全一样了
文件导航条具体是指的是哪个东西啊?
我记得 Editor Tabs 还有 Breadcrumbs 都可以设置 Top 或 Bottom 的啊
cpu 代码动态编译成 wasm 也许可以搞,gpu 不太好模拟,webgpu 好好用起来带上 workaround 也许勉强够
Enigma 的破译很大程度上就依赖输入字符和输出字符必然不相同这个特点(漏洞)。
这类不增加可选空间的负面规则基本上就是替破解者去掉错误选项。
107 天前
回复了 gongxuanzhang 创建的主题 程序员 JDK 一段代码的疑问
给这么多都是胶水代码,没有实现。有效信息只有 4 个输入和 1 个输出,全靠蒙。
我猜就是这几个属性拼属性名然后排序拼接,过一遍 sha256 。可以调试进 wasm 找找常量字符串,看看属性名叫什么。
公司登陆了 jetbrains 和网易云,其他不登,IM 只登公司账号。真的有 pc 需求的话,带自己的笔记本电脑,手机开热点用。
KVM 切换器
盲猜是 dp 口热插拔功能带来的影响,但好像没啥办法解决
154 天前
回复了 cpxjaz 创建的主题 硬件 手里有几块 500G 硬盘,能干点什么?
整个几个硬盘盒,送给熟悉数码产品的朋友做冷备
156 天前
回复了 XIIPanda 创建的主题 C++ C++菜鸡关于 C++多线程的疑问
resize 的实现是循环 ppt->store(i, load(i)),load 得到的是复制,move 了也没问题,不会修改原值
支持一下
1  2  3  4  5  6  7  8  9  10 ... 15  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1519 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 33ms · UTC 17:07 · PVG 01:07 · LAX 10:07 · JFK 13:07
Developed with CodeLauncher
♥ Do have faith in what you're doing.