V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ZAXON  ›  全部回复第 2 页 / 共 2 页
回复总数  36
1  2  
2021-11-19 16:11:06 +08:00
回复了 ZAXON 创建的主题 Windows Windows, 想换成 ubuntu, 请问如何进行 windows 备份?
@TracyMagic woc, 你这头像是传说中的 "这个问题充钱就能解决.jpg" 吗 🤣
2021-11-19 16:08:17 +08:00
回复了 ZAXON 创建的主题 Windows Windows, 想换成 ubuntu, 请问如何进行 windows 备份?
@coderluan 是备份到移动硬盘上, 因为现在的这台电脑只有 256ssd, 所以双系统有点小了.
2021-10-09 17:29:51 +08:00
回复了 pheyer 创建的主题 Google 如何解释 Google 搜索同一关键词不同的人结果不同
设置〉搜索设置 里有个区域设置, 实际测试之后发现不同区域的搜索结果不一样, 定在美国, 中文搜索的结果就是**知识网靠前, 定在香港, 就是 CSDN 靠前, 其他的没试过.
2021-08-24 17:41:40 +08:00
回复了 rationa1cuzz 创建的主题 问与答 关于爬虫字体加密解密思路,新手
https://github.com/zxjlm/Poirot 也许可以看看这个, 我以前写的一个小玩具, 虽然很久没维护了不过应该还能用.
2021-08-24 17:35:23 +08:00
回复了 rationa1cuzz 创建的主题 问与答 关于爬虫字体加密解密思路,新手
主要看是动态的还是静态的吧, 要是那种刷新一次换一个字体文件的可以梭哈 OCR, 静态的写匹配规则效率更高一点
2021-03-04 14:25:47 +08:00
回复了 hackpro 创建的主题 Python 请教一个 Python pandas dataframe 特定列单元格内容高亮的问题
个人感觉 dataframe -> html.table 最灵活的方法还是直接使用 jinja2,我在公司邮件里面生成表格就是这样操作的。

terminal 的格式化输出我推荐用的 https://github.com/willmcgugan/rich 这个库,不过不确定能不能解决你的这个问题。
2021-03-04 09:49:57 +08:00
回复了 hackpro 创建的主题 Python 请教一个 Python pandas dataframe 特定列单元格内容高亮的问题
```python
df = pd.DataFrame([['Allen', 'red', 20], ['Tom', 'yellow', 30], ['Jack', 'blue', 40], ['Bob', 'grey', 50]],
columns=['name', 'color', 'age'])
df_result = df.style.apply(highlight_hot_color, subset=['color'])

with open('test.html','w') as f:
f.write(df_result.render())
```

试试这样写?最后的生成 html 我是出于方便这么写的,你可以再看看有没有更好的写法。

我更好奇的是第一个需求,是要达到 https://github.com/pandas-dev/pandas/issues/18066#issuecomment-371150717 这样的结果吗
2020-12-18 18:23:18 +08:00
回复了 ZAXON 创建的主题 Python 做了一个破解字体反爬虫的小工具
@leafleave 本质上这是通过将字体文件(fft\woff\woff2)中的每个字转换为 png 图片,来后针对每一张图片做 OCR 。有兴趣的话可以看看[实现思路]( https://blog.harumonia.moe/font-antispider-cracker/)。

最终是对含有单个字的图片进行识别,而不是对一段话的识别。

你说的这个思路倒是可以通过引进不同的 OCR 方式来检测出有争议的识别结果。
其实目前程序的设计还是有问题的。比如如果使用了第三方 OCR 做增补,这个增补只是针对本地 OCR 没识别出来的图片,而不是本地 OCR 识别错的图片(蛋疼的是这个错误只有人工能判断)。诸如此类的,我计划等周末再琢磨琢磨提高准确率的方法。
2020-12-18 09:29:34 +08:00
回复了 ZAXON 创建的主题 Python 做了一个破解字体反爬虫的小工具
@leafleave 嗯,目前是依赖于 chineseocr_lite 做本地的 OCR,不过也提供了百度的接口,有条件的话用第三方接口识别率可能会更高。
我也不知道现在国内的 OCR 哪家比较厉害,计划是再加一个腾讯的接口。
毕竟 OCR 不能保证 100%的识别率,这也是做成 web 服务的原因,最后必须要经过一次人工核对的。
2020-12-17 16:07:50 +08:00
回复了 kevinfk2 创建的主题 Python 求大神解答,怎么用 Python 将两个 excel 中类似信息提取出来。
单从你举的例子来看,应该是计算字符串相似度吧。四楼说的去除地区名,正好我前几天用到了,可以去 github 上面找找,有整理好的行政区清单。
2020-05-30 15:00:17 +08:00
回复了 ZAXON 创建的主题 职场话题 实习相关:请问测试岗的工作如何
@amai0w0 算法确实是老大难,寒假那会儿内推阿里,算法题险些裸奔(最后还是跪了~~o(>_<)o ~~
2020-05-30 14:11:15 +08:00
回复了 ZAXON 创建的主题 职场话题 实习相关:请问测试岗的工作如何
@SunriseFox 字节也有投过,一来应该是本科双非,二来这个时间点找实习有点晚了,总之石沉大海 o(╥﹏╥)o

开发动动手,测试累成狗,确实是有这种说法。不过我更担心的是一直呆在测试岗,会不会丧失技术提升的空间,还不想这么早就进入养老模式:D
之所以有这种想法,是因为我目前所接触的自动化测试工具,初试都会感觉很新鲜有趣,但是用习惯了之后会发现技术的上限就在那里,不像做开发可以一直学习新的东西,能够一直前进。有这种想法也可能是因为我对测试使用得不够深度吧。
2020-05-15 07:59:35 +08:00
回复了 ZAXON 创建的主题 酷工作 关于暑期实习的一些疑问(其二)
@v2webdev 哈哈,没想到这么久远的帖子还有人能回复。多谢老哥鼓励。
那段时间疯狂找实习还是过于急躁了,现在正在整理强化以前的一些技术知识,等暑假再冲一波。
2020-04-26 14:29:04 +08:00
回复了 ZAXON 创建的主题 Apple iPhone se 2 上状态栏消失
@xtx 重启确实有用,不过每次这种情况都要重启就太致郁了-_-||

@DGideas 可以说是相当合格的 1 、2 、3 楼了,建议拜把子:D
2019-04-11 11:27:48 +08:00
回复了 Andor_Chen 创建的主题 CSS 送几本《CSS 权威指南(第四版)》
支持支持,最近正好在做网页
1  2  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2253 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 33ms · UTC 02:56 · PVG 10:56 · LAX 19:56 · JFK 22:56
Developed with CodeLauncher
♥ Do have faith in what you're doing.