Azure99 最近的时间轴更新
Azure99's repos on GitHub
C# · 369 人关注
GenshinPlayerQuery
根据原神uid查询玩家信息(基础数据、角色&装备、深境螺旋战绩等)
Python · 83 人关注
BlossomLM
中英双语对话式大型语言模型
Java · 22 人关注
AlgContestInfo
近期算法竞赛信息爬虫, 支持Codeforces/LeetCode/牛客网/洛谷等常见OJ
C# · 16 人关注
EasyFPSViewer
A viewer for Freeproblemset.
C# · 12 人关注
CodeDonut
A simple C/C++ code editor with GCC for ACMer and beginner
Java · 7 人关注
JerryFramework
A simple, self-hosted, convention-over-configuration Java Web Framework 🌠 Less nonsense, more features!
C# · 5 人关注
AutoACMachine
真*自动AC机
Go · 4 人关注
cvm-blaster
Automatically create/destroy/backup/restore tencent cvm instance.
4 人关注
GFW_White_Domain
大陆域名白名单
2 人关注
azure99-mania
My osu! mania skin
C# · 2 人关注
freeproblemset
freeproblemset is a standard for acm-icpc contest problem storage in xml
C# · 1 人关注
Navicat_Keygen
A keygen for Navicat
0 人关注
abcd
JavaScript · 0 人关注
AndroidAceEditor
Ace editor for use in android apps
Python · 0 人关注
AutoAWQ
AutoAWQ implements the AWQ algorithm for 4-bit quantization with a 2x speedup during inference. Documentation:
Python · 0 人关注
bce-qianfan-sdk
Provide best practices for LMOps, as well as elegant and convenient access to the features of the Qianfan MaaS Platform. (提供大模型工具链最佳实践,以及优雅且便捷地访问千帆大模型平台)
0 人关注
Clash.Meta
A rule-based tunnel in Go.
0 人关注
cloudflare
0 人关注
copilot-analysis
C++ · 0 人关注
dlssg-to-fsr3
Adds AMD FSR3 Frame Generation to games by replacing Nvidia DLSS-G Frame Generation (nvngx_dlssg).
0 人关注
dps
:tangerine: a way to make skeleton screen, 一种自动生成网页骨架屏的方式
0 人关注
hueman
Hueman WordPress theme is one of the best rated theme for blogs and magazines on WordPress.org. Powers 70k+ websites around the world.
JavaScript · 0 人关注
hustoj-1
Popular Open Source Online Judge based on PHP/C++/MySQL/Linux for ACM/ICPC and NOIP training, with easy installation. 开源OJ系统
0 人关注
JustTrustMe
An xposed module that disables SSL certificate checking for the purposes of auditing an app with cert pinning
Python · 0 人关注
LLaMA-Factory
Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, ChatGLM)
0 人关注
moonlight-android
GameStream client for Android
0 人关注
MyPAC
自用
0 人关注
nas-tools
NAS媒体库资源归集、整理自动化工具
Azure99

Azure99

V2EX 第 296249 号会员,加入于 2018-03-03 18:28:27 +08:00
今日活跃度排名 84
根据 Azure99 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
Azure99 最近回复了
几秒前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@ljx626 算上造数据、实验、训练,大概几千吧。数据和实验是大头,如果只用开源数据集做 SFT 且数据量不大的话,花费很少
1 小时 45 分钟前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@qW7bo2FbzbC0 个人感觉是因为对齐阶段,缺乏尝试->验证->回溯的数据(对于这种没有确定解题方法的问题,又好比 24 点,或者各类行测找规律的题),这有点像我们人类的思考方式,GPT 也只是有一些这种能力,但不多。
2 小时 53 分钟前
回复了 jstony 创建的主题 问与答 windows11 什么时候如丝般顺滑了?
只要配置拉到一个水平,windows 一直非常丝滑
4 小时 49 分钟前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@Contextualist T4 * 2 ,不考虑并发的话 llama.cpp 会快不少。另外 HF 的 Zero GPU 也有免费 A100 40G 可以用了,可惜仅支持自家生态。
5 小时 43 分钟前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@mightybruce 没太明白这个和 advICL 有什么关系
6 小时 39 分钟前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@enderftt SFT 的 prompt 里没有 system prompt 的概念,内部 prompt 是下面这样的
A chat between a human and an artificial intelligence bot. The bot gives helpful, detailed, and polite answers to the human's questions.
|Human|: hello
|Bot|:
6 小时 40 分钟前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@xiaohundun 可以理解成,对于一个指令,调用其他模型的输出作为标注输出。也就是让 GPT4 来标训练数据
6 小时 44 分钟前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@enderftt 感谢反馈,下个版本会标注下这个 bad case 。另外如果回答不满意,可以点一下👎按钮,会收集的
6 小时 47 分钟前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@NoDataNoBB
@mightybruce
@xiaohundun
有很多封装好的微调框架,LLaMA-Factory ,swift ,xtuner ,挑个顺手的就行了
8 小时 9 分钟前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@didi0luc 模型知识截止到 2023.6 ,这时小米 su7 还没发布
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5224 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 39ms · UTC 09:33 · PVG 17:33 · LAX 02:33 · JFK 05:33
Developed with CodeLauncher
♥ Do have faith in what you're doing.