Heliki
专题知识
行业研究
登 录
付费社群
GPU资源评估
模型名称
参数量 (B)
模型精度
FP32 (完整精度)
FP16 (半精度)
INT8 (8位量化)
INT4 (4位量化)
QPS要求 (每秒请求数)
暂不考虑
1
2
3
4
5
6
7
8
9
10
10-50
50-100
100以上
响应延迟要求
暂不考虑
1秒
2秒
3秒
4秒
5秒
6秒
7秒
8秒
9秒
10秒
10-50秒
当前GPU配置
业务场景 (可多选)
智能客服场景
知识库场景
智能体场景
批量任务场景
其他场景
开始评估
- 模型可能会算错,结果仅供参考!
暴躁哐哐👉🏻AI星球村
没有花里胡哨的课程,全是行业大佬的应用经验分享
每天群内100+消息互动,付费才有学习动力
学不完,根本学不完!