维度 | 适配情况 |
操作系统 | • 银河麒麟高级服务器操作系统 V10 |
CPU | • 华为鲲鹏CPU • 海光CPU |
GPU | 毕昇平台中需要使用GPU算力的部分包括:LLM、Embedding模型、文档解析模型、Rerank模型。 其中本地部署的LLM、Embedding、Rerank均使用第三方开源模型,这些模型可以在哪些加速卡上运行需要参考厂商的说明,应该大部分NVIDIA及国产加速卡都可正常运行。 文档解析模型是我们自研模型,该模型老版本(OCR SDK)支持GPU卡如下: • NVIDIA GPU:Ada Lovelace架构、Ampere架构、Turing架构、Volta架构 • 华为 Atlas 300I Pro、910b3 • 海光 DCU K100 该模型新版本(ETL4LM)支持GPU卡如下(正在验证更多卡的适配): • NVIDIA GPU:Ada Lovelace架构、Ampere架构、Turing架构 • 华为910b3 |
其他 | 如数据库、消息中间件、容器(docker)的国产替代等(支持适配,需要根据具体需要适配哪家厂商评估) |