功能 | 功能说明 |
流量控制功能 | 由于大语言模型对算力的消耗非常大,在一定算力资源下,系统所能支持的最优并发数是有限的,持续增加并发会导致用户的请求拥堵进而造成卡顿,严重时可能导致模型服务异常。 流量控制功能可控制系统同时使用应用(技能或助手)进行会话的请求数量,除支持限制全局流量外,还支持按用户组或按应用分别进行控制。 详细介绍:流量控制 |
SSO/LDAP 登录 | 支持对接企业内用户体系,通过SSO/LDAP方式登录到BISHENG系统。 详细介绍:SSO/LDAP 登录 |
内容安全审查 | 支持针对每个应用(技能或助手)单独设置安全审查,支持基于预置词表与自定义词表两种方式,在打开审查状态下仍支持流式输出(打字机效果)。 详细介绍:内容安全审查 |
ETL4LM闭源文档解析模型正式商业授权 | 包含以下模型: • 高精度印刷体文字检测与识别 • 高精度手写体文字检测与识别 • 高精度表格识别(有线、少线、无线、异形表) • 版式识别(标题、段落、页眉页脚、图片、附注等) • 多栏版式识别 • 公式识别 这个部分我们给大家提供了免费使用的license,购买【商业扩展套件】后将提供正式商业license授权,提供维保服务、无算力数量限制 详细介绍:ETL4LLM |
统计看板 | 通过直观的图表展示平台使用情况、应用价值、用户体验和成本投入,助力企业进行管理决策、资源配置优化与治理。 |
纯国产化适配(服务) | 国产结构化数据库、国产消息中间件、国产对象存储适配 |
Java框架 | BISHENG商业扩展套件使用Java开发(BISHENG开源平台基于Python),拥有与企业内已有其他系统(大多使用Java)更好的对接能力。 |
系统安全(服务) | 配合解决安全漏洞扫描出现的问题 |
高可用部署方案(服务) | 根据企业内环境情况,提供定制化的高可用部署方案,保障系统生产级高可用。 |
监控-开发中 | 资源监控:CPU、GPU、内存 接口监控:调用次数、成功率、并发数、QPS、Latency、Time to First Token |
通用场景能力优化-规划中 | 如RAG、报告生成、智能看板、定时任务等通用场景应用能力的优化工作 文档解析模型效果与能力进一步增强 |
资产沉淀与挖掘-规划中 | 自动分析平台已有应用配置信息与应用使用信息,在用户新建应用或与应用交互时,自动推荐优质应用模板与优质用法。 |