推理服务平台主要用于部署和管理人工智能模型,提供高效的推理服务。也叫做大模型推理框架、AI推理平台。
可以使用任何开源 LLM、嵌入模型和多模态模型在云端或本地环境中运行推理,提供大模型API服务,基于大模型API可以开发强大的 AI 应用。
推理服务平台集成众多主流大模型,满足多样业务需求。支持灵活部署,不管是私有模型上传,还是选择公共、自定义镜像部署,均可实现。
其在线推理服务性能卓越,能提供实例全生命周期管理,灵活扩容缩容。同时设有推理资源组,公共组按需计费,专属组依选配定价,搭配多种 GPU 资源,平衡效能与成本,助力快速构建、应用 AI 能力,加速业务创新 。