场景描述 本方案适用于使用GPU进行AI在线推理的场 景。在推理之前,模型已经训练完成。例如,刷脸 支付中,我们在刷脸的时候,就是推理的一个过 程。再比如图像分类,目标检测,语音识别,语 义分析等返回结果的过程。 解决问题 使用GPU云服务器搭建推理环境 使用容器服务Kubernetes版构建推理 环境 使用NAS存储模型数据 使用飞天AI加速推理工具加速推理 产品列表 GPU云服务器 容器服务Kubernetes版 NAS共享存储
Perseus Inference Client目前提供 python2和 python3的 wheel安装包,可以安装到 其他机器上。server端和 client端使用 HTTP/GRPC通信方式,client端代码示例参见下图中文件 image_client.py和 grpc_image_client.py。58 企业上云实践 基于弹性计算的 AI推理|部署飞天 AI加速推理工具的 demo 4.8.3.Perseus Inference的...