开发者社区> 问答> 正文

为什么用阿里云深度学习的速度比本地还要慢很多,可是看显卡很nice啊

我在用阿里云的深度学习,可是速度好慢啊。我看了mnist和那个图片分类的示例代码,里面都没有对GPU进行调节的代码。
我想问一下,如果想用阿里云跑深度学习,在代码需要添加对GPU的支持嘛,看示例代码并没有啊。

展开
收起
bupt_chen 2017-04-27 15:40:38 4866 0
2 条回答
写回答
取消 提交回答
  • 你好,我用阿里云提供的mnist例子跑出错里:能帮忙看看吗?
    [1] train: running
    [1] train: 2017-06-07 09:51:33 TensorflowTask_job:0/0/0[0%]
    [1] train: 2017-06-07 09:51:39 TensorflowTask_job:1/0/1[0%]
    [1] train: 2017-06-07 09:51:44 TensorflowTask_job:1/0/1[0%]
    [1] train: 2017-06-07 09:51:50 TensorflowTask_job:1/0/1[0%]
    [1] train: 2017-06-07 09:51:55 TensorflowTask_job:1/0/1[0%]
    [1] train: 2017-06-07 09:52:01 TensorflowTask_job:1/0/1[0%]
    [1] train: 2017-06-07 09:52:06 TensorflowTask_job:1/0/1[0%]
    [1] train: 2017-06-07 09:52:12 TensorflowTask_job:1/0/1[0%]
    [1] train: 2017-06-07 09:52:18 TensorflowTask_job:0/0/1[0%]
    [1] Instance 20170607015100564gsni5bjc2 Failed.
    [1] FAILED: Failed 20170607095123b5fb224f_5990_434d_93da_6ffe877ab4f7:ODPS-1202005:Algo Job Failed-System Error-job runs failed:1. Please see the details in logview.
    DMS logs: Please try the following steps:1. Read the error messages carefully to see if you can understand it;2. try to rerun the job first;3. Check the F&Q ( https://help.aliyun.com/document_detail/30352.html );
    [1] Execute Odpscmd Failed!
    [1] [2017-06-07 09:52:29] ERROR: run subjob: #1[odpscmd] failed!

    2019-07-17 21:06:46
    赞同 展开评论 打赏
  • 著有《机器学习实践应用》,阿里云机器学习PAI产品经理,个人微信公众号“凡人机器学习”。

    嗨,我也是bupt的哈。这个问题我觉得是这样,阿里云机器学习PAI的作业默认是用GPU执行的,当然可以在代码中通过类似with device这样的接口进行分片处理,另外请问下你的OSS数据是在华东2区么。

    2019-07-17 21:06:45
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
阿里云云原生 Serverless 技术实践营 PPT 演讲 立即下载
阿里云产品十月刊 立即下载
基于阿里云构建博学谷平台实时湖仓 立即下载