开发者社区> 问答> 正文

如何使用DataX将表格存储内的Binary类型数据导入到ODPS?

已解决

表格存储内部分字段是binary类型,而ODPS不支持binary类型,只支持String。

在将表格存储内binary类型数据导入到ODPS的String字段之后,再读出来,发现数据不对,有丢失。

我应该怎么把binary类型数据导入到ODPS?

展开
收起
木洛 2016-11-28 21:25:05 5510 0
1 条回答
写回答
取消 提交回答
  • 表格存储(TableStore)技术负责人,专注结构化数据存储领域技术和解决方案。
    采纳回答

    数据『丢失』的原因见该文章的分析:https://yq.aliyun.com/articles/65035

    解决方案是需要更改DataX内部bytes到String转换的编码,需要更改Job的配置文件,添加如下配置:
    sss

    同时,在从ODPS内读出String类型字段后,需要使用iso-8859-1编码来转换回bytes:
    value.getBytes("iso-8859-1");

    2019-07-17 20:29:48
    赞同 2 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载