开发者社区> 问答> 正文

spark将分析好的数据插入mysql,怎么判断重复

spark将分析好的数据插入mysql,怎么判断重复

展开
收起
hbase小能手 2019-05-28 16:01:29 4808 0
2 条回答
写回答
取消 提交回答
  • 建议直接在mysql数据表中增加unique key约束,由数据库端做数据去重

    2020-03-19 20:00:27
    赞同 展开评论 打赏
  • HBase是一个分布式的、面向列的开源数据库,一个结构化数据的分布式存储系统。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。阿里云HBase技术团队共同探讨HBase及其生态的问题。

    你是说 存在更新不存在 插入?那你得foreachpartition自己写mysql 。 update into on deplicate key这种方式写 官方没有 这种更新的方式写的

    2019-07-17 23:36:12
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载

相关镜像