索引

#索引#

已有2人关注此标签

内容分类

小白dora

咨询一个入门问题

咨询一个入门问题关于主键哪种好1.非业务主键,如int自增主键2.业务主键,如商品档案表的"货号" 货品资料偶尔也可能会批量修改 我看了网上的资料说B树索引,如果是自增整数,那么insert时特别快,不用挪动顺序 但是,零售端输入一个货号来开单,或者盘点,需要快速在基础资料查询信息,那么,货号,应该也要建立索引,那么货号建立索引 那么这里想了解一下现在新增一个资料是不是int自增主键就会在最后加索引,而货号索引还是得自己去找适合自己的位置,之前货号索引该挪的还是得挪位置那么问题来了,自增好像没有什么用了?我的理解对吗?我是刚接触这些,有哪位朋友给指导一下 我的理解是,新增一个货号,如果有多个索引,所有索引都要维护一遍那么,货号总之都是要建立索引,直接用它作为主键,那自增索引好像就没有什么用了,不知道我的理解对不对,或者说这个自增主键还有其他特别好的用处,是货号这个主键无法替代的 本问题来自云栖社区【PostgreSQL技术进阶社群】。https://yq.aliyun.com/articles/690084 点击链接欢迎加入社区大社群。

小白dora

一张表数据60w select一下要十几秒 特别慢,explain看row也没有索引膨胀的样子,真空分析都没有用,求指导

一张表数据60w select一下要十几秒 特别慢,explain看row也没有索引膨胀的样子,真空分析都没有用,求指导 本问题来自云栖社区【PostgreSQL技术进阶社群】。https://yq.aliyun.com/articles/690084 点击链接欢迎加入社区大社群。

小白dora

btree索引增长好快啊,10亿的数据表,一个索引都72G了,20G的内存,一个count(*)等了20分钟。

btree索引增长好快啊,10亿的数据表,一个索引都72G了,20G的内存,一个count(*)等了20分钟。本问题来自云栖社区【PostgreSQL技术进阶社群】。https://yq.aliyun.com/articles/690084 点击链接欢迎加入社区大社群。

李博bluemind

连接MongoDB,查询地理位置的问题

com.mongodb.MongoException: can't find any special indices: 2d (needs index), 2dsphere (needs index), for: { position: { $nearSphere: [ 120.344944, 36.067463 ] } }at com.mongodb.QueryResultIterator.throwOnQueryFailure(QueryResultIterator.java:214)at com.mongodb.QueryResultIterator.init(QueryResultIterator.java:198)at com.mongodb.QueryResultIterator.initFromQueryResponse(QueryResultIterator.java:176)at com.mongodb.QueryResultIterator.(QueryResultIterator.java:64)at com.mongodb.DBCollectionImpl.find(DBCollectionImpl.java:86)at com.mongodb.DBCollectionImpl.find(DBCollectionImpl.java:66)at com.mongodb.DBCursor._check(DBCursor.java:458)at com.mongodb.DBCursor._hasNext(DBCursor.java:546)at com.mongodb.DBCursor.hasNext(DBCursor.java:571) 我已经利用db.PostCo.createIndex( { location : "2dsphere" } )db.PostCo.createIndex( { location : "2d" } )创建相应的索引。还是无法正常工作。 本问题及下方已被采纳的回答均来自云栖社区【Redis&MongoDB 社区大群】。https://yq.aliyun.com/articles/690084 点击链接欢迎加入社区大社群。

小白dora

我想请教一个问题,如下

一.报错:postgresql ERROR: index row size exceeds maximum for index二.分析:这种情况通常是使用btree索引时超过三分之一索引页大小。可能会建议创建hash index代替btree,但实际情况是不短时间内批量执行则不会报错。三.疑惑: 请问该报错可能是短时间频繁操作导致的吗?索引页的判断原理是?

王爽wasugar

Phoenix对带有索引表使用duplicate key写入数据报错

phoenix使用duplicate key写入数据,对已有key数据更新其中某些列。但是该表带有global 索引,写入报错:“The ON DUPLICATE KEY clause may not be used when a tab。”

我叫石头

在给pg表建立索引的时候会报以下错误 ERROR: MultiXactId 795570799 has not been created yet -- apparent wraparound

在给pg表建立索引的时候会报以下错误ERROR: MultiXactId 795570799 has not been created yet -- apparent wraparound

李博bluemind

怎么验证 mysql 的索引是否满足需求?

怎么验证 mysql 的索引是否满足需求?

terry.zhouh

什么?有几十种数据库类型~!数据存储管理怎么选,阿里自研NoSQL数据库与你聊一聊

你的业务数据如何存储管理? 大家对此最直观的理解可能会想非结构化数据如视频、图片等放在NAS,对象存储,块存储中,结构化的数据如用户信息、订单信息放在数据库如MySQL中。但随互联网业务的发展,现有数据类型的丰富程度远超过大家的想象,比如: 关系数据(ERP、CRM、电商、金融) 用户行为数据(推荐、风控) 日志数据(运维) 时序数据(监控、大盘、报表) 轨迹数据(快递包裹) 溯源数据(药品监管码) 消息数据(即时通讯、Feeds流)... ... 尤其是后者——各类半结构化与非结构化的数据,由于业务场景的需求对于存储模型提出了更多更丰富的要求。 在1998年传统的关系型数据库发展30年后,出于对PB级别海量数据存储、低延时、低成本的业务需求,“NoSQL”依赖分布式系统架构,在功能上做出一定取舍后,带着互联网时代的使命诞生。 从最早的“Bigtable”,到后来的Dynamodb、HBase、Cassandra、Redis、MongoDB、Janus Graph等,发展出了不同类型,适用于不同场景的多种NoSQL数据库,每一种NoSQL数据库都有各自适合的场景,不管是适应于何种场景,这批相继前后诞生的“NoSQL 兄妹”都在快速成长。 在阿里云在成立之初就投入资源研发,经过9年的打磨和多轮迭代演变成了今天的阿里云表格存储TableStore,迎来全新升级。为大家的在线业务数据的存储提供了更优的体验与选择,发布支持:• 更加灵活功能强大的查询能力,支持多元索引与二级索引• 数据实时消费通道,无缝与业务应用,流式技术、大数据分析平台打通。 表格存储全新升级发布会 3月6日 15:00--16:00 :https://yq.aliyun.com/live/872 这里大家互相探讨下各种业务场景中数据存储技术选型与问题: 1.当前你数据存储主要是什么场景,在数据管理中面临了哪些挑战?2.是否在特定场景中,已经选择使用了NoSQL数据库?3.你期望当前使用的NoSQL产品具备哪些额外的能力? 比如:数据规模问题,服务高可用,需要高并发低延迟读写,需要海量数据多维查询和检索,需要交互式分析

我叫石头

我叫石头

高并发写入场景 ,gin索引导致iowait过高 strace了一下update的pid

r比w都高为什么gin索引会有这个问题啊 如果把这个gin索引drop了 从iotop上看 r=0 w只在10-20m区间

python小能手

在数据框中查找值并在相应列中交叉引用值

我有一个数据框如下: Index X_1 X_2 X_3 W_1 W_2 W_31 IEZ XOP ABC 0.42 0.18 0.402 PXJ ABC XES 0.47 0.12 0.413 ABC RYE PXE 0.23 0.33 0.444 XOP IEZ ABC 0.62 0.20 0.18我想通过列X_1到X_3之间的每个“ABC”实例的每个索引行。对于每个实例,我想从列W_1到W_3中提取相应的值并将其附加到新列W. 例如,对于索引行1,如果ABC的实例出现在X_3中,它将从W_3中提取相应的值。 最终产品应如下所示。 Index X_1 X_2 X_3 W_1 W_2 W_3 W1 IEZ XOP ABC 0.42 0.18 0.40 0.402 PXJ ABC XES 0.47 0.12 0.41 0.123 ABC RYE PXE 0.23 0.33 0.44 0.234 XOP IEZ ABC 0.62 0.20 0.18 0.18我怎么能只导入numpy和pandas模块呢?

python小能手

检查pandas dataframe中是否存在值

我有一个pandas数据帧,它包含3000个纬度经度值。我想检查数据帧中是否存在lat-long。 数据框如下所示: lat long31.76 77.8431.77 77.8431.78 77.8432.76 77.85现在,我想检查上述数据帧中是否存在(31.76,77.84)。如果是,那么索引也是。

python小能手

如何在python中具有不同项目数的列之间找到相同的索引?

我有两个日期时间列: col1 = [2019-01-01 03:00:00, 2019-01-01 03:01:00, 2019-01-01 03:02:00] col2 = [2019-01-01 02:59:00, 2019-01-01 03:00:00, 2019-01-01 03:01:00, 2019-01-01 03:02:00, 2019-01-01 03:03:00] 每个都具有[0,1,2]和[0,1,2,3,4]的索引。 所以,我想得到的是[1,2,3],它是col2的索引(与col1重叠的元素)。 以下是我的代码,它不起作用: ind = []for x in range(len(col1)): rw = np.where(col2 == col1[x]) ind.append(int(rw[0])) 有没有简单的方法来解决这个问题?

python小能手

如何用广播计算多维数组?

我通过双for循环计算元素如下。 N,l=20,10a=np.random.rand(N,l)b=np.random.rand(N,l)r=np.zeros((N,N,l)) for i in range(N): for j in range(N): r[i,j]=a[i]*a[j]*(b[i]-b[j])-a[i]/a[j] 题: 如何对阵列进行矢量化并通过广播进行计算? 我还想设置索引i不等于j,这意味着将对角元素保留为零。我也可以通过矢量化来做到这一点吗?

python小能手

pandas- 在非唯一日期合并两个df(外部联接)

我有两个df,我想以一种不同寻常的方式结合起来。 有问题的df: df1:Index colA 2012-01-02 12012-01-05 22012-01-10 32012-01-10 4然后是df2: Index colB2012-01-01 62012-01-05 72012-01-08 82012-01-10 9输出: Index colA colB2012-01-01 NaN 62012-01-02 1 NaN2012-01-05 2 72012-01-08 NaN 82012-01-10 3 92012-01-10 4 NaN如果df之间没有匹配的日期,很高兴有NaN输出。如果有匹配的日期,我想返回两列。可能存在单个日期具有例如的实例。df1中的20行和df2中的15行..它将匹配前15个(不关心排序),然后返回dn2中最后5行的NaN。当我pd.merge()和其他人一起尝试这样做时,我不能这样做,因为日期对于索引来说显然不是唯一的。 有任何建议如何获得预期的行为?

李博bluemind

求教个mongodb的查询优化问题,这是查询条件: .find({ "tenantId" : "qiqiao001" , "name" : { "$regex" : "^.*我的应用22.*$" , "$options" : "i"}}).sort({"updateTime":-1}); 我需要模糊查询name,使用时间倒序查询,数据集合有100w,时间字段updateTime我已经加了索引,数据库直接查询时间需要1.5s以上,求优化一下查询, 单独使用模糊查询或时间排序查询都很快,两个结合在一起就需要1

求教个mongodb的查询优化问题,这是查询条件:.find({ "tenantId" : "qiqiao001" , "name" : { "$regex" : "^.我的应用22.$" , "$options" : "i"}}).sort({"updateTime":-1});我需要模糊查询name,使用时间倒序查询,数据集合有100w,时间字段updateTime我已经加了索引,数据库直接查询时间需要1.5s以上,求优化一下查询,单独使用模糊查询或时间排序查询都很快,两个结合在一起就需要1.53s以上单独查询都只需要二十几毫秒