C#数据结构与算法揭秘六

简介:

这节我们讨论两种用的蛮多的数据结构——串和数组

首先,老样子,什么是串,这里串不是吃的牛肉串,羊肉串,而是字符串。在应用程序中使用最频繁的类型是字符串。字符串简称串,是一种特殊的线性表,其特殊性在于串中的数据元素是一个个的字符。字符串在计算机的许多方面应用很广。如在汇编和高级语言的编译程序中,源程序和目标程序都是字符串数据。在事务处理程序中,顾客的信息如姓名、地址等及货物的名称、产地和规格等,都被作为字符串来处理。另外,字符串还具有自身的一些特性。因此,把字符串作为一种数据结构来研究。具体情况,如图所示,顾客信息处理的字符串。

 

串有哪些基本的概念了, 串(String)由 n(n≥0)字符组成的有限序列。一般记为: S=”c1c2…cn” (n≥0) 其中,S是串名,双引号作为串的定界符,用双引号引起来的字符序列是串

值。ci(1≤i≤n)可以是字母、数字或其它字符,n为串的长度,当n=0 时,称为空串(Empty String)。 串中任意个连续的字符组成的子序列称为该串的子串(Substring)。包含子串的串相应地称为主串。子串的第一个字符在主串中的位置叫子串的位置。如串s1”abcdefg”,它的长度是 7,串s2”cdef”的长度是 4,s2是s1的子串,s2的位置是 3。
如果两个串的长度相等并且对应位置的字符都相等,则称这两个串相等。而在 C#中,比较两个串是否相等还要看串的语言文化等信息。所谓语言文化,是指中文的字符串和中文字符串进行了比较,英文字符串与英文字符串进行了比较。父串子串的示意图:

串是如何存储及类定义的了,由于串中的字符都是连续存储的,而在 C#中串具有恒定不变的特性,即字符串一经创建,就不能将其变长、变短或者改变其中任何的字符。相应的示意图如下所示:

 

 

所以,这里不讨论串的链式存储,也不用接口来表示串的操作。同样,把串看作是一个类,类名为 StringDS。取名为 StringDS 是为了和 C#自身的字符串类 String 相区别。类
StringDS 只有一个字段, 即存放串中字符序列的数组 data。 由于串的运算有很多,在类 StringDS 中只包含部分基本的运算增加,清空,球长度等等操作。给串类 StringDS 的 源代码实现如下所示:

public class StringDS
{
private char[] data; //字符数组

//索引器
public char this[int index]
{
get
{
return data[index];
}
}

//构造器
public StringDS(char[] arr)
{

data = new char[arr.Length];
for(int i = 0; i < arr.Length; ++i)
{
data[i] = arr[i];
}
}

//构造器
public StringDS(StringDS s)
{
for(int i = 0; i < arr.Length; ++i)
{
data[i] = s[i];
}
}

//构造器
public StringDS(int len)
{
char[] arr = new char[len];
data = arr;
}

//求串长
public int GetLength()
{
return data.Length;
}

求串的长度就是求串中字符的个数,可以通过求数组 data 的长度来求串的长度。算法的时间复杂度是O(1),具体情况,如图所示:

 


//串比较
public int Compare(StringDS s)
{
int len=((this.GetLength()<=s.GetLength())?
this.GetLength():s.GetLength());
int i = 0;
for (i = 0; i < len; ++i)
{
if (this[i] != s[i])
{
break;
}
}

if (i <= len)

{
if (this[i] < s[i])
{
return -1;
}
else if (this[i] > s[i])
{
return 1;
}
}
else if(this.GetLength() == s.GetLength())
{
return 0;
}
else if (this.GetLength() < s.GetLength())
{
return -1;
}

return 1;
}

如果两个串的长度相等并且对应位置的字符相同,则串相等,返回 0;如果串 s 对应位置的字符大于该串的字符或者如果串 s 的长度大于该串, 而在该串的长度返回内二者对应位置的字符相同,则返回-1,该串小于串 s;其余情况返回1,该串大于串 s。该算法的时间复杂度是O(n)  涉及到字符串数组的遍历。具体伪代码,如图所示:


//求子串
public StringDS SubString(int index, int len) 
{
if ((index<0) || (index>this.GetLength()–1)
|| (len<0) || (len>this.GetLength()–index))
{
Console.WriteLine("Position or Length is error!");
return null;
}

StringDS s = new StringDS(len);

for (int i = 0; i < len; ++i)
{
s[i] = this[i + index-1];
}

return s;
}

{
StringDS s1 = new StringDS(this.GetLength() +
s.GetLength());

for(int i = 0; i < this.GetLength(); ++i)
{
s1.data[i] = this[i];
}

for(int j = 0; j < s.GetLength(); ++j)
{
s1.data[this.GetLength() + j] = s[j];
}

return s1;
}

从主串的index位置起找长度为len的子串,若找到,返回该子串,否则,返回一个空串。涉及字符串的遍历,所以时间复杂度是O(n)  相应图如图所示:


//串插入
public StringDS Insert(int index, StringDS s)
{
int len = s.GetLength();
int len2 = len + this.GetLength();
StringDS s1 = new StringDS(len2);

if (index < 0 || index > this.GetLength() - 1)
{
Console.WriteLine("Position is error!");
return null;
}

for (int i = 0; i < index; ++i)
{
s1[i] = this[i];
}

for(int i = index; i < index + len ; ++i)
{
s1[i] = s[i - index];
}

for (int i = index + len; i < len2; ++i)
{
s1[i] = this[i - len];

return s1;

串插入是在一个串的位置index处插入一个串s。如果位置符合条件,则该操作返回一个新串,新串的长度是该串的长度与串s的长度之和,新串的第1部分是该串的开始字符到第index之间的字符,第2部分是串s,第3部分是该串从index位置字符到该串的结束位置处的字符。如果位置不符合条件,则返回一个空串。时间复杂度是O(n),具体 操作如图所示:

//串删除
public StringDS Delete(int index, int len)
{
if ((index<0) || (index>this.GetLength()-1)
|| (len<0) || (len>this.GetLength()-index))
{
Console.WriteLine("Position or Length is error!");
return null;
}

StringDS s = new StringDS(this.GetLength() - len);

for (int i = 0; i < index; ++i)
{
s[i] = this[i];
}

for (int i = index + len; i < this.GetLength(); ++i)
{
s[i] = this[i];
}

return s;
}

串删除是从把串的第index位置起连续的len个字符的子串从主串中删除掉。如果位置和长度符合条件,则该操作返回一个新串,新串的长度是原串的长度减去len,新串的前部分是原串的开始到第index个位置之间的字符,后部分是原串从第index+len位置到原串结束的字符。如果位置和长度不符合条件,则返回一个空串。相应的时间复杂度是O(n),相应情况,如图所示:

 

}

这就是我对串的理解,我们看看数组的理解。

什么是数组。所谓数组是数组是一种常用的数据结构,可以看作是线性表的推广。数组作为一种数据结构, 其特点是结构中的数据元素可以是具有某种结构的数据, 甚至可以是数组,但属于同一数据类型。数组在许多高级语言里面都被作为固定类型来使用。

数组是 n(n≥1)个相同数据类型的数据元素的有限序列。一维数组可以看作是一个线性表,二维数组可以看作是“数据元素是一维数组”的一维数组,三维数组可以看作是“数据元素是二维数组”的一维数组,依次类推。 图是一个 m 行 n 列的二维数组。

数组是一个具有固定格式和数量的数据有序集, 每一个数据元素通过唯一的下标来标识和访问。通常,一个数组一经定义,每一维的大小及上下界都不能改变。 所以, 在数组上不能进行插入、 删除数据元素等操作。 数组上的操作一般有: 

1、取值操作:给定一组下标,读其对应的数据元素;算法的复杂度是O(1) 

2、赋值操作:给定一组下储或修改与其对应的数据元素; 算法的复杂度是O(1)
3、清空操作:将数组中的所有数据元素清除; 算法的复杂度是O(1)
4、复制操作:将一个数组的数据元素赋给另外一个数组; 算法的复杂度是O(n)
5、排序操作:对数组中的数据元素进行排序,这要求数组中的数据元素是可排序的;希尔排序,冒泡排序等等,算法的复杂度是O(n²) 
6、反转操作:反转数组中数据元素的顺序。以前提过,请见了C#数据结构与算法揭秘一。

什么是数组的内存映象 ,

通常,采用顺序存储结构来存储数组中的数据元素,因为数组中的元素要求连续存放。本质上,计算机的内存是一个一维数组,内存地址就是数组的下标。所以,对于一维数组,可根据数组元素的下标得到它的存储地址,也可根据下标来访问一维数组中的元素。而对于多维数组,需要把多维的下标表达式转换成一维的下标表达式。当行列固定后,要用一组连续的存储单元存放数组中的元素,有一个次序约定问题, 这产生了两种存储方式: 一种是以行序为主序 (先行后列)的顺序存放,另一种是以列序为主序(先列后行)的顺序存放。下图给出了图中的二维数组的两种存放方式示意图。

下面按元素的下标求地址: 当以行序为主序进行存储时,设数组的基址是Loc(a11),每个数据元素占w个存储单元,则a11的物理地址可由下式计算: Loc(aij)= Loc(a11)+((i-1)*n+j-1)*w 这是因为数组元素aij的前面有i-1行, 每一行有n个数据元素, 在第i行中aij的前面还有j-1个元素。 如图所示


当以列序为主序进行存储时,则a11的物理地址可由下式计算: Loc(aij)= Loc(a11)+((j-1)*m+i-1)*w (4-2) 这是因为数组元素aij的前面有j-1列, 每一列有m个数据元素, 在第j列中aij的前面还有i-1个元素。 由以上的公式可知,数组元素的存储位置是其下标的线性函数,一旦确定了数组各维的长度,就可以计算任意一个元素的存储地址,并且时间相等。所以,存取数组中任意一个元素的时间也相等,因此,数组是一种随机存储结构。时间复杂度是O(n2).相应的情况,如图所示:

这就是我对数组的理解

目录
相关文章
|
1月前
|
开发框架 算法 搜索推荐
C# .NET面试系列九:常见的算法
#### 1. 求质数 ```c# // 判断一个数是否为质数的方法 public static bool IsPrime(int number) { if (number < 2) { return false; } for (int i = 2; i <= Math.Sqrt(number); i++) { if (number % i == 0) { return false; } } return true; } class Progr
58 1
|
4月前
|
搜索推荐 算法 C#
【Unity 3D】C#中冒泡排序、选择排序、插入排序等算法的详解(附源码 超详细)
【Unity 3D】C#中冒泡排序、选择排序、插入排序等算法的详解(附源码 超详细)
47 1
|
4月前
|
机器学习/深度学习 算法 C#
C# | 凸包算法之Andrew‘s,获取围绕一组点的凸多边形的轮廓点
这篇关于凸包算法的文章,本文使用C#和Andrew’s算法来实现凸包算法。 首先消除两个最基本的问题: 什么是凸包呢? 凸包是一个包围一组点的凸多边形。凸多边形是指多边形中的每个内角都小于180度的多边形。 凸包算法有什么用呢? 凸包算法的作用是找到这个凸多边形,并且使用最少的点来绘制出它的轮廓。凸包算法在计算机图形学、计算几何和机器学习等领域中有着广泛的应用。
57 0
|
1月前
|
搜索推荐 C#
C#实现选择排序算法
C#实现选择排序算法
17 2
|
1月前
|
搜索推荐 C#
C#实现冒泡排序算法
C#实现冒泡排序算法
19 0
|
3月前
|
算法 C#
C# .Net Core bytes转换为GB/MB/KB 算法
C# .Net Core bytes转换为GB/MB/KB 算法
41 0
|
4月前
|
存储 算法 数据处理
C# | 上位机开发新手指南(十一)压缩算法
流式压缩 流式压缩是一种能够实时处理数据流的压缩方式,例如音频、视频等实时传输的数据。 通过流式压缩算法,我们可以边读取边压缩数据,并能够随时输出已压缩的数据,以确保数据的实时性和减少存储和传输所需的带宽。 块压缩 块压缩则是将数据划分为固定大小的块,在每个块内进行独立的压缩处理。块压缩通常适用于文件、存储、传输等离线数据处理场景。 字典压缩 字典压缩是一种基于字典的压缩算法,通过建立一个字典来存储一组重复出现的字符串,并将这些字符串替换成字典中相应的索引,从而减少数据的存储和传输。字典压缩算法可以更好地处理数据中的重复模式,因为它们可以通过建立字典来存储和恢复重复出现的字符串。
46 0
C# | 上位机开发新手指南(十一)压缩算法
|
4月前
|
算法 C# 数据安全/隐私保护
C# | 上位机开发新手指南(十)加密算法——ECC
本篇文章我们将继续探讨另一种非对称加密算法——ECC。 严格的说,其实ECC并不是一种非对称加密算法,它是一种基于椭圆曲线的加密算法,广泛用于数字签名和密钥协商。 与传统的非对称加密算法(例如RSA)不同,ECC算法使用椭圆曲线上的点乘法来生成密钥对和进行加密操作,而不是使用大数分解等数学算法。这使得ECC算法具有相同的安全性和强度,但使用更少的位数,因此在资源受限的环境中具有优势。 ECC算法虽然使用公钥和私钥进行加密和解密操作,但是这些操作是基于点乘法实现的,而不是基于大数分解等算法实现的。因此,ECC算法可以被视为一种非对称加密算法的变体,但是它与传统的非对称加密算法有所不同。
135 0
C# | 上位机开发新手指南(十)加密算法——ECC
|
4月前
|
XML 算法 安全
C# | 上位机开发新手指南(九)加密算法——RSA
RSA的特性 非对称性 RSA算法使用公钥和私钥两个不同的密钥,公钥用于加密数据,私钥用于解密数据。公钥可以公开,任何人都可以使用,而私钥只有密钥持有人可以访问。 安全性 RSA算法基于大数分解难题,即将一个大的合数分解成其质数因子的乘积。由于目前没有有效的算法可以在合理的时间内对大质数进行分解,因此RSA算法被认为是一种安全的加密算法。 可逆性 RSA算法既可以用于加密,也可以用于解密。加密和解密都是可逆的过程,只要使用正确的密钥,就可以还原原始数据。 签名 RSA算法可以用于数字签名,用于验证数据的完整性和真实性。签名过程是将数据使用私钥进行加密,验证过程是将签名使用公钥进行解密。
102 0
C# | 上位机开发新手指南(九)加密算法——RSA
|
4月前
|
算法 搜索推荐 安全
C# | 上位机开发新手指南(八)加密算法——AES
AES——这是在加密算法中相当重要的一种加密方式! 虽然这个世界上已经存在了非对称加密算法(比如RSA、ECC等),但是在对称加密算法中,AES的地位依然相当重要。与非对称加密算法不同,对称加密算法使用的是相同的密钥对数据进行加密和解密,因此其加密和解密速度更快,而且更加高效。而在对称加密算法中,AES是目前最安全、最可靠的加密算法之一,其加密强度和运行效率都非常高。因此,无论是在个人计算机、移动设备,还是在服务器和云计算等领域,AES都被广泛应用于数据的加密和解密过程中。
95 0
C# | 上位机开发新手指南(八)加密算法——AES