笨办法学 Python · 续练习 23：三叉搜索树

2017-08-10 1060

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 练习 23：三叉搜索树原文：Exercise 23: Ternary Search Trees 译者：飞龙协议：CC BY-NC-SA 4.0 自豪地采用谷歌翻译我们将研究的最后一个数据结构称为三叉搜索树（TSTree），它可以在一组字符串中快速查找字符串。

练习 23：三叉搜索树

原文：Exercise 23: Ternary Search Trees

译者：飞龙

协议：CC BY-NC-SA 4.0

自豪地采用谷歌翻译

我们将研究的最后一个数据结构称为三叉搜索树（TSTree），它可以在一组字符串中快速查找字符串。它类似于BSTree，但是它有三个子节点，而不是两个，每个子节点只是一个字符而不是整个字符串。在BSTree中，左子节点和右子节点是树的“小于”和“大于”的分支。在TSTree中，左子节点，中子节点和右子节点是“小于”，“等于”和“大于”的分支。这可以让你选取一个字符串，将其分解成字符，然后遍历TSTree，每次一个字符，直到找到它或者你到达了末尾。

通过将你要搜索的一组键拆成单个字符的节点，TSTree高效地使用空间换取时间。每一个这些节点将占用比BSTree更多的空间，但这允许你仅仅通过比较键中的字符来搜索键。使用BSTree，你必须比较每个节点的键和被搜索键中的大多数字符。使用TSTree，你只需要比较被搜索键的每个字母，当你到达末尾，就完成了。

TSTree的另一件不错的事情是，它知道一个键何时不存在于集合中。想象一下，你的键的长度为 10 个字符，你需要在一组其他的键中找到它，但是如果键不存在，则需要快速停止。使用TSTree，你可以在一到两个字符的地方停止，到达树的末尾，并且知道这个键不存在。你最多只能比较键中的 10 个字符来发现它，字符比较比BSTree少得多。

挑战练习

这个练习中，你打算完成另一个“代码大师复制”的一部分，之后独立完成TSTree。你所需的代码是：

class TSTreeNode(object):

    def __init__(self, key, value, low, eq, high):
        self.key = key
        self.low = low
        self.eq = eq
        self.high = high
        self.value = value


class TSTree(object):

    def __init__(self):
        self.root = None

    def _get(self, node, keys):
        key = keys[0]
        if key < node.key:
            return self._get(node.low, keys)
        elif key == node.key:
            if len(keys) > 1:
                return self._get(node.eq, keys[1:])
            else:
                return node.value
        else:
            return self._get(node.high, keys)

    def get(self, key):
        keys = [x for x in key]
        return self._get(self.root, keys)

    def _set(self, node, keys, value):
        next_key = keys[0]

        if not node:
            # what happens if you add the value here?
            node = TSTreeNode(next_key, None, None, None, None)

        if next_key < node.key:
            node.low = self._set(node.low, keys, value)
        elif next_key == node.key:
            if len(keys) > 1:
                node.eq = self._set(node.eq, keys[1:], value)
            else:
                # what happens if you DO NOT add the value here?
                node.value = value
        else:
            node.high = self._set(node.high, keys, value)

        return node

    def set(self, key, value):
        keys = [x for x in key]
        self.root = self._set(self.root, keys, value)

你需要使用你学到的“代码大师复制”方法学习。要特别注意如何处理node.eq路径以及如何设置node.value。一旦你了解了get和set的工作方式，你将实现剩下的函数和所有的测试。要实现的函数有：

find_shortest

给定一个关键字K，找到以K开头的最短键/值对。这意味着如果你的set中有apple和application ，那么调用find_shortest("appl")将返回关联apple的值。

find_longest

给定一个关键字K，找到以K开头的最长键/值对。这意味着如果你的set中有apple和application ，那么调用find_shortest("appl")将返回关联application的值。

find_all

给定一个关键字K，找到以K开头的所有键/值对。我会先实现它，然后基于它实现find_shortest和find_longest。

find_part

给定一个关键字K，找到最短的键，它拥有K的开头的一部分。研究如何以及在哪里设置node.value来使其生效。

研究性学习

查看原始代码的注释，看看在_set过程中，在哪里放置value。修改它会修改get的含义吗？为什么？
确保你使用随机数据来测试，并测量一些性能。
你也可以在TSTree中进行模糊匹配。我认为这是一个附加题，所以尝试实现它们，看看你想出了什么。模糊匹配是，'a.p.e'匹配"apple"、"anpxe"和"ajpqe"。
如何搜索字符串的结尾？提示：不要过度考虑它。

笨办法学 Python · 续练习 23：三叉搜索树

练习 23：三叉搜索树

挑战练习

研究性学习

热门文章

最新文章

相关课程

相关电子书

相关实验场景

笨办法学 Python · 续 练习 23：三叉搜索树

练习 23：三叉搜索树

挑战练习

研究性学习

热门文章

最新文章

相关课程

相关电子书

相关实验场景

笨办法学 Python · 续练习 23：三叉搜索树