为翻译软件提供云端语料库支持,Tmxmall 瞄准了语言领域的大数据

简介:

当个人用户习惯了使用有道、谷歌等翻译工具满足日常的语言转化需求时,企业级的 “语言资产与管理” 却依旧是一个亟待关注的朝阳产业。由于企业级用户对翻译资料的需求大、垂直性专业要求高,一般都会将翻译业务外包给翻译公司去做,或者借助一些计算机辅助翻译软件(CAT)完成翻译,比如市面上惯用的企业服务翻译软件SDL trados、Memoq、译马网等。

而现在,一家名为上海一者信息科技的公司打算追溯到翻译语言的上游,其旗下推出的云端翻译记忆库 Tmxmall 能够将其中流通的语言信息通过云平台的方式重新集结、利用,现面向 CAT 厂商等 B 端用户主要推出的业务有:

语料交换:提供包含 3000 万中英比照的句型翻译记忆库检索与共享平台,用户(企业、翻译公司)可以在公有云中上传更多翻译内容,以换取积分使用更多翻译资源。

私有云:支持存储海量翻译记忆库,构建企业级用户私有语料库搜索引擎,帮助译者高效利用自己的记忆库,降低记忆库管理成本和利用成本,同时保护企业自身数据隐私。

在线对齐工具:在进行语料回收工作后,Tmxmall 推出的智能在线对齐工具可以将原本杂乱的中英对照文章按照句式进行翻译文本的归类,方便后来的使用者进行调取查找。

翻译交易平台:除了进行机器配对比照的翻译工作, Tmxmall 上还提供人工翻译员的匹配,以及翻译文本的众包编辑,而当平台上的语料资源越加充足之后,一部分稀缺的垂直领域翻译资源可以在交易平台 “语料商城” 中进行发布、检索、购买。

Tmxmall 目前通过企业私有云的搭建,以及语料商城中收取服务费来实现营收,目前平台上日均 API 查询已达十万次,语料商城中拥有 20000 余名兼职翻译员,并为 50 余家翻译公司提供了私有云解决方案,同时与北京语言大学等高校合作了语料管理系统。

不过,Tmxmall 目前还只提供语料库的相关解决方案,而具体的翻译动作还是需要与之合作的 CAT 软件进行,目前已接入 SDL Trados、memoQ、VisualTran、transmate 和译马网等主流 CAT。公司创始人兼 CEO 张井告诉 36 氪:“市面上 CAT 软件已经很多,我们再做已没有优势,而通过不断升级语料库的技术和数据,才能够形成相应的竞争壁垒。”

融资方面,目前 Tmxmall 已获得来自北京云识图信息技术有限公司的 200 万天使轮融资;团队方面, Tmxmall 共有员工 12 人,公司创始人兼 CEO 张井之前曾就职于百度钱包;CTO 陈件曾就职于华为、百度担任资深互联网架构师。

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
SQL 关系型数据库 MySQL
【大数据系列之MySQL】(三十):MySQL中的DDL语言
【大数据系列之MySQL】(三十):MySQL中的DDL语言
95 0
|
SQL 关系型数据库 MySQL
【大数据系列之MySQL】(二十九):MySQL中的DML语言
【大数据系列之MySQL】(二十九):MySQL中的DML语言
78 0
|
分布式计算 JavaScript 前端开发
Scala学习系列(一)——Scala为什么是大数据第一高薪语言
Scala学习系列(一)——Scala为什么是大数据第一高薪语言
403 0
Scala学习系列(一)——Scala为什么是大数据第一高薪语言
|
存储 Kubernetes Cloud Native
Vineyard 加入 CNCF Sandbox,将继续瞄准云原生大数据分析领域
Vineyard 是一个专为云原生环境下大数据分析场景中端到端工作流提供内存数据共享的分布式引擎,我们很高兴宣布 Vineyard 在 2021 年 4 月 27 日被云原生基金会(CNCF)TOC 接受为沙箱(Sandbox)项目。
Vineyard 加入 CNCF Sandbox,将继续瞄准云原生大数据分析领域
|
数据采集 大数据 数据挖掘
大数据正在改变人们学习新语言的方式
大数据的应用正在发生变化,并且可能会改变人们学习新语言的方式。事实上,语言是人们所寻求的信息中最复杂却又最受追捧的一种。因为沟通和交流是如此重要,以至于人们积极尝试采用不同的方法来学习一门新语言。而利用大数据访问和处理大量信息的能力,语言可以变得更加易于学习和掌握。
|
SQL 算法 Java
你在使用大数据技术的时候,你知道大数据语言的工具与框架吗?
为了解大数据的当前和未来状态,我们采访了来自28个组织的31位IT技术主管。我们问他们,“你在数据提取,分析和报告中使用的最流行的语言,工具和框架是什么?” 以下的文章是他们告诉我们的记录,经过总结如下。
1999 0
|
存储 大数据 测试技术
瞄准大数据 长虹佳华的云计算
本文讲的是瞄准大数据 长虹佳华的云计算,除了上帝,任何人都必须用数据来说话。   如果说云计算为数据资产提供了保管、访问的场所和渠道,那么如何盘活数据资产,使其为国家治理、企业决策乃至个人生活服务,则是大数据的核心议题,也是云计算内在的灵魂和必然的升级方向。
1508 0

热门文章

最新文章