自然语言处理

#自然语言处理#

已有12人关注此标签

内容分类

dlieng

人脸大数据系统发展的趋势是什么?

  随着机器视觉技术及其相关技术的不断提升,无论是图像结构化的算法还是算力均在进步,虽然算法的进步已有限。而人工智能技术的螺旋上升极有可能会将技术热点从图像识别带入到机器人、语言识别、自然语言处理和专家系统这四个大领域中,因此未来人脸大数据系统的发展将主要呈现以下三大趋势:  首先,人脸大数据系统将进一步凸显“大数据”的能力,一线厂商与二三级厂商在“人脸”领域的差距将进一步缩小,而对结构化数据的实时、高并发的处理,将成为下一个技术增长点。同时,作为2018年的延续,技术与实战的结合将进一步深化,更多的业务场景,更灵活的业务开发,更迅速的业务定制,更便携直观的业务呈现将会受到客户的欢迎。  其次,边缘计算设备与后端集群分析这两种业务模式的竞争会更加激烈,合作也会更加紧密。在谷歌、脸书等公司的推动下,以及国内厂商华为、海康等巨头的加入,嵌入式视觉系统的发展会显著提速,未来追踪嫌疑目标只需出动真正的“无人”机不是梦,具备自动识别自动锁定报警功能的无人飞行器完全可以在安防领域大展身手。同时,更强大的后端视觉处理集群将实现全城全域全员的布控,让案事件回顾变成一键直达,并推动公共安全业务从事后处理到事前介入。  第三,单一人脸数据业务的热度会有所降低,人脸识别技术与其他传感技术相融合将成为热点。与单传感器相比,多传感器技术在探测、跟踪和目标识别方面能够提高系统的可靠性和健壮性,增强数据的可信度,提高精度,增加系统的实时性。机器视觉系统易于向多传感器信息融合技术拓展,解决单一视觉系统的局限性。未来,通过人工智能方面利好的政策,安防、交通、金融、消费电子等都是机器视觉领域重点关注的应用行业方向。汇新云平台整合的是软件供需双方资源,提供从软件需求精准对接、合同签订、软件在线开发、软件在线交易的产业链服务平台。平台汇聚了软件行业各个领域的项目资源,服务商免费入驻,资质审核接单。

deathknight

自然语言处理怎么快速入门

没有计算机的基础,英语稍微好点,想学习自然语言的处理,对机器翻译比较感兴趣,有什么好的资源推荐

我是管理员

爬虫数据管理【问答合集】

目前互联网中网络爬虫的自然语言处理方向前景怎样?https://yq.aliyun.com/ask/195258artTemplate:arttemplate生成的页面可以爬虫可以爬到数据吗https://yq.aliyun.com/ask/226332爬虫如何自动读取更多按钮https://yq.aliyun.com/ask/177860能推荐一个爬虫+数据挖掘的成熟工具吗?https://yq.aliyun.com/ask/121576爬虫和数据挖掘的区别?https://yq.aliyun.com/ask/121522爬虫数据用什么数据库储存最合适?https://yq.aliyun.com/ask/121854scrapy-redis分布式爬虫启动为什么会等待https://yq.aliyun.com/ask/185071部署了CDN,但是爬虫抓取仍然超时。https://yq.aliyun.com/ask/119262怎样将爬虫正常访问我的主域名https://yq.aliyun.com/ask/66704python 爬虫报错 , 是什么原因呢?https://yq.aliyun.com/ask/126797python的爬虫采集,和php采集器意义一样么?什么区别?https://yq.aliyun.com/ask/65930站点百度爬虫联通率低,有没有解决办法?https://yq.aliyun.com/ask/63848PHP可以写网页爬虫吗 ?原理是什么?https://yq.aliyun.com/ask/29398用Java写网络爬虫有哪些比较好的开源项目?https://yq.aliyun.com/ask/7440防止网络爬虫进行数据抓取https://yq.aliyun.com/ask/20134阿里云上有什么机制或服务可以防御爬虫?https://yq.aliyun.com/ask/42194请问Android爬虫遇到了权限问题怎么办?https://yq.aliyun.com/ask/13993分布式爬虫框架的设计https://yq.aliyun.com/ask/50547如何解决爬虫网页异步https://yq.aliyun.com/ask/21247爬虫怎么保存已经访问过的urlhttps://yq.aliyun.com/ask/10745关于二层爬虫程序数据获取问题?https://yq.aliyun.com/ask/17634PHP爬虫在js对象里该如何获取https://yq.aliyun.com/ask/11199爬虫如何保存已访问过的url?https://yq.aliyun.com/ask/7874

hlznzhx

自然语言处理-中文分词技术相关需求有哪些?可以举例说明

收集下自然语言处理时算法技术方面的难点或需求,可以提需求也可以给数据~

hlznzhx

中文分词技术小白想了解什么?

如果你对中文分词一窍不通,但是又有兴趣,你想通过相关的文章了解哪些信息?

hlznzhx

中文分词处理有哪些痛点?

现在中文分词处理有哪些痛点?

北方的郎

阿里达摩院布局“中国芯”,“中国芯”要怎样走向世界?

4月19日,记者从阿里巴巴达摩院获悉,该机构正研发一款神经网络芯片——Ali-NPU,运用于图像视频分析、机器学习等AI推理计算。按照设计,这款芯片性能将是目前市面上主流CPU、GPU架构AI芯片的10倍,而制造成本和功耗仅为一半,性价比超过40倍。 此款芯片的研发,未来将会更好的实现AI智能在图像、视频识别、云计算等商业场景中的运用,提升运算效率、降低成本。 阿里达摩院研究员骄旸对澎湃新闻表示,CPU、GPU作为通用计算芯片,为处理线程逻辑和图形而设计,处理AI计算问题时功耗高,性价比低,在AI计算领域急需专用架构芯片解决上述问题。阿里巴巴自主研发的Ali-NPU,基于阿里机器智能技术实验室等团队在AI领域积累的大量算法模型优势,根据AI算法模型设计微结构以及指令集,以最小成本实现最大量的AI 模型算法运算。 未来,Ali-NPU的能力,不仅可以更好地满足视频、图像处理需求,还可以通过阿里云进行计算能力的输出,赋能各行各业。 “自研AI芯片”已成为阿里布局“中国芯”的战略组成部分,目前达摩院芯片研发团队,在美国、上海两地已达数十人,预计年底将达百人。此前,阿里已经投资了寒武纪、Barefoot Networks、深鉴、耐能(Kneron)、翱捷科技(ASR)、中天微等多家家芯片公司。 此举可能对国内企业核心技术自主研发产生引领效应。日前,美国商务部宣布,今后7年内,将禁止该国企业向中国电信设备制造商中兴通讯出售任何电子技术或通讯元件,引发了对中国通信产业核心技术“缺芯少魂”问题的讨论。 达摩院是阿里巴巴2017年11月宣布成立的研发机构,布局量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术、嵌入式系统等研发领域。马云曾表示未来将为该机构投入超过1000亿元。 那么问题来了:你是否看好Ali-NPU的未来?你觉得未来Ali-NPU都能应用在那些方面?如果有机会,你是否会使用Ali-NPU? 用的话,准备怎么用?你觉得我们企业和国家都可以采取哪些措施, 推进我国的芯片业发展,“中国芯”要怎样走向世界?

韩俊强

人工智能发展到今天起关键作用的是算法还是算力?

人工智能有三个支撑基础:算法、数据和算力。算法是核心, 数据用来训练算法,我们通常把这个过程叫“喂数据”,把数据叫“奶妈”。没有数据,再好的算法也很难进行有效升级。算法的迭代, 从技术层面的创新到思维方式的转变,意味着人工智能乃至社会生态的无限的可能; 目前的算力是基于GPU的计算效率。与传统CPU时代相比,GPU有了大幅提升,以前算一个东西需要2-3年,迭代效率太低,GPU出现之后,像亚马逊便开始提供硬件工厂,让大家通过租用方式去构建集群,节省了人力和硬件成本。算力提速,AI的产出就刺激很多商业领域进行革新,这些革新反过来又驱动数据和算法的持续提升。算法、数据、算力相互促进,它们所带来的红利现在来看还是不明显。但是算法的迭代给人工智能带来了无限可能; 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。现在人工智能如此火热,发展迅速,有人说算法的功劳大,也有人说算力的贡献多,那么机智如你对此怎么看呢?

zoezoezoe

自然语言处理中情感分析Check Authorization Fails, Date expire!

我使用JAVA调用情感分析API,报错,提示Check Authorization Fails, Date expire! 怎么办呢?

韩俊强

人工智能发展到今天起关键作用的是算法还是算力?

人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。现在人工智能如此火热,发展迅速,有人说算法的功劳大,也有人说算力的贡献多,那么机智如你对此怎么看呢?

北方的郎

现在AI的阅读理解做的都比人类好了,它能用在那些方面呢?

在斯坦福大学发起的SQuAD(Stanford Question Answering Dataset)评测中,阿里巴巴iDST-NLP团队的SLQA模型位列榜首。阿里巴巴机器阅读理解精确匹配为82.44%,人类精确匹配为82.30%。负责SQuAD挑战赛的负责人斯坦福大学 Pranav Rajpurkar在推特发文称,这是强势开局,2018年第一个模型(SLQA+)在精确匹配上超越了人类水平,下一个目标就是要在模糊匹配上超越人类现在领先的2.5分阿里巴巴 iDST NLP 团队于 1 月 5 日提交的 SLQA + 在 EM 值(Exact Match, 表示预测答案和真实答案完全匹配)上也获得了 82.440 的优秀成绩,F1 值(F1-score,评测模型的整体性能)则为 88.607。 SQuAD(Stanford Question Answering Dataset)是行业内公认的机器阅读理解领域的顶级水平测试,被誉为机器阅读理解领域的 ImageNet。SQuAD挑战赛的基本规则,是通过众包的方式构建一个包含10万个问题左右的大规模数据集,并给出来源于维基百科长度大约在几百个单词左右的文章。参赛者提交的AI模型在阅读完数据集中的一篇短文之后,回答若干个基于文章内容的问题,答案与标准答案进行比对,最终得出成绩。由于阅读理解这项“智能”调整,需要运用到大量逻辑、细节和结构分析能力,并且直接作用于现实中的文本资料,所以实际价值很大。 机器阅读理解技术拥有广阔的应用场景,比如在精准问答上能为用户提供极大的帮助;另外,它也能推动很多 NLP 相关领域的进步,如知识的表示、上下文篇章理解、知识推理等。 阿里巴巴自然语言处理首席科学家司罗表示,未来希望能向终极目标迈进,即机器真正对通用内容「能理解会思考」。据了解,阿里巴巴 iDST NLP 团队在本次 SQuAD 的榜单上获得第一,主要得益于其提出的「基于分层融合注意力机制」的深度神经网络模型。这一模型能够模拟人类在阅读理解中所产生的行为,包括审题、带着问题阅读文章,对文章进行标注等。 这样一来,模型能够在找寻问题与文章关联的同时,借助分层策略,逐步集中注意力,使答案边界清晰;另外,采用「融合方式将全局信息加入注意力机制」,以确保关注点正确。这一技术实际上已被应用于阿里巴巴内部,例如顾客在双十一期间对活动规则进行咨询,阿里小蜜通过机器阅读理解技术,帮助顾客进行相关问题的解答。又如,这一技术能够帮助顾客阅读商品详情页,智能提取信息,为顾客直接解答基础问题等。 大家一起聊一下:大家是否了解NLP,它都有那些主要的应用场景?畅想一下,超越人类的阅读理解AI都能够用在那些方面,有那些应用场景?大家觉得未来除了阅读理解,未来还有那些方面AI会超过人类?大家觉得在阅读理解上超越了人类的AI,是否具有了一定的推理能力?

吴楠.

达摩院黑科技首次亮相,语音让生活变的更简单!

昨天,据媒体报道上海申通地铁集团与阿里巴巴、蚂蚁金服联合宣布,三方达成战略合作,签约仪式上,阿里巴巴iDST最新研发的多模态智能语音交互技术首度惊艳亮相。 传统的自然语音交互主要在家居、办公室等比较安静的环境下工作,但在公众场所嘈杂环境下,业界此前尚无可以达到大规模商用水平的远场语音交互整体解决方案。iDST首次创新研发了基于深度学习的大型麦克风阵列技术,结合深度优化的声学结构和多模态融合技术,能够自动从强干扰背景语音中提取出目标说话人的语音,并实现增强,从而突破了嘈杂干扰环境下远场语音识别的世界性难题。其次市场上主流远场语音交互产品,都需要通过“唤醒词+语音指令”的方式进行交互。而这次iDST通过“语音+视觉”多模态融合技术,能够自动检测用户走近设备的行为,主动发起交互。此外,通过这一技术还实现了免唤醒的语音交互体验,使人-机交互更接近人-人交互的自然和流畅。 下一代人机交互,是达摩院首批公布的重点研究方向之一(其他还包括:量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、芯片技术、传感器技术、嵌入式系统等)。这套多模态智能语音交互解决方案是由数个子系统组成的:1、大麦克风阵列子系统:在硬件上通过数个麦克风组成大阵列,在软件上通过语音信号处理实现高精度声源定位和语音增强;2、计算机视觉子系统:通过光学摄像头,实现人脸,特别是眼睛、嘴唇等的检测、跟踪和动态分析;3、多模态融合子系统:通过语音+视觉融合,实现对目标用户的精确定位及语音提取;4、远场语音识别、语义理解、对话及语音合成子系统:将目标用户经提取、增强后的语音进行识别、理解,产生对话结果,并通过语音合成将机器的反馈输出给用户。 此次的技术成果,将为自然人机交互技术打开一片全新的世界。对于传统的语音交互技术,强噪音的公众场合一直因为其技术难度大而难以实现产品级落地。而未来这项技术进入人们的生活中,普惠大众。 那么大家来聊聊 1. 这次语音用在了地铁售票上,那么还有哪些场景是适合用语音,或者用了语音会更方便?2. 畅想下未来的人机交互会是什么样,或者大家心目中的下一代人机交互是怎样的?

浮生递归

重磅!阿里最高武学机构“达摩院”宣布成立,你期待吗?

阿里巴巴在技术研发上的“大招”今日终于揭晓。在10月11日的2017云栖大会上,阿里巴巴宣布成立探索人类科技未来的实验室“达摩院”,并在三年内集团研发投入1000亿人民币,用于涵盖基础科学和颠覆式技术创新的研究。1000亿!1000亿!1000亿! 在云栖大会及此前与应邀参会的多位全球顶级科学家座谈中,阿里巴巴董事局主席马云对“达摩院”提出三个希望:必须活得比阿里巴巴长,要服务全世界至少20亿人口,必须面向未来、用科技解决未来的问题。 马云认为,阿里巴巴已经不是一家普通的商业公司,我们在这个国家、在这个时代担当有巨大的责任。阿里巴巴必须是一家创造未来的公司,要成为国家和社会乃至于世界创新的发动机。 阿里巴巴未来二十年的目标是打造世界第五大经济体,为世界解决一亿就业机会,服务跨国界的二十亿人,为一千万家企业创造盈利的平台。马云认为,要达到这个目标并服务世界经济,其中有无数的问题需要解决,这正是成立“达摩院”的定位。因此,“达摩院”将遵循“Research for solving the problem with profit and fun(为解决问题研究并带来利润和快乐)”的宗旨。 在传说故事中“达摩院”代表最高武学机构,阿里巴巴也希望以“达摩院”命名的科研实验室能够做到“侠之大者,利国利民”。马云认为“达摩院”不是阿里巴巴的实验室,他说:经济体不是属于阿里巴巴的经济体,实验室也不是属于阿里巴巴的实验室,而是为未来世界经济更加Inclusive、更加Sustainable,更加Happy和Healthy服务。 “达摩院”的阵容可谓“星光熠熠”,首批公布的学术委员会十人中有三位中国两院院士、五位美国科学院院士,包括世界人工智能泰斗Michael I. Jordan、分布式计算大家李凯、人类基因组计划负责人George M. Church等。而参与“达摩院”筹办并在前一天与马云座谈的顾问则包括中国唯一的图灵奖获得者姚期智院士、中国量子力学第一人潘建伟院士、定义了“计算思维”的哥伦比亚大学教授周以真、全球人脸识别技术“开拓者”和“探路者”汤晓鸥教授等十三位顶级科学家。 “达摩院”首批公布的研究(武学?)领域包括:量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、下一代人机交互、芯片技术、传感器技术、嵌入式系统等,涵盖机器智能、智联网、金融科技等多个产业领域。 那么套路来了,啊不,问题来了:你觉得马云的这个设想怎么样? 达摩院的这些武学。。。研究领域是否已经符合你对未来的设想?或者你觉得应该还要再涵盖哪些武学。。。研究领域? 你对阿里的“达摩院”还有什么看法?

邀明

基于对话的人工智能会是下一个风口吗?

自从小米在风口飞起来后,大家都喜欢用“风口”来形容行业大势,上至创业者,下至广场大妈都在津津乐道那句风口论。从苹果发布iPhone开始,移动互联走到今天已经是第10个年头,应用市场已是一篇红海,即使在大众创业的大环境下,真正活下来的企业也只是十之一二,大家不禁纷纷在问:下一个风口在哪里?抓住了风口,等于抓住了成为巨头的最佳机会。 今天我来抛一个问题供大家讨论:基于对话的人工智能会是下一个风口吗? 人工智能这个话题大家并不陌生,在上世纪80年代火过一阵子,IBM的深蓝战胜国际象棋冠军卡斯帕罗夫让曾让其红极一时,人工智能威胁论自那时起在一直未曾停歇,但由于计算能力和数据储备等诸多限制,后来的大多创新和成果都在理论层面,这股热潮也慢慢沉寂。直到最近,人工智能又以AlphaGo战胜围棋冠军李世石为关键时间点,非常强势地重回大家的视线,并再次点燃行业热情,颇有王者归来之意。 在人工智能诸多应用场景中,基于对话的场景一直是各大公司重兵把守的领域 2016年3 月build大会,微软推出CaaP(Conversation as a Platform)战略构想,随后推出聊天机器人框架bot framework,提供其自然语言处理技术帮助开发者快速搭建聊天机器人。虽然早在2014年小冰和小娜就已经问世,但本次大会后两个姐妹花才真正意义上被提升到公司战略级产品地位。 时隔一个月,2016年4月,Facebook召开F8大会,重磅推出messenger机器人开发工具包,,开发者可以基于工具包在messenger中开发互动性更强的对话体验,让用户获得可以购物、订机票等更多功能。 同年10月, Google宣布战略转型,从Mobile first到AI first,并大力下注打造Google Now的AI生态。 此外,竞争者们也纷纷对此下注,包括Line、Kik、Telegram、Slack。 自此,基于对话的人工智能风潮刮遍了美国科技圈。 当然,国内的玩家也从来不甘于寂寞。 2015年百度世界大会上,李彦宏推出机器人度秘,如今陆奇加盟百度,度秘也从团队升级到事业群,在综艺节目里频繁亮相,百度在其上的押注可见一斑。 2016年8月,阿里云云栖大会·北京峰会上阿里云宣布推出人工智能ET(人工智能系统)。基于阿里云计算能力,ET目前已经具备智能语音交互、图像/视频识别、交通预测、情感分析等多项技能。 2016年11月,阿里云发布云计算问答机器人云博士(Dr. Cloud),专注解答用户在使用阿里云服务中遇到的问题:https://drcloud.aliyun.com/ 2017年2月,阿里云上线智能对话分析服务(Smart Conversation Analysis),是企业服务质检、风险监控识别和销售策略优化的利器。目前正在火热公测:https://www.aliyun.com/product/sca 以上时间线,可以看到不论国内国外,行业的领军者都在快速的布局,无论是战略地位还是投入资源,各大巨头也是互不相让。 那么在人工智能已经红得发紫的今天,基于对话的人工智能会是下一个诞生巨头的风口吗? 在基于对话的人工智能领域,你还能想到哪些有趣的应用场景?发挥你的想象,大胆预测吧!